Re: [讨论] 有男生收过骚扰/约砲信吗

楼主: Hokusai (北斋)   2016-06-28 15:46:05
※ 引述《blessthefall (花 请听我说话)》之铭言:
: 板上女版友收到的约砲信
: 来来去去大概就是那个样子八九不离十
: 有没有男版友收过什么很特别/意外/恐怖
: 之类的性骚扰或是约砲信啊
: 求众男神出来分享一下意见
在板上待久,难免会收到一些来信
后来留下深刻印象的,多半来信简短
像是简单一句"Hi,我想认识你",或是"单挑?"
当资讯量太少时,会面临选择上的困难
是要回信? 还是当做没看到?
直接忽略,可能会错失一些什么
往返联络,可能会浪费一些时间
于是我在想,是否有个简便方式,能自动分析来信者背景资料
因为我很懒惰,懒惰的人只想一劳永逸
稍微查阅网络资料后,写了程式自动抓站内文章
站内看板数量太多,资源有限,无法每个看板都追踪
可以先用 google 进阶搜寻,看看哪些看板值得纳入追踪
接着将文章一一写入 SQL 数据库
这样就能简便搜寻 ID、暱称、文章标题、日期、IP、推文数和内文
有了这些资料,终于可以尝试解决几个问题:
1.对方的性别
2.对方的兴趣项目
3.对方和哪些项目最有关联
4.与对方的关联度
5.依照特定项目筛选对象
先从分析文章内容做起,首先进行中文分词,这已经有许多开源专案可用
背后原理主要是基于 TF-IDF 算法提取关键词,并取得每个词出现的频率
对于未登录词,则用 Hidden Markov model(HMM) 和 Viterbi 算法挖掘出来
分词过程将根据词频,查找出最大机率路径,找出基于词频的最大机率分词组合
例如: 西斯板为批踢踢站内讨论与性知识、性爱及相关议题之看板
分词后:
西斯板 为 批踢踢 站内 讨论 与 性知识 、 性爱 及 相关 议题 之 看板
将一篇文章分词后,可以再用 TF-IDF 算法提取出权重高的关键词
例如将某篇文章提出权重最高的前 15 个关键词,得到:
裤子 / 单挑 / 阴蒂 / 内裤 / 变态 / 寄信 / 可以 / 站内信 /
平胸 / 感觉 / XD / 磨破 / 有图 / 哩金 / 跪求 /
现在将对方每一篇文章提出前 15 个关键词,加总并排序,可得到类似这样的结果:
======= 出现次数 =======
寄信 5
男友 5
主人 4
西斯 3
调教 3
=========================
然而,每个关键词在每篇文章出现顺序不一,也就是权重是有差别
如果考量权重,给予加权计算,那关键词权重次数可能是这样:
======= 出现权重 =======
男友 41
寄信 40
调教 28
单挑 28
主人 25
母狗 22
前男友 21
下体 20
=========================
如此一来,只要看对方有哪些高权重关键词,就可以略知兴趣、偏好
有了这份关键词权重表,可以计算自己和对方的关联度
例如比对关键词,一致则加计关联度
实务上,分词系统仍有不完美之处
像可能出现两个关键词分别是 "轮班星人"、"轮班",两者有一定的关联
如果只有关键词完全一致才加计,那会流失一些关联度
因此,当某一个关键词是另一个关键词子集,可以考虑纳入平均化后的关联度
公式为:
关联度(A,B) =
Σ(FreqA + (FreqA * FreqB /100) + ( (FreqA * FreqBofA + FreqBofA)/(100+100) )
但有一些人很少贴文章,甚至没贴过任何文章,此时要如何计算关联度?
可尝试筛选对方推过的所有文章,理论上这些文章会与对方的兴趣较有关联
例如某个人文章数只有 3 篇,计算关联度只有 31.571
但推过的文章有 132 篇,计算关联度,上升到 97.832
试运算关联度:
================= 关联度 =================
100.278 = Hokusai 与 Hokusai 的关联度
079.104 = Hokusai 与 g****** 的关联度
068.253 = Hokusai 与 B****** 的关联度
065.965 = Hokusai 与 L****** 的关联度
055.688 = Hokusai 与 n****** 的关联度
033.252 = Hokusai 与 T****** 的关联度
028.984 = Hokusai 与 s****** 的关联度
027.882 = Hokusai 与 a****** 的关联度
004.734 = Hokusai 与 g****** 的关联度
==========================================
关联度的运用或许可划分为:
a.撷取对方po过的所有文章,"不纳入" 底下推文
计算与自己文章的关联度 = 找出近似文风
假设 文风 = 常见用语 + 独特用语
如果两者常见用语和独特用语都很接近,那可能文章风格接近,甚至可能是同一人
b.撷取对方po过的所有文章,"纳入" 底下推文
计算与自己文章的关联度 = 找出个人特质以及众人评语
例如: 从推文提取出高权重关键词 "好大"、"想揉",那或许发文者有大胸部
或是 "美腿"、"丝袜",那或许发文者有一双美腿
c.撷取对方推过的所有文章,"不纳入" 底下推文
计算与自己文章的关联度 = 找出有兴趣的主题
例如: 对方完全没发过文,但推过许多文章,这些文章主题都跟丝袜有关
那或许对方是个丝袜控
d.撷取对方推过的所有文章,"纳入" 底下推文
计算与自己文章的关联度 = 找出有兴趣的主题以及众人评语
例如: 对方推的文章没什么内容,只有贴图或贴网址
但底下推文高权重关键词是 "想要"、"湿了"
或许这些文章都是高度情欲相关,可彰显出对方的偏好
关键词的另一项运用是计算对方和某些关键词的关联度
例如设定这些有点糟糕的关键字:
"主人,调教,奴,肉棒,穴,绳,鞭,屁股"
选定一些对象后,计算可得:
======= 特定关键词关联度 =======
050.495 = 与 B***** 的关联度
050.477 = 与 L***** 的关联度
050.079 = 与 Hokusai 的关联度
025.395 = 与 a***** 的关联度
012.523 = 与 r***** 的关联度
000.000 = 与 t***** 的关联度
000.000 = 与 g***** 的关联度
================================
如此一来,就能迅速找出所有板友当中,与特定关键词高度关联的人
至于该如何得知对方性别呢?
直觉想法是找出对方所有文章,根据文章内容人工解读
但懒人并不这么做,懒人想要电脑自动根据算法计算出对方性别机率
要计算这样的机率,就得用到词向量
背后数学原理,有兴趣可自行上网找,实作上已经有开源项目,直接使用即可
将西斯板,甚至是全站主要板面所有文章一一分词,放入神经网络模型训练
得到的是许多关键词以及它们的词向量,词向量相近的词可能是近似词,或有关联
例如:
约炮
作者: xximab (优序奇)   2015-06-28 15:46:00
你一定是数学系的
作者: DarkerWu (糊涂)   2016-06-28 15:48:00
这种文会有女乡民寄信给他约炮吗
作者: zxc56021 (游侠小恶魔)   2016-06-28 15:48:00
好复杂OuO
作者: shyyy (可爱又迷人的反派角色)   2016-06-28 15:48:00
妈我在这
作者: EAsoN1123 (eason)   2016-06-28 15:49:00
快推 不然人家因为我看不懂
作者: beware (逼威儿)   2016-06-28 15:49:00
....J3小
作者: hope0955 (约翰蓝侬)   2016-06-28 15:50:00
这不寄不行
作者: bl00190   2016-06-28 15:50:00
看不懂直接按下了
作者: s150695a (我超傲娇加公主病)   2016-06-28 15:50:00
寄了 回我
作者: h3po3 (咩咩)   2016-06-28 15:50:00
*___* 看不懂
作者: steven355291 (steven)   2016-06-28 15:51:00
先推再说
作者: twst900211 (喂我自己袋盐)   2016-06-28 15:51:00
J3
作者: seamask (sea)   2016-06-28 15:52:00
先推,免的被人说不懂
作者: hiphopgad (stoner)   2016-06-28 15:52:00
先推再说
作者: qk025898 (思于)   2016-06-28 15:53:00
看不懂,可是感觉好像很腻害XD
作者: linklink (到时再说)   2016-06-28 15:53:00
感觉好像data mining的东西
作者: kuan50118 (消郎)   2016-06-28 15:53:00
这三小 我眼花了
作者: globekiller (世界越快 心则慢)   2016-06-28 15:54:00
XDDDD
作者: xz35s8pq   2016-06-28 15:54:00
666666666666666666666666
作者: aarrcc (iamwhoiam)   2016-06-28 15:56:00
快推,免得人家说我不懂
作者: et310   2016-06-28 15:56:00
我看了三小
作者: ygopany (尼德桌游屋)   2016-06-28 15:57:00
不要骗我们乡下人,虽然我书读的少但是经验却不少(自肥
作者: walhalla (walhalla)   2016-06-28 15:58:00
靠夭 Data Mining是让你这样用的吗? XDDDD
作者: n98802001 (小小賓)   2016-06-28 15:58:00
先推 不然人家以为我看不懂
作者: botno1 (QQ FAN)   2016-06-28 15:58:00
太扯
作者: rokuchan17 (奈梁朝伟)   2016-06-28 15:59:00
看完都想寄信讨论算法了
作者: impnf (pnf)   2016-06-28 16:02:00
所以我还是看不懂啊
作者: RHao (偶4路人)   2016-06-28 16:02:00
专业
作者: goal770711 (Chuck)   2016-06-28 16:03:00
wtf
作者: panypany (比蘑菇闪耀的海带)   2016-06-28 16:03:00
我到底看了三小
作者: y0928731422   2016-06-28 16:04:00
作者: miaul0210 (喵)   2016-06-28 16:05:00
西斯版最专业的文章
作者: MiniCaT20 (宝宝)   2016-06-28 16:05:00
@______@
作者: iiiluvu (hasehare)   2016-06-28 16:07:00
分析王是你XD
作者: coaka (coaka)   2016-06-28 16:10:00
嗯嗯我也是这样想的
作者: shiala0322   2016-06-28 16:10:00
要推,免得被人说看不懂
作者: shawnxxx (阿模)   2016-06-28 16:10:00
嗯嗯,跟我想到的差不多
作者: alexaregod (硬是要推!)   2016-06-28 16:12:00
嗯嗯,你跟我意见不谋而合
作者: Ucc1998 (蘑菇制片)   2016-06-28 16:13:00
求程式(唉?
作者: shawn52030 (喂虾王)   2016-06-28 16:14:00
赶快推
作者: flame233 (爸爸捕鱼去)   2016-06-28 16:14:00
快推 不然人家以为我看不懂
作者: p052755575 (DaiChung)   2016-06-28 16:15:00
文字探勘相关技术啦
作者: mtfk5566 (永远珍惜56帐号)   2016-06-28 16:16:00
字太多懒得看end
作者: pilibala (花生省魔术)   2016-06-28 16:17:00
朝圣
作者: Bdssss (桃花缺缺洨龙妹)   2016-06-28 16:18:00
上班看报表已经很累了r
作者: Htyes2040120 (Htyes)   2016-06-28 16:19:00
不推不行
作者: syutian (ED)   2016-06-28 16:21:00
好我寄
作者: guardian128 (伊莉莎白欧森是我老婆)   2016-06-28 16:22:00
推 就是这样嘛
作者: sky929916 (安安你好谢谢掰掰)   2016-06-28 16:22:00
靠背,连站内信你都要分析
作者: fireturtle (火焰龟仔)   2016-06-28 16:24:00
跟我想的一样 推
作者: call5566me (软男抠)   2016-06-28 16:24:00
你演算系??
作者: aa846301 (Dino)   2016-06-28 16:25:00
尊称一声分享王
作者: Busdo (DoDo)   2016-06-28 16:28:00
作者: luxia (阿紎)   2016-06-28 16:29:00
你真的写出来了吗?我想玩玩看 www
作者: super1315566 (台湾中国,一边一国)   2016-06-28 16:29:00
这个太猛了吧
作者: cvoa1026 (猫儿小朵)   2016-06-28 16:31:00
不推人家会以为我不懂 快推!
作者: liarstar (新竹-温生蠔)   2016-06-28 16:31:00
靠,我想寄信给你了~~~但,我是男的~~~
作者: iammiss (未完的承诺)   2016-06-28 16:32:00
就别再寄信骚扰了吧,都变这样了,冲着我来吧。
作者: wigping (斯文败坏)   2016-06-28 16:33:00
太专业了,可以在床上教我吗
作者: mig (X_X)   2016-06-28 16:34:00
Markov耶 XD
作者: needshe520 (小明无所不在)   2016-06-28 16:35:00
什么鬼东西啦!
作者: ctx1000 (时を刻む呗)   2016-06-28 16:39:00
.....
作者: Aidrux (保境安民)   2016-06-28 16:40:00
作者: aa121283 (毛)   2016-06-28 16:40:00
人才!
作者: blueineye (踮脚转圈圈)   2016-06-28 16:41:00
你淫了
作者: aids893001 (Ayaka4U)   2016-06-28 16:41:00
你计算系??
作者: nedekwn (top)   2016-06-28 16:45:00
干 你好有才
作者: biaw (blue note)   2016-06-28 16:48:00
资讯科学XD
作者: smiletrain (三分甜)   2016-06-28 16:48:00
将资讯的天赋带到西斯版
作者: flashseal (十字路口的美少男要爆(b))   2016-06-28 16:49:00
所以我要约谁才行?
作者: winnie730 (妹子)   2016-06-28 16:53:00
不要欺负我书读得少
作者: aegis78945 (阿维)   2016-06-28 16:53:00
想学惹
作者: wixter (hmm)   2016-06-28 16:53:00
你妈知道你把data mining用在这吗?
作者: j7862278622 (瞎子看到哑巴说瘸子在跑)   2016-06-28 16:53:00
...
作者: kc (跌 倒 了)   2016-06-28 16:55:00
吃药好吗,现在吃还有机会恢复,乖
作者: BDSMan (尊重与沟通)   2016-06-28 16:56:00
果然是高手北斋
作者: waitforit (等等)   2016-06-28 16:57:00
电脑分析~百分之一百是神人~娘子快来一起看上帝
作者: HOU7513   2016-06-28 16:58:00
好专业
作者: DebbieLu0926 (轰轰烈烈把握青春年华)   2016-06-28 17:00:00
专业文
作者: shan1126 (shan1126)   2016-06-28 17:01:00
统计系?
作者: w9 (Good Day)   2016-06-28 17:04:00
...
作者: KG8807037 (OA)   2016-06-28 17:04:00
你在干嘛...
作者: nxdwx (尼克斯)   2016-06-28 17:05:00
想要再约了厚
作者: colaaa (手枪魔)   2016-06-28 17:09:00
作者: ich51 (花花世界)   2016-06-28 17:11:00
约个炮有这么难吗
作者: babycat170 (周慧豹)   2016-06-28 17:14:00
high客4ni
作者: lawhcu (修)   2016-06-28 17:15:00
作者: smin7073 (老M)   2016-06-28 17:15:00
你公式的设定值有误
作者: KageZ (尼可拉斯)   2016-06-28 17:18:00
快推,不然别人以为我看不懂
作者: bonchou (我没有妹妹)   2016-06-28 17:19:00
page down不停啊@@"
作者: foreskin (西子湾的绅士)   2016-06-28 17:20:00
我一直有个梦想用machine learning来作交友app XD
作者: yasen0220 (大森)   2016-06-28 17:22:00
这有市场啊, 这不是撮合打砲平台吗, 好想法
作者: luis0624 (小柏)   2016-06-28 17:23:00
我走错版了 对不起
作者: mooisgood819 (小沐)   2016-06-28 17:23:00
不是啊 你根本在乱讲吧XD
作者: shchin   2016-06-28 17:30:00
你赢了 数据分析超有趣der
作者: jason70387 (凸=_=凸)   2016-06-28 17:32:00
有点神
作者: puresugar (红茶拿铁)   2016-06-28 17:32:00
神串留名
作者: schumi7401 (死蚊子给我出来)   2016-06-28 17:37:00
我服你
作者: lalala129 (啦啦啦)   2016-06-28 17:37:00
而且没有人约你
作者: POID (路标)   2016-06-28 17:42:00
只能推了
作者: bbelief (四月一日)   2016-06-28 17:44:00
边计算边跟左手约会,看着数据高潮
作者: JunAustin   2016-06-28 17:46:00
可以公布被寄了几封信吗
作者: meteor724   2016-06-28 17:48:00
有神快败
作者: Dix123 (小蔡)   2016-06-28 17:53:00
WOW
作者: sky45132008 (友情<爱情?)   2016-06-28 17:58:00
看到一半就放空了......
作者: GIE13 (GIE)   2016-06-28 17:58:00
快推 免得被发现看不懂
作者: ivor1212 (bobo)   2016-06-28 17:58:00
妈我在这
作者: ck321 (ck)   2016-06-28 17:59:00
能不能公布一下约谁成功率比较高
作者: arthur641987 (白化松鼠)   2016-06-28 18:00:00
原来是数学啊 我还以为是西斯呢
作者: boringZombie (千)   2016-06-28 18:03:00
太专业了XDD
作者: bird1140 (牡羊座的鳥兒)   2016-06-28 18:05:00
我看了什么XD
作者: fireguard119 (angelsbaseballwin)   2016-06-28 18:05:00
这三小 XD有新进信件哦
作者: Grady1979 (Grady)   2016-06-28 18:07:00
关连度那个公式看起来有个变量没有考虑到 你再想一下
作者: mikayu (mika)   2016-06-28 18:07:00
想到高统的动差母涵数
作者: zxc0258741 (zz)   2016-06-28 18:07:00
没想过会在西斯看到 text mining …
作者: transforman   2016-06-28 18:14:00
你是做文字处理的齁XDDDDD
作者: winken2004 (新竹肥宅)   2016-06-28 18:16:00
跪求开源
作者: wsx12358   2016-06-28 18:16:00
虽然不懂 但看起来蛮厉害的
作者: xpqx (暖喃)   2016-06-28 18:16:00
恩 看不董
作者: summersky20 (科科)   2016-06-28 18:17:00
专业
作者: slender0103 (slen_yan)   2016-06-28 18:18:00
全部看完还是不懂...
作者: coldlee (coldlee)   2016-06-28 18:19:00
XDDDDDDDDDDDDDDDDD
作者: hateself (D.Left)   2016-06-28 18:19:00
约炮这么累干嘛
作者: joe6031035 (joe6031035)   2016-06-28 18:20:00
推 但是真的看不懂
作者: ohiro (小达人)   2016-06-28 18:20:00
其实我原本也想做这个XD 小弟我也做数据的
作者: wuming2 (炸鸡腿!)   2016-06-28 18:21:00
文组哈哈
作者: howshaw (俺只是路过的☂)   2016-06-28 18:22:00
......
作者: wufish (wufish)   2016-06-28 18:22:00
XDD
作者: shang211251 (shang211251)   2016-06-28 18:24:00
以为走错版
作者: haner1725 (肥宅少女)   2016-06-28 18:24:00
看不懂 辛苦了
作者: yahyahyaa (冬天耶)   2016-06-28 18:27:00
统计是噩梦
作者: house09gbk (兔子)   2016-06-28 18:27:00
看到高潮了
作者: cary3410 (CarRyYoUAlL)   2016-06-28 18:28:00
....我输了
作者: blackbottle (苏格兰威士忌)   2016-06-28 18:30:00
干一定要推的啦 太专业惹
作者: rubykry (山兽神鹿比)   2016-06-28 18:32:00
干 想寄
作者: white07 (白色七号)   2016-06-28 18:34:00
来人啊 这里有个疑似约不到而太闲崩溃的工程师XDDDDDD
作者: steven5l5l (不招)   2016-06-28 18:36:00
快推 不然别人会以为我不懂
作者: snoopy8562 (ㄌㄐ)   2016-06-28 18:38:00
你为什么要浪费才能....
作者: TokyoKind (乱枪打鸟的渣男)   2016-06-28 18:39:00
恩恩 (所以有人可以简单解释一下吗...?)
作者: rickyhoney (你想要过怎样的生活)   2016-06-28 18:41:00
我还以为是论文
作者: jimmywhy2001 (JRyo)   2016-06-28 18:41:00
想学爬虫 欸 这不是软工版
作者: jmeb0123 (lin~)   2016-06-28 18:43:00
真的看不懂XD
作者: hotblood0303 (MYTRIGI)   2016-06-28 18:44:00
妈 不推以为我看不懂勒
作者: laco680914 (曾小闳~0986-080914)   2016-06-28 18:45:00
专业文,只能推了!
作者: zoids2504 (阿成成)   2016-06-28 18:49:00
超专业啊,高手在民间
作者: BaRanKa (Dummy system on)   2016-06-28 18:51:00
期末考考完了吗
作者: is1101 (is1101)   2016-06-28 18:57:00
狂啊
作者: edward4904 (Rynn)   2016-06-28 18:58:00
干 你资工系的xDDD????
作者: shoeiliu (夜-雨-声-烦)   2016-06-28 18:58:00
太屌了吧!!!!!
作者: YXH01 (台中陈灌稀)   2016-06-28 19:00:00
作者: jarodchen   2016-06-28 19:01:00
很强大的演算!但是,就算知道了还不一定会成功
作者: woogee (woogee)   2016-06-28 19:02:00
红明显,男女判别部分用Bayes比较准(等等补推
作者: xoyster (若隐若现)   2016-06-28 19:03:00
这啥
作者: woogee (woogee)   2016-06-28 19:04:00
补推
作者: bll135 (洪大少)   2016-06-28 19:04:00
我妈问我为什么跪着看电脑
作者: air0909 (该走了由~~~)   2016-06-28 19:09:00
三小啦!很了不起喔,这篇到底在说什么。翻译一下好吗
作者: sexyerics (OmMaNiPadMeHum)   2016-06-28 19:09:00
你西施系?
作者: ggbgbgbg (GG惹)   2016-06-28 19:26:00
这...好吧 推
作者: easy02052001 (Adonis)   2016-06-28 19:27:00
推看无
作者: joy211038 (血凋残枫)   2016-06-28 19:30:00
别以为写得很复杂让人看不懂我就会推
作者: MorningWood (晨勃)   2016-06-28 19:31:00
讲中文?
作者: jacky0619 (olulu)   2016-06-28 19:32:00
先推,然后说:原来是这样的啊
作者: acde611 (闻腋青年)   2016-06-28 19:34:00
能讲重点吗
作者: timtams (Yum..Yum...)   2016-06-28 19:34:00
看了这篇,超想认识原po的!
作者: chang505 (眼线)   2016-06-28 19:37:00
分词切词,你要开始自动tag了吗
作者: Vincredible (身强体壮选我选我)   2016-06-28 19:40:00
@@ 沙小阿
作者: james5271 (日光短短)   2016-06-28 19:40:00
西斯大数据时代
作者: leokind (打字超慢的啦)   2016-06-28 19:47:00
太厉害了
作者: s8681477 (暴风雨中的风筝)   2016-06-28 19:47:00
这...
作者: icexfox (东玉景)   2016-06-28 19:47:00
所以这到底是什么
作者: willy384   2016-06-28 19:49:00
看不是很懂推
作者: rojin (rojin)   2016-06-28 19:56:00
看完一篇研究
作者: a1982213 (Hasta la vesta!)   2016-06-28 20:01:00
懒人包:原PO用了些方法让电脑根据关键字来找适合跟自己打炮的人
作者: porterlevis (jeff)   2016-06-28 20:06:00
快推 别让人发现我看不懂
作者: sNiWnTi (NWT)   2016-06-28 20:09:00
数据系
作者: Sioli (客人)   2016-06-28 20:09:00
....强
作者: tn00710191 (Steve)   2016-06-28 20:15:00
适合作研究的人才..
作者: s0920142 (柳意)   2016-06-28 20:19:00
呃…
作者: mchan1217 (欸姆)   2016-06-28 20:20:00
神串留名
作者: b1izzard2000 (OGC)   2016-06-28 20:22:00
太专业
作者: skypatrick (HCChang)   2016-06-28 20:23:00
先跪了
作者: yurihong1127 (讨厌喜欢你)   2016-06-28 20:23:00
好像很厉害…
作者: disp999 (disp999)   2016-06-28 20:25:00
单挑
作者: Failiggy (港式烧炭自杀)   2016-06-28 20:26:00
zzz 这种文留着 茶鱼文砍光光 板皇好棒棒
作者: taneshatw (QAQ)   2016-06-28 20:29:00
我跪下了
作者: kent0925 (走吧!去旅行)   2016-06-28 20:33:00
翻译
作者: lilithna (Demoral)   2016-06-28 20:36:00
看不懂QQ
作者: moroc (oil)   2016-06-28 20:36:00
北斋大还是一样专业XDDD
作者: chiungonni (欧逆)   2016-06-28 20:37:00
好像很厉害,数学差直接END
作者: vgil (巴吉)   2016-06-28 20:39:00
快推 不然别人以为我看不懂!
作者: yamadameru (meru)   2016-06-28 20:41:00
快推,免得被人说不懂
作者: assblack (assblack)   2016-06-28 20:46:00
看不懂反正推就对了
作者: nenohelios (neno)   2016-06-28 20:47:00
西斯大数据XDD
作者: pingzzz (凡凡)   2016-06-28 20:48:00
意图使人手痒把这东西写出来!!!
作者: aghk56 (狗狗金)   2016-06-28 20:50:00
太神拉
作者: adidas168 (平凡过一生)   2016-06-28 20:54:00
快推,免的有人说我看不懂
作者: henry1326   2016-06-28 20:55:00
翻译巨乳呢?
作者: taleb (tablet)   2016-06-28 20:55:00
居然可以套用算法,我跪了~~~
作者: chiangmh (chiangmh)   2016-06-28 20:55:00
sex?
作者: osk2 (.)(.)   2016-06-28 20:57:00
靠腰太神啦
作者: newtonyd (newtonyd)   2016-06-28 20:57:00
感谢分享 收获良多
作者: megxz (黑色疾风)   2016-06-28 21:00:00
wow
作者: vwutopia (wei)   2016-06-28 21:04:00
我直接end了
作者: Fernando8 (一个不一样的人生)   2016-06-28 21:07:00
可以写一支执行档吗?
作者: notbeloser (澄)   2016-06-28 21:18:00
谁要把这篇转softjob XD
作者: loagg520 (豪情似水)   2016-06-28 21:19:00
先推(我他妈完全看不懂
作者: coolcjy (ㄚ裕)   2016-06-28 21:20:00
J 3 small
作者: v2ssili (WTFFFFF)   2016-06-28 21:25:00
太神啦XDDDDDDDD
作者: cas6622 (H)   2016-06-28 21:25:00
三小
作者: smallfu27 (潜水夫)   2016-06-28 21:36:00
我看了什么
作者: CB820530 (昕)   2016-06-28 21:36:00
天啊! 中毒了
作者: MashiroX421 (三峰真白)   2016-06-28 21:39:00
赞!做这种研究比学校的作业有趣太多了XD
作者: goipait (GoGo)   2016-06-28 21:42:00
弄个执行档测试看看
作者: DKnex (DK)   2016-06-28 21:45:00
text mining给你这样用……
作者: wie10112 (XXXX战紧茎肛狼)   2016-06-28 21:47:00
我看不懂QQ
作者: wul4123 (mathmax)   2016-06-28 21:48:00
靠 我最近要研究这个耶 大哥你太神啦
作者: bbb21300 (TnT)   2016-06-28 21:50:00
太神拉
作者: LiaMeow (梁跳跳)   2016-06-28 21:51:00
神串留名 妈我在这
作者: xxctsd (喔.....也还好)   2016-06-28 21:55:00
......算法算你狠,但你还是算不出找到炮友的机率
作者: WhiteQ (对自己诚实。)   2016-06-28 21:56:00
看完后有如上数学课时般的好困@_@
作者: FangCC (希望)   2016-06-28 21:57:00
太深奥了!!!
作者: aeei329 (你不懂)   2016-06-28 21:57:00
哈哈哈太厉害了
作者: trusti (sdf)   2016-06-28 21:57:00
扯那么多干嘛(红的明鲜)。单挑啦!
作者: ne579 (ne579)   2016-06-28 21:58:00
糟糕 看不懂
作者: THBouz (Bouz)   2016-06-28 22:00:00
我看了什么................
作者: laugh123 (laugh123)   2016-06-28 22:00:00
认真的太可爱了吧哈哈哈
作者: softandwet   2016-06-28 22:01:00
站内信程式拜托
作者: oppaa   2016-06-28 22:03:00
干你在共三小
作者: lookfor36   2016-06-28 22:06:00
好特别!吓到了!!充满好奇哈哈哈
作者: blairccc (NiNi)   2016-06-28 22:07:00
好我了解了
作者: mlii807 (跳跳)   2016-06-28 22:08:00
有神快拜
作者: RolfP (洛夫)   2016-06-28 22:09:00
猛!!!!!
作者: leon0310 (咦)   2016-06-28 22:12:00
有神快拜!!!!!!!!
作者: a42006310 (心如沧海)   2016-06-28 22:14:00
J3
作者: NiKangKangNi (逆抗抗逆)   2016-06-28 22:20:00
干太神啦我可以拿来当专题吗 帮你实作!!!!!!!!
作者: dvstom (KAI)   2016-06-28 22:22:00
快推啊啊啊!
作者: NiceGuyOrz   2016-06-28 22:23:00
.......
作者: Saikiss (劼儿)   2016-06-28 22:23:00
他妈的好想学
作者: frosttip (dia)   2016-06-28 22:23:00
你妹 灰色理论 向量分析 类神经全用上了 要不要这么凶残啦
作者: a31517664 (a3)   2016-06-28 22:24:00
太威了 不推不行
作者: alone0330 (NN)   2016-06-28 22:26:00
朝圣推
作者: changmada (马大)   2016-06-28 22:27:00
alpha-sex
作者: CIIIO (郭+)   2016-06-28 22:33:00
。。你赢了 我有空改天再看
作者: findhs2006 (科科)   2016-06-28 22:35:00
这...赶快推 不然别人以为我看不懂OTZ
作者: hypurd (flagellum)   2016-06-28 22:35:00
大西斯时代
作者: naywei (乃威)   2016-06-28 22:36:00
作者: sandy0925 (瑄瑄)   2016-06-28 22:37:00
快推 不然别人以为我看不懂
作者: PanNaJou   2016-06-28 22:40:00
谁说西施没人才
作者: doggycxj (EDFCBA)   2016-06-28 22:40:00
好像有点厉害
作者: sora5260 (火龙果便便)   2016-06-28 22:43:00
天哪....
作者: suiminkusuri (姜烧猪肉我的最爱)   2016-06-28 22:44:00
j3小XDDDDD
作者: seiechijoe (深山巨兽杀人熊)   2016-06-28 22:45:00
你不要那么专业好不好
作者: spvgf   2016-06-28 22:49:00
我记得我以前就看过有人分享过这种用ptt的推文 分析数据的文章了好像是分析五楼最常出现的推文https://www.ptt.cc/bbs/sex/M.1434427865.A.8E6.html
作者: tksq (3ya)   2016-06-28 22:52:00
跟我想的差不多
作者: spvgf   2016-06-28 22:53:00
妳可以去跟这篇文章的作者约在床切磋(ㄉㄚˇㄆㄠˋ)
作者: Onlyumei (雨濛濛)   2016-06-28 23:01:00
…等到我学会的那天可能也用不到了
作者: coolericliu (酷酷宏)   2016-06-28 23:01:00
数学系是你
作者: kkjjkkjj (我是本尊,其他都是伪物)   2016-06-28 23:13:00
资管系?
作者: sasafan77 (妖妖)   2016-06-28 23:14:00
我被催眠了
作者: loloman (吃饱的感觉真好)   2016-06-28 23:17:00
论文有这么认真写吗?
作者: HanMo (HanMo)   2016-06-28 23:18:00
会不会太专业了你
作者: lostzoe (小心不小心)   2016-06-28 23:19:00
太专业 好难懂
作者: DrWm (Dr西瓜)   2016-06-28 23:24:00
不推人家以为我看不懂
作者: sallyhelp (Judy)   2016-06-28 23:26:00
嗯嗯 我算出来的结论跟你一样
作者: all02608 (嵐)   2016-06-28 23:31:00
这篇的程式写的太猛了...c++初学者已跪...orz....
作者: RockJason (大盗韩不助)   2016-06-28 23:32:00
我本来也要po的
作者: ptthao (优文保证)   2016-06-28 23:33:00
...
作者: petereva   2016-06-28 23:35:00
大数据的概念在这出现!太专业了
作者: scottshe (史考特-许)   2016-06-28 23:37:00
应数的厚…
作者: bluefancy (脩)   2016-06-28 23:44:00
把程式分享ㄚ
作者: qwer35736 (翔翔)   2016-06-28 23:49:00
神串留名
作者: bio1023   2016-06-28 23:51:00
作者: j86968696n (小蝦)   2016-06-28 23:54:00
作者: wei771988 (HAHA)   2016-06-28 23:58:00
快推~不然人家以为我看不懂
作者: johnyang (Saico)   2016-06-29 00:01:00
作者: aimjvc (allen)   2016-06-29 00:04:00
神人
作者: sakala (Akou)   2016-06-29 00:04:00
你数学系?
作者: JerryYan (阎先生你好)   2016-06-29 00:10:00
娘子 跟牛魔王出来看上帝
作者: fritrescond (想吃鱼)   2016-06-29 00:11:00
妳淫了
作者: qwejoezxc33   2016-06-29 00:17:00
讲重点 你这样做报告绝对被打脸
作者: waterface (waterface)   2016-06-29 00:18:00
只能推了
作者: tohelp (youj)   2016-06-29 00:25:00
工啥小
作者: oldman11742 (新竹郑姓理由伯)   2016-06-29 00:33:00
太酷了 求基底算法
作者: ldeathkiller (之之)   2016-06-29 00:37:00
data mining......
作者: nobody741 (KOKJO)   2016-06-29 00:38:00
结果连个砲友也没出现...回收之歌...帮QQ?
作者: jengmei (郑小妹)   2016-06-29 00:42:00
干 三小
作者: AEScabriolet (Seth)   2016-06-29 00:45:00
直接End推
作者: weichilin (魏麒麟)   2016-06-29 00:47:00
快推以免被发现看不懂
作者: penolove (丑兽的女朋友)   2016-06-29 00:54:00
有word2vector给推
作者: cindyhey (BB)   2016-06-29 00:55:00
一定要推不然人家以为我看不懂
作者: jig4ejiy7 (三种人生)   2016-06-29 00:56:00
好猛XDD
作者: loveonly620 (cici)   2016-06-29 00:57:00
看不懂
作者: mimi95742 (mimi)   2016-06-29 01:01:00
求code
作者: ligacul (真假仙)   2016-06-29 01:04:00
头嘘!!你算式有误害我一直找到男的...还是我要找男的?
作者: efs92e01 (白色羽仔)   2016-06-29 01:06:00
我到底看了什么东西啊!
作者: WarGreymon (苗栗暴龙兽)   2016-06-29 01:08:00
text-mining on 西斯版! 我的论文方向找到了!
作者: chouanhsu (ALSniper)   2016-06-29 01:09:00
靠…看不懂
作者: maxmessi (maxmaxmessi)   2016-06-29 01:10:00
猛!!
作者: yozhen ( )   2016-06-29 01:10:00
专业推
作者: jeff803xx (jeff803xx)   2016-06-29 01:10:00
想约就必看 看完都消火了XD
作者: happyary (开心就好)   2016-06-29 01:18:00
…什么鬼啦
作者: Elfiend (小孩)   2016-06-29 01:19:00
只能跟你说:安安约吗?
作者: yu08 (Sakana)   2016-06-29 01:23:00
红明显 西斯点!西斯点!西斯点!
作者: ctchen   2016-06-29 01:24:00
看了什么
作者: john371911 (醬廖)   2016-06-29 01:28:00
很有趣。
作者: vikingman (圍巾人)   2016-06-29 01:29:00
作者: ko27tye (好滋好滋)   2016-06-29 01:43:00
摸c++也是能摸到c罩杯的!!
作者: chyayi (今乃日无歹事)   2016-06-29 01:48:00
看不懂先推
作者: eno03 (健康很重要)   2016-06-29 01:50:00
这一篇只值15p币
作者: cattoy (喵,玩具。)   2016-06-29 01:55:00
作者: gary62107 (Felix)   2016-06-29 01:58:00
居然拿人名丢word2vec XDD
作者: solu731 (^q^)   2016-06-29 01:58:00
您……………
作者: almond77 (杏仁)   2016-06-29 02:17:00
推完还是看不懂QQ
作者: zqcockroach (品客)   2016-06-29 02:21:00
干超狂
作者: jasonhot (So Quiet)   2016-06-29 02:24:00
我跪了
作者: cagedBirds (囚鳥)   2016-06-29 02:52:00
推文字探勘
作者: ch35678   2016-06-29 02:55:00
可以写成论文xdd
作者: Lume0117 (曼特宁..)   2016-06-29 03:10:00
我自己对号入座了XDD
作者: blue8d83n (Formosa)   2016-06-29 03:10:00
真的猛
作者: iris052735 (喵Yu)   2016-06-29 03:44:00
有人看的懂吗?
作者: ev7e (嗜肉糨糊脑ev7)   2016-06-29 03:47:00
不能不推,这我有点想寄信,楼下帮
作者: Lume0117 (曼特宁..)   2016-06-29 04:10:00
帮推CD ing…
作者: syxuan (肥宅是一种态度)   2016-06-29 04:26:00
推machine learning
作者: lvoe1014 (痴宝)   2016-06-29 05:27:00
我到底看了什么
作者: sam39192 (samuel)   2016-06-29 05:55:00
我到底看了3小
作者: tim312tim (jacky)   2016-06-29 06:00:00
看不懂,但想推! 是催眠吗?
作者: biostat02 (大碍贫道)   2016-06-29 06:04:00
讲那么多重点是有没有open souce喇~
作者: hayashi0728 (Eason)   2016-06-29 06:30:00
我到底看了什么
作者: evillemon (Push)   2016-06-29 06:56:00
公三小XDDD
作者: machades (machades)   2016-06-29 07:00:00
很专业
作者: mikipu1220 (miki)   2016-06-29 08:04:00
分类系
作者: tchen4 (tchen4)   2016-06-29 08:19:00
这三小
作者: bananayen (Jeff)   2016-06-29 08:20:00
作者: chentzu2   2016-06-29 08:22:00
好厉害
作者: JoSue (旧叔)   2016-06-29 08:43:00
XDDDDD学有所用不错不错
作者: BoatLord (船老大)   2016-06-29 08:46:00
你够了
作者: free80512 (四两拨千斤)   2016-06-29 08:46:00
已跪
作者: nswallen (新手中路)   2016-06-29 08:46:00
我书读的少 你别骗我
作者: welfare (胖子舜)   2016-06-29 08:58:00
快推,免得人家说我不懂
作者: RitaMax (猫下去)   2016-06-29 09:49:00
作者: hunter1204 (努力充实自己)   2016-06-29 09:50:00
西斯首推就给你了,有神快拜....
作者: kan8634 (毛仔)   2016-06-29 09:56:00
推了!!!
作者: KKlin813 (木木崎几城)   2016-06-29 10:17:00
What the fox say?
作者: valentinos (汤匙oo)   2016-06-29 10:48:00
推一下 不然被别人说不懂
作者: alex01 (爱 立刻 湿)   2016-06-29 10:57:00
大神...给推
作者: ek0424   2016-06-29 11:09:00
教授表示:怎么验证?XD
作者: chuan15 (阿川)   2016-06-29 11:23:00
所以结论?
作者: Everyeeeee (yee起来骑猪)   2016-06-29 11:28:00
不明觉厉
作者: fate201 (Licht)   2016-06-29 12:12:00
这 这可以做专题了吧XD
作者: questioner (問題兒童)   2016-06-29 12:14:00
靠,记者快来抄这篇 阿算了你们记者也看不懂
作者: sd79307 (樂絲特)   2016-06-29 12:14:00
干这是文字探勘+网络探勘阿 根本是学术论文
作者: cliff5345179 (房客335)   2016-06-29 12:31:00
写好放git给广大的乡民测试RR
作者: anoir (没有鸡鸡的阿诺)   2016-06-29 12:31:00
调研系XDXDXD
作者: a955061 (蟑螂)   2016-06-29 12:32:00
推专业
作者: kids1991 (bon)   2016-06-29 12:32:00
靠,专业
作者: hadumdum (umumumu)   2016-06-29 12:37:00
推推
作者: gtr8188 (笨蛋与傻瓜)   2016-06-29 12:40:00
text mining 这样用真的太屌了XDDDDDDDD
作者: mitdoh (luckyenoughtoday)   2016-06-29 13:02:00
可以报名测试人员吗?
作者: snowflaker (雪花)   2016-06-29 13:03:00
这是论文发表了吧
作者: ssun302231 (平常心)   2016-06-29 13:04:00
所以我说 那个程式呢?
作者: s562562 (yana)   2016-06-29 13:07:00
(・o・) 虽然看不懂
作者: bomda (蹦大)   2016-06-29 13:12:00
XD完全看不懂啦
作者: yuiscarlet   2016-06-29 13:15:00
推文字探勘 但是这样是打不到砲的喔
作者: azhu (嘓嘓)   2016-06-29 13:28:00
所以到底约到了没?
作者: liuz9898   2016-06-29 13:38:00
先推 免得被说不懂XD
作者: mister12 (zzzz)   2016-06-29 13:43:00
这是数位语音final project吗...
作者: Robert28 (Albert)   2016-06-29 13:48:00
查我查我
作者: ga021595350 (牙)   2016-06-29 14:56:00
洗咧工撒小
作者: niko1208 (yesorno)   2016-06-29 15:01:00
不推怕被别人笑看不懂
作者: areUretarded (heisenberg)   2016-06-29 15:08:00
我想看SVM版本
作者: stoneok93 (Stone)   2016-06-29 15:41:00
作者: jo66 (唱歌土拨鼠)   2016-06-29 15:53:00
看不懂 反正推就对了
作者: leograss (耶诞夜草男)   2016-06-29 15:58:00
WTF
作者: jazzcai (如果有一天)   2016-06-29 17:25:00
干好猛啊
作者: xsaran7 (帅啊…老皮)   2016-06-29 17:29:00
神人………太猛了
作者: mess (妹死)   2016-06-29 17:46:00
........................................................
作者: lordmi (星宿喵)   2016-06-29 19:42:00
管院毕业特来瞻仰一下,本科系不推不行w
作者: trfee1 (一个人爱着一个人)   2016-06-29 19:46:00
我到底看了啥
作者: HsiangEnHsu (SeanHsu)   2016-06-29 20:43:00
妈我在这
作者: XN04 (喝醉酒就想拉屎)   2016-06-29 22:17:00
收到一堆阿
作者: Nomoresin (星羽)   2016-06-29 22:19:00
这什么鬼......XDDDDDDDDDDD
作者: wayland (電波鴕鳥)   2016-06-29 22:22:00
大数据时代来喽~不过你到底是想要干嘛啊
作者: ritaatirrita (小宁宝宝)   2016-06-29 22:34:00
阿干 我论文也是研究词频的 既视感好重(晕
作者: jcyjcybenz (WalfDog)   2016-06-29 23:13:00
分享王
作者: pirates011 (Panda)   2016-06-29 23:18:00
所以.....这个工具可以丢出来给大家一起用吗
作者: jrmeer (psypsy)   2016-06-30 00:38:00
这才是big data
作者: nbanba100 (咖啡)   2016-06-30 01:42:00
约个炮,这么搞刚
作者: ZachChenGG (ZachChenGG)   2016-06-30 01:49:00
太神啦
作者: Comebuy (三分鐘熱度)   2016-06-30 02:12:00
87
作者: ClareJ   2016-06-30 02:52:00
这可以放进参考文献吗哈哈
作者: BBCradio (BBC News)   2016-06-30 03:29:00
坦白说,看不懂哩勒工虾米,还是推
作者: a2470abc (D.F.)   2016-06-30 03:38:00
数学建模的典范之一啊啊啊阿 有神快拜 神串留名
作者: q70412 (一二三站着穿)   2016-06-30 03:40:00
怎么把machine learning用在这里XDD
作者: orzman (工作咧)   2016-06-30 04:47:00
你到底在专业个屁!
作者: s992419   2016-06-30 09:39:00
作者: jack51102 (开什么玩笑)   2016-06-30 10:29:00
推一个
作者: arufimi (Adolcrs)   2016-06-30 11:53:00
太强大了...
作者: squalljack (图像妹图不代表我是女的)   2016-06-30 11:57:00
虽然看起来很厉害 你应该把模型去做更有意义的事
作者: yu89077   2016-06-30 13:00:00
有没有人可以翻译一下XD
作者: imacexd (IMACE)   2016-06-30 14:10:00
太神啦~
作者: Only0330 (何惟独)   2016-06-30 16:03:00
杀小 看不懂
作者: FTING (枫亭)   2016-06-30 17:20:00
...我好像突然觉得我的论文有希望了
作者: joy2105feh (三峡尧神不服来辩)   2016-06-30 22:05:00
这太狂了xDDDDD
作者: yellmyheart (安安)   2016-07-01 01:04:00
突然又兴起了写程式的动力
作者: insect5213   2016-07-01 03:44:00
不推是文组

Links booklink

Contact Us: admin [ a t ] ucptt.com