※ 引述《ig49999 (见子我老婆)》之铭言:
: https://www.facebook.com/PTT.TU/posts/10159158397526137
: 杜奕瑾
: 1 小时 뜊: AI Labs去年11月就公开在国际发表的算法,还能被抓到,怎算先画靶仔射箭?
: 凡走过必留下痕迹,做了就不要怕被分析。
: 笑鼠
: 八卦板板主还改板标
: 你各位五毛早就被杜老大抓出来了
: 只是我说
: 那个五毛名单呢?????
欸,我PTT外商码农阿肥啦!现在还在当研究员,有六年机器人语意理解的研究经验啦!
请杜先生可以认证我是同路人,我真的无所谓,就把我当在地五毛好了,反正我未来想换
工作也不打算投你们公司履历。
不过我自己用午休15分钟已经把你开源的代码opinion那个看完了,还没找到你说得国际
论文,先以你的代码来推测。
你这边我看到Google 已经train好的sentence encoder multi lingual啦!然后我这边科
普一下,这个就是Google 2018年想解决一个句子级别的通用语言模型设计的,所以他对
于句子级语意相似度有天然性可以直接复用(原始的训练模型方法就是这样),不用额外
再弄个下游重新训练啦!
然后你在拿这个去做Cosine Similarity 计算相同的语意把这些使用者相似语意的聚类在
一起,这样只能说明你把相似言论的使用者做一个关联成同一簇,然后就没有然后了。
我就好奇了,相似言论只能证明可能使用者有类似的相同立场或是都是某个年龄层跟阶级
,但是哪里可以验证这些使用者就是五毛?何况PTT本来就是有些人爱反串,有些人不爽
政府,想发泄自己的,大概我也不用做太多算法搞得自己很高大上就知道了啦!作为理工
人你的客观性在哪里?直接在算法的结论强加你的假设了,叫客观??
最后,你依旧是先射箭再画靶,那这样结果自然就是只要你想要这个的结果,算法自然就
可以偏向你的预期,完全没有研究价值。
我相信这也是你底下的研究员或工程师研究的,我只能说任职你们公司真的很可怜,为了
老板的政治喜好研究员只能服从。
不要以为乡民都不会看代码啦!我觉得自己摸摸良心吧。
欸,懒得讲了。