[心得]数据,谎言与真相-Seth Stephens-Davidowit

楼主: oricaa (男儿膝下有黄金)   2018-03-25 11:40:20
上礼拜去逛SOGO和诚品敦南店, 买了两本书:
https://i.imgur.com/Vuo7vLM.jpg
今天要介绍的是
数据、谎言与真相 作者为Seth Stephens-Davidowitz
作者是哈佛大学经济博士
本书我蛮感兴趣的是因为他使用了很多"诚实"的数据
并非矫揉造作或透过大学生的眼光去看得数据
例如:
很多"行人"在google上的搜寻 会是penistrain 而不是pedestrian
"厨师"会被搜寻成"cock" 而不是cook
人的搜寻行为不会说谎 但是key错字会说谎
另外作者赛斯博士也引述了很多google上的数字和大数据去处理现有的资讯
例如: 当欧巴马要去中东演说时 就会出现很多恐怖攻击以及恐怖份子的搜寻关键字
当一个浪潮袭来时 真的会发生
套一句大学时代郑老师的话说 谎话说了70次可能不会成真 但说了1000次就成真了
这是一种"风潮"(trend)
作者也说道当女人对眼前的约会对象有兴趣时 她的性感字眼可能是"我"
因为她对他有兴趣 感到自在 就会一直滔滔不绝说自己
假如约会时都是问问题 那就是不感兴趣才会有的疑问 没话说了 只好问问题
女性比男性更常谈论"购物"和"我的头发";男人比女人更常谈论"足球"和"Xbox"
许多数字是trash in trash out
不一定量大的数字才是正确性高 精准度高的预测成果
而是"质地精美"的数据 才具有代表性以及高预测性
作者引用米兰昆德拉在小说"生命中不能承受之轻"的令人感叹的话:
"人的生命只有一次,我们永远无法检证哪一个决定是好的,哪一个决定是坏的,
因为在所有的处境里,决定的机会都只有一次,我们没有第二次、第三次、第四次
的生命,可以比较不同的决定。"
另外 大数据也有道德危险 例如某企业要雇用某一人 会去搜寻他的脸书 社群讯息
以及所有网络上的代表性资讯 或按赞次数 也许当此人说了某公司的坏话 可以不录取他
这没有道德危险 但假如发现了一项非关重要性的数据 因而不去录用他
这就是道德危险
因为人不知道自己的言论在大数据上呈现的归类在哪一类?
是智商低、而不能得到他所称职的工作?
这似乎太不公平了
书中结尾也提到 无论在任何情况下 我们必须追踪大数据的线索
如果有统计技能的人 也富有一些创造人 欢迎来从事数据分析的工作
我觉得这本书可以一气呵成 蛮好看的
推荐给您
作者: Lambo1228 (ㄩㄩ)   2018-03-25 12:45:00
原po是台北大学的吗XD
楼主: oricaa (男儿膝下有黄金)   2018-03-25 13:02:00
是啊!
作者: gladopo (glad)   2018-03-25 14:26:00
我也觉得这本不错,推
作者: ginwala (Love always wins)   2018-03-25 15:17:00
推 谢谢认真分享
作者: myislet (以为忘了却记得牢牢的。)   2018-03-25 16:39:00
推,这本我也有买

Links booklink

Contact Us: admin [ a t ] ucptt.com