: 数据不是愈多愈好,这部分其实我本来想表示的是过多的资讯可能会让我们迷失原本的目
: 标。可能你本来想要查询什么东西,结果查一查后来就把焦点放在其它的事物上,导致我
: 们原本想要查询的问题没有获得解答。有时候某些资讯可以提供有效的论点时,我们就不
: 一定要获取更多的资讯,当然多方查询并非一件坏事啦,尤其是要做什么重大决策时。只
: 是不要忘记我们查询的目的是什么? 主要是为了解决问题,或者满足求知欲,或者只是纯
: 粹无聊,或者只是想要告解、纾解压力,或者只是要写作业报告…等等。
: 变量不是愈多愈好,这部分其实是要找某些因素之间的相关性或因果关系。如果你的变量
: 有很多,可能会凑巧找到一个变量刚好具有相关性,如果你以为已经找到解答的话,可能
: 就会陷入思维的陷阱。作者也提供一个例子,也就是基因学家在寻找DNA序列什么会跟什
: 么有关系时,有时候会发现什么会跟什么有关系,然后他们就很开心发表这个重大发现,
: 如果事后能够证实的话,也许可以捞到一个诺贝尔奖,不过常常发生的情况是事后进行其
: 它数据集的研究时,反而推翻他们原先的发现。科学研究就是这个样子,如果你不能够在
: 其它地方重复验证这样的相关性或因果关系,那么你就不能够声称自己找到什么重大发现
: 。也许之前韩国声称找到常温超导体,也是陷入了这样的一个陷阱。你看像物理学、生物
: 学或化学这样严谨的科学领域都有可能会犯这种思考陷阱了,更不用说在经济学、政治学
: 、社会学这些难以论证的领域,有多少人会犯这样的错误了。
: 有空再打。
这本书虽然好像揭露许多人性的丑陋面,例如性倾向、暴力倾向、种族歧视、性别歧视等
等,这些研究结果是根据Google搜寻、FB或其它社群网络的行为等等所得到的结论。不过
如前所述有相关性不一定会有因果关系,像作者说川普之前会胜选是因为种族歧视的关系
,他还特定提供川普各州得票率和种族歧视之间的相关性,看起来好像有相关,不过也不
能说明川普后来为什么会输给拜登。难到是这期间各州的种族歧视状况有变化吗? 想来好
像也不是这么一回事。而且今年的美国大选结果会如何还很难说,难道又跟种族歧视有关
? 我想应该跟多因素有关,所以单用大数据做出某些因素之间的相关性,可能也不能说明
什么。
所以这样的大数据分析还有用吗? 不知道,不过应该得到不少有用的资讯,至少企业可以
从中获取更多的利益,也就是未来这种大数据分析或资料探勘的研究还是会继续下去,因
为现实世界很复杂,很多社会现象我们很难找到原因,透过大数据分析、人工智能或者其
它工具,我们可以更了解人类彼此之间是如何互动的,这个社会和世界是如何运转的。一
切都是为了让我们解决问题、改善我们的生活、得到更大的利益或者永续发展做努力。
但这不意味味传统调查方式就完全没什么用处,也许可以和大数据分析做互补的动作,这
是因为也许大数据分析有其不足之处,或者目前的技术还无法臻于完美,所以我们需要各
种资料蒐集方式,各种处理或分析资料的方式,各种工具或资源的运用,让我们能够更准
确掌握我们观察到的现象,并且可能的话,更准确地去预测未来,更准确地去回避一些风
险。虽然未来存在着许多未知数,但是掌握更多的情报,就比较能够掌握好未来。缺乏情
报就涉足冒险是相当危险的事情,虽然不敢冒险是最大的风险,但是有勇无谋的行为很容
易会造成严重的后果。(谜: 有时候就是没有足够情报还是必须做出选择啊!!! 有那么容易
就能预测未来的话大家就不用烦恼了。)
奇怪我在打什么东西,好像愈扯愈远了,好了不打了,这次的心得就这样吧。
https://i.imgur.com/O6ycBYJ.jpg