我不是很懂大数据但有实际操作过,地政才丢20万笔就想搞大数据是想的太美好,我丢过
30万笔资料出来的结果,没比我自己写excel去跑优而且差很多。
所谓大数据这东西是这样,通常是厂商建个模型,然后你要丢一些东西去train他,告诉
他出来的东西对不对,你只能知道结果对或错,但他不会跟你说他怎么运算的,因为太复
杂,他会根据你的回馈去修正判断标准,让判断越来越准确,理论上他是一种AI学习结果
。
到这里有两个重点,第一你模型怎么建的?鬼才知道,第二个非常重要你要train的好电
脑才会准,这是非常大工程累死人还不一定有好结果。
理论上应该会越来越准确,但实际没那么准时你根本无法知道为什么,只能再train再看
,假如你有无限资料无限时间可以把系统搞好,可惜通常你时间有限,你的工作更不会只
有整天在train这不知什么鬼的东西。
应用在实价登录我第一个想到的就是他原始资料够不够多,关键不是20万笔登录,是以往
地政抓了几个不实申报,你抓的不够多等于能train的很少,整个模型一定不准,说是AI
但同时也是很靠人为的东西。
再来就是你用大数据抓了一些高风险案例,重点是之后呢?地政是公家机关要依法行政,
不能抓了就说你有罪,当然还是要调查,其实后段都是一样的。