KMT跟葱哥好像太早上了这大兵川这班车~
前面有人提到了,去识别化资料是可以拿来分析的~
年纪、来自哪个县市都可以分群,
至于519/524/528 可以看是否重复来,其实也不算太难,
就资料来源给予编号就好。
三天都来的给1
三天来两天给2
519/524 2-1
519/528 2-2
524/528 2-3
三天只来一天的给3
519 3-1
524 3-2
528 3-3
全部共七组分群。
例如:
乱数码A:2-1,嘉义,年纪20~30,男
乱数码B:3-2,屏东,年纪50~60,女
乱数码C:...
乱数码随机产出,无关连线索trace,只是避免资料表重复计算。
再分:
太阳花:
1-1:全程参加
2:n天参加m天
Sub_Group
只是时间跨距超过十年,改变的事情很多,资料可用性极低。
(以上分群还是找不到人即可)
这并不是太难的技术,症结点在于这样的资料是否触犯隐私。
但个人资料保护法的定义是可以从资料找到你这个人。
两笔独特资料(例如,身份证字号+电话号码)可以找到你,就是触犯个人资料保护法。
你可以把身份字证号改成Unique_No1 电话:Unique_No2,因为有关连线索在,
可能还是违法疑虑。
不过如果以前述分群组的方式来执行,因为找不到单一个体,原则上不会有法律上疑虑。
至于政党倾向,也可以从人口样本调查比例去回推,
半年前才选举完,各大智库的调查统计资料,一定有各年纪/县市/性别的政党支持比例。
王义川这个人很贼,搞不好是布好陷阱等人上车。
别太快上车啦。