※ 引述《chal ( )》之铭言:
: 假设我开电信公司
: 我可以把我的客户资料
: 一、去识别化以后
我是不知道你所谓去识别化能做到什么程度啦!
我国个资法第2条第1款定义须受本法规范之“个人资料”为“得以直接或间接方式识别该
个人之资料”。透过本条文义之反面推论可以得知,透过一定程度之加工或技术处理,使
个人资料丧失直接或间接识别之可能,破坏资料之个人属性后,该资料即非为个资法所保
护之客体。
欧盟第29条资料保护工作小组所言,必须达到不论是资料控制者(data controller)或
是第三方(third party)皆无法采取可能合理之手段识别出特定资料主体之程度,换言
之,资料经加工后与特定资料主体之连结彻底断绝,毫无重新识别之可能。
: 二、同步到另一个表格
: 三、此表格另由统计分析部门管理
: 这表格有纪录 年纪 性别 发信地点 时间
: 还有一个电信公司内部的固定SID
: 但 没有 纪录身份证
: 也 没有 纪录手机号码
: 所以可以很简单的查询出
: 在某地某时的群众的年纪与性别的人数
基本上,这就不符合无法知道资料主体,因为你的年龄就具识别了。
但是这些都不是重点,重点是为什么他可以对不同资料量进行比对这件事?
也还能区分出年龄层这件事。
: 也可以很简单的查出
: 两个活动的差别
: SELECT s.sid FROM 小草芭乐斯坦 s WHERE NOT EXISTS
: (SELECT * FROM 青鸟行动 t WHERE s.sid=t.sid)
所以你的资料量那里来?
你一定要去标签化这些资料,才能进行比对吧!
所以你的动作是,取得资料、标签化、透过算法进行分析。
你自己去查王义川在电视上讲的:
“有些是小草,有些是太阳花的,占了整个活动的六成。我们用手机去看他们的年龄,差
不多六成。20岁以下的,大概占了1成2,所以大概有7成2是70岁以下的。”
他是己经有区分年龄了喔,你如果真要依欧盟的标准?你连年龄都不应该有咧。
: 这样就可以查出
: 有去小草芭乐斯坦但没去青鸟行动的人
: 反过来也可以查出
: 有去青鸟行动但没去芭乐斯坦的人
: 唯一揭露的就是SID
: 但你不知道谁是谁
: 这里面完全不涉个资
你所有的法规标准拆开来,本来就各个部份,都不会涉及个资。
但是重点他有办法把数据进行标签化这件事啦!
什么叫标签化?
当年党卫军对所有的犹太人贴上大卫之星,就是标签化。
: 另外有人说如何得到十年前的太阳花资料
: IPHONE都出到15代了
: 所以十年前有这些统计分析也不会太奇怪
你统计分析而成的数据,单笔来看都不是太大的问题。
问题是你要怎么将这些数据和519进行比对?
两笔不同的基地台流量单纯比人多和人流吗?
重点是你怎么对不同时期的数据,进行标签化?
然后再比对所谓的数据代码?
取得流量数据,和取得数据代码内容是不同的概念好吗?
不要偷换概念了。
: 不过我看王义川的原话应该是说
: 有一大部分的人不是太阳花的年纪
: 并不是去调十年前的统计资料