大概讲一下GDPR
其实要符合很简单,就是做hash就好
做到是不是同一个人 其实没那么好做
要看raw data是怎么做的
因为现在很多都会做rehash
所以同样门号 印出来可能是不同hash值
举例来说小明是某电话号码A,男,学生,18岁
重点在于小明与A的连结
所以小明+A hash成B 在基地台x注册可以正常使用网络
小明从北平东路走到青岛东路
小明+A hash成C 在基地台y注册也能正常使用网络
验证都会通过
显示资料就是18岁男学生参加两个活动,但不同人
实际上可能同一个
但这部分你不知道他的架构是怎么做的
所以你不知道B跟C是谁
有可能电信公司没做rehash 所以都存B
也有可能是lifetime机制 一周后重新注册
方法太多
但能确定的是 两个活动都至少有一个 18岁男学生参加
而除掉可辨别个资部分
就符合GDPR了
依王所说的内容
发现都不同人 这比较奇怪
除非数据是有很明显的落差 不然很难看都不同人
例如
519:男生90%,女生10%,年龄层20-40,来源北部县市
521:男生55%,女生45%,年龄层遍布,来源北部县市
524:男生50%,女生50%,年龄层遍布,来源各县市
这样应该很清楚看三波人不一样吧
※ 引述《sgtotoro (哈哈)》之铭言:
: : 重点在于王直接将三次不同日期不同地点的人
: : 来做比较
: : 当然 第一个有可能他随便唬烂的
: : 拿个不知道什么东西的来做比对
: : 发现三场都不同人
: : 这有可能呀
: : 想想都知道怎么可能选前之夜的人群一个都没来
: : 助理不用来吗
: : 可是如果是真的
: : 去识别资料理论上不可能做这样的连结
: : 中华电信更不可能违法提供未去识别的资料
: : 如电话号码 身份証 姓名 出生年与年龄等
: : 年龄区块本身已经是去识别的资料
: : 没人能从年龄区块去三场比对出不同人吧
: 办法是人想的(小草肯定想不出来):
: 数据代码AAAABCDEFGHIJ
: AAAA=门号代码(非门号自身) B=年龄 C=性别 ....以下自行举例带入
: 你只要数据代码无从识别特定之当事人即不违反个资法
: 之后只要比较三次的数据代码不就做到了且不违反个资法是吧!!