楼主:
Mimmature (Musicians Immature)
2024-05-30 12:13:31没有要替谁背书
纯粹就资讯业的正常资料分析原理做说明
先说结论:基础的分析报告 跟个资无关
但是欧盟的gdpr跟加州的ccpa有针对“资料蒐集”做限制
要求各平台要告知使用者并“同意”(Consent)后才能进行蒐集
台湾个资定义
https://i.imgur.com/eOnliu3.png
gdpr跟ccpa是包括但不限于个资
也就是性别年龄所在国家等等都包含在里面
即使是去识别化的资料也不可以在未经使用者同意的情况下蒐集
gdpr当初在资讯界是很大条的一件事
现在也越来越多国家跟地区跟进资料蒐集的限制
你现在进入各大网站会看到的“同意使用cookie”就是gdpr的成果
※ 引述 《OpenGoodHate》 之铭言:
: 推 qk3380888: 请问要下什么条件才知道参与者是太阳花 126.236.27.103 05/30 10:27
: → qk3380888: 出来的捏 126.236.27.103 05/30 10:27
去识别化有一个很简单的做法
你的手机给你一个uid
所有上传的资料都绑定在这个uid上面
而这个uid只会存在你的手机里
所以服务器(外部)经由uid关联到你这个人的路径是不存在的
由于uid是唯一值
所以可以知道“资料的变化”
而“顾客回头率”就是其中之一的重要指标
分析报告不需要知道你是谁
只需要知道这两笔资料是不是属于“两个独立的个体”
也就是说当一个数位的统计资料可以统计“人数”
他就存在一个可以分类资料的标签
可以是长时间的使用的uid也可以是短暂辨别用的ip位址
否则他就只能统计“资料上传的次数”
这样意义就不大了
至于可以知道你去过太阳花也去过青鸟
这个就有点夸张
时间跨度越大去识别化的误差就会越大
因为uid是随时都能重新产生的(例如换手机、换门号)
而519跟521、524、528这种短时间内的统计
甚至只需要知道这个uid存不存在两笔以上的资料就能判断
是一件下SQL语法就能解决的事情
连程式都不用写
扯到个资是真的在秀自己的无知
再说一次
没有要替谁背书
纯粹就资讯业的正常资料分析原理做说明
顺便看能不能钓到资讯业的潜水乡民XD
请问著名的“养老机构”是哪间公司?