Re: [新闻] 蓝攻用国家机器监控人民 王义川贴“台中

楼主: bulden (bulden)   2024-05-30 12:10:51
※ 引述《d8751102 (YO~多重影分身之术~Y)》之铭言:
: 1.媒体来源:TVBS
: 2.记者署名: 记者 吴绍瑜 报导
: 3.完整新闻标题:
: 蓝攻用国家机器监控人民 王义川贴“台中景点人流分析”反击
: 4.完整新闻内文:
: 民进党政策会执行长王义川日前在电视节目分析青鸟运动参与者年龄,被国民党不断指控
: 以国家机器比对个资、监控人民。王义川昨(29日)深夜在Threads发文附上3张图,直说
: ,“欢迎大家来台中玩。”根据图中显示,内有台中市政府观光旅游局分析的游客行为,
: 包括男女占比、年龄层占比、重游率、留宿点、停留时间等资讯。
我是不知道他一直在拗什么?
重点是,是那一家电信公司帮你做这件事?你说出来就解套了。
: 根据该网站说明,台中市政府观光旅游局针对台中市主要游憩据点,建构此网站,借由去
: 识别化的电信数据人流统计、科学推估,提供游憩据点游客统计资讯,方便使用者即时掌
: 握总体游客行为特性。
: 该网站指出,可配合时间或空间思考维度,即时查询台中市当前或特定期间之历史游憩数
: 据,产制15项指标之视觉化图表,包含月游客数总计、本外县市游客数总计、客层居住地
: 来源、客层性别、客层年龄、客层喜好度、客层国籍别、月平假日平均分时人数、平均停
: 留时间、平均连续停留天数、重游率、留宿点、景点留宿率、旅次链、热力图及游客数位
: 足迹等,并依据功能属性,分众提供 产、官、学界等领域之业务所需使用。
我们来聊聊一般数据库在处理这些资料时,怎么做到真的去个资层及去识别化的。
一般我们的手机,只要进入某一特定区域和当地的基地台进行授信交握时,大概会授信
几项资料。
比如手机在基地台登入时,资料流大概如下:
手机门号:IMEI:姓别:出生年月日:居住地:通讯模组MAC:GPS:登入时间:登出时间
数据化:F8:E2:A1:D3:A3:F8:B3:09:57
如果比较有良心的电信公司要卖这些资料串时,应该会先把上述的资料去识别化。
将涉及个资的字段直接拿掉,比如手机门号:IMEI:通讯模组MAC:GPS
然后保留姓别:出生年月日:居住地:登入时间:登出时间这些!
而将某特定时间内的资料再汇出成一个新母体,而这个母体的单笔字段可能如下:
游客1:姓别:出生年月日:居住地:登入时间:登出时间( A1:D3:A3:09:57)
那如果是这些资料,我们就可以透过算法,去统计分析出这些数据。
月游客数总计 :统计非台中巿居住地人流。
本外县市游客数总计:统计非台中巿居住地人流、
客层居住来源:统计居住地
客层性别:统计姓别
客层年龄:统计年龄
客层喜好度:统计各区热点流量。
客层国籍别:统计国籍。
月平假日平均分时人数:对平时和假日分析热点流量。
平均留时间:分析登入登出时间。
平均连续停留天数:分析母体就假日和平日的讯号数量差异。
重游率:分析热点流量。
留宿点:分析特定区域的电讯登入登出的时间点。
景点留宿率:分析特定区域的电讯登入登出的时间点加入比对流量。
当然本鲁这种只修过基础资料结构的,就可以利用去识别化,去个资化的方式进行统计分
析了。
那请王义川,找几个懂资讯或是AI的,可否就上述的资料去对不同时间点和不同区域的
人流对比差异化?
不要再拿台中或新北案例来拗了,你一定是要比对GPS讯号或是手机号码或IMEI,才比对
出其中是否重复出现在不同地域和不同时间点。
: 民进党发言人吴峥昨也强调, 王义川基于综合现场、网络资讯、问卷调查等资料,事后
: 进行的媒体分析评论,判断5月24日的群众与5月19日、民进党选前之夜的群众是不同类型
: 的一批人,无涉个资。
: 5.完整新闻连结
: https://news.tvbs.com.tw/politics/2501906
: 6.备注:
: 蓝白能你不能

Links booklink

Contact Us: admin [ a t ] ucptt.com