[分享] 捷运百亿人次预测

楼主: togetherhoo   2019-03-15 23:22:53
图文好读板 https://reurl.cc/qVd1D
台北捷运100亿人次即将降临
到底该应援哪条捷运线?
北捷旅运量即将突破百亿
编号第100亿旅客将会诞生在哪一条捷运线?
是地下情人板南线、
最有情有义的中和新芦线、
还是最国际化的Songshanxindian Line?
台北捷运与短信设计团队近日共同策划迎接北捷百亿运量系列宣传活动
掀起一场捷运之乱
其中最引起大家讨论的话题
便是创建捷运线拟人角色
用FB帐号直接在线上与群众互动
进行拉票竞赛
说到应援捷运线
除了凭感觉选最多人的那条之外
有没有其他方法可以帮助我们更准确地预测百亿人次?
3/9台北捷运脸书发布了一则对预测很有帮助的快报
让我们进一步去想
透过过往北捷运量资料分析
是不是能够更有力地推断这位编号100亿旅客将在何处诞生
首先要有能拿来推算运量的资料
能够最直接了解台北捷运各站流量的资料来自台北捷运公司2017年起开放的台北捷运各
站分时进出量统计
由于统计资料公布会有一段时间延迟
我们没办法即时知道今年3月的数据
只能透过历史资料进行推算
综观过去几年每个月的单日平均运量
2016年后没有新的捷运站通车
每年同期的运量开始趋于稳定
成长率多落在1~3%
反而是同一年中不同月份的运量影响差异更大
(如冬季运量大于夏季;2018、2016年2月、2017年1月农历新年运量较低)
所以我们选择以去年同期(2018年3月)的捷运运量资料作为这次推算百亿人次的主要依据
https://cdn-images-1.medium.com/max/1000/1*jxRAoIB7p9CSMlM-iUKKBw.png
而捷运的使用与民众上班通勤息息相关
我们进一步检视
在同一个月份中
影响单日运量的因素,主要取决于当天是星期几(day of week)
平日运量较大、周末运量较小
所以假若我们要推算今年3/13(三)的单日运量
应以“去年3月的礼拜三”来推估
而不应用“去年3月13号”
https://cdn-images-1.medium.com/max/1000/1*HDED22HazUJsM-QMGM08QQ.png
确认分析资料后,我们试图回答2个问题:
Q1:捷运百亿人次将出现在哪一天?
虽然预测时间并非这次的活动内容
但因台北捷运会不定期的发布人次快报
(从99.5亿每隔1千万发布一次)
我们可以根据快报提供的资讯修正推估模式的参数
让后面的机率推计更加精确
官方活动‘寻找台北捷运编号100亿’的预测及应援截止时间为3/28
表示编号百亿出现的时间应在3月底至4月初之间
若以旅运量推算
配合99.5忆及99.6亿人次快报提供的资讯
我们可以做更细致的计算 :
https://cdn-images-1.medium.com/max/1000/1*73CfZlihc6qcS2ZQh5ijng.png
台北捷运第一百亿人次大约会出现在3/31(日)下午
大家在大安森林公园听捷运100大金曲的时候
这位可以一年免费搭捷运的幸运儿可能就诞生了
Q2: 投哪个捷运站/捷运线机率最高?
根据前面的时间推估
百亿人次约出现在周日的下午
我们进一步计算周日下午各个捷运站的“进站人次”
作为机率推算基础
从机率分布图可以看到
运量第一、第二高的两个捷运站所占的流量便达到总量约13%
剩余捷运站运量占比则由2%左右缓慢递减
https://cdn-images-1.medium.com/max/1000/1*Qm5R4VUjJc7tRPbBKALFUw.png
把运量最高前10名的捷运站列出来
会发现板南线上的捷运站就占了6名
包含运量最高的两站,台北车站与西门
都是假日市民会时常进出的大站
https://cdn-images-1.medium.com/max/1000/1*4f5fONJlQdRqidb9sLtsIw.png
至于应援捷运线
其实从上面结果大概已经能猜出运量最高的线是谁
但为求精确,我们还是对资料做了一些处理
由于台北捷运有许多两线交会的转运站
在计算上会将进站量分别加入两条捷运线
如台北车站会计入红、蓝线、西门站则会计入蓝、绿线
https://cdn-images-1.medium.com/max/1000/1*SrRJAisfZ626cWWn7Bdwkw.png
从分布结果来看
板南线果然是大家的地下情人
是假日往返台北市区不可或缺的重要干线
而淡水信义线也不惶多让,包办了超过1/4的运量
小结
把上面各捷运站/线的机率分布图与截至今天为止官网应援活动的人数比对
可以发现,除了榜首台北车站及板南线外
大家的选择顺序和实际计算出来的分布有蛮大的差异
例如淡水信义线运量与板南线不相上下
但票数却差了将近一倍
而最近中和新芦线的魅力太强
拉到的票反而些微超越淡水信义线
而捷运战报则可以看到不少运量在10名外的捷运站出现在榜上
可见大家对自己所爱的捷运站/线
是远超过单纯的机率计算的!!
https://cdn-images-1.medium.com/max/1000/1*4GKD9egsgBNW9QQTeRQWmg.png
结论: 选自己所爱
虽然絮絮叨叨算了很多数学
但这次的应援活动也不是要大家下注买乐透
或狂搭捷运期待自己刷中编号第一百亿旅客
在这次活动的过程中
从群众讨论到在FB上与各条捷运线互动
我们也看到台北捷运对于双北市民而言
是多么特别的生活经验。
所以,自己的捷运自己挺,勇敢的选择自己所爱吧!!
(什么结论?)
https://cdn-images-1.medium.com/max/1000/1*6kWvEDP-JVxeWB5PChQaGg.jpeg
我们是openbird studio
本次资料分析一样是由之前分享
#依人流变化替捷运站点分类
#以热图呈现台北捷运分时人流变化
的作者 unhuman 所操刀
作者: kuso10582 (Piscine)   2019-03-16 00:18:00
厉害...不过我觉得这种东西就是机率性啦大站相对比较有可能 但小站也是有机会
作者: Johnnyyang (Johnnyyjy)   2019-03-16 00:46:00
还可以再逐小时分析单日全系统、各站的累积运量
作者: bahia (bahia)   2019-03-16 01:16:00
希望最后结果是爆冷
作者: sleepyrat (sleepyrat)   2019-03-16 01:20:00
希望是落在炉主手上~~
作者: StarFox0910 (闭嘴 低能儿)   2019-03-16 01:59:00
登愣 小碧潭(X
作者: jh961202 (阿电)   2019-03-16 02:31:00
不愧是资料科学分析师
作者: naruto1010 (鸣人)   2019-03-16 07:48:00
为什么会有阿达王子乱入w
作者: tony900735 (大頭)   2019-03-16 10:23:00
XDDDD
作者: Mytsb2421 (Mytsb2421)   2019-03-16 10:48:00
百亿人次如果是现金购票,会查的到吗?
作者: hicker (救护车专载笑到腹肌抽筋)   2019-03-16 10:59:00
现金购票一样是要拿单程票代币刷过闸门呀....这样问倒想到 如果百亿人次的时间点出现团体票进站呢??
作者: ting445 (PPTTTTTT)   2019-03-16 11:10:00
结果最后在小碧潭XD
作者: blackwind910 (風玄的某個親戚也叫風玄)   2019-03-16 11:29:00
我猜万芳社区(X
作者: tyytt (踢歪歪踢踢)   2019-03-16 11:37:00
原来那些帐号是官方创的
作者: ji394xu3 (萨埵十二恶皆空)   2019-03-16 12:31:00
机率这种东西就跟乐透头奖开在什么县市一样看运气...
作者: chuegou (chuegou)   2019-03-16 12:59:00
现在流行在数据分析文下面讨论运势吗我觉得我运气不错 选我正解
作者: ihl123456 (雨风评)   2019-03-16 13:04:00
一位公务员长期患有三高疾病,经常往返万芳医院回诊,结果看完医生回去进站时突然发现一只鸽子一直对他叫,没想到就成了捷运百亿人次。
作者: jackwula9211 (Carbon.)   2019-03-16 13:14:00
结果出现在新北投站
作者: chluke (慎)   2019-03-16 13:23:00
如果是买代币进入,如何知道乘客的身份
作者: hicker (救护车专载笑到腹肌抽筋)   2019-03-16 13:44:00
游戏办法还是要北捷自己说了算....
作者: Nostalgia104 (No)   2019-03-16 14:47:00
我猜单程票不列入计算 因为投进去根本死无对证除非调监视器去对
作者: Mytsb2421 (Mytsb2421)   2019-03-16 19:34:00
记者要拍百亿人次,不知道要去哪一站等要不限制一下旅客行动,等官方或记者来说恭喜
作者: aquarsx3 (长耳跳兔)   2019-03-16 20:13:00
https://i.imgur.com/4PYZnhM.jpg公告不就写明单程票不算了?
作者: abcd880201 (CrazyEgg)   2019-03-16 22:33:00
唯一支持小碧潭
作者: earthuncuttv (追风者)   2019-03-16 23:03:00
最后在小碧潭站
作者: ultradev (QQ)   2019-03-16 23:08:00
小碧潭,新闻稿顺便业配央北的建案与IKEA
作者: hicker (救护车专载笑到腹肌抽筋)   2019-03-16 23:45:00
原来只采计电子票证喔....我承认没看规则 XDD可是这样....只采计电子票证的第100亿人次 也不是准确的吧搭乘人次当然包含单程票与团体票的人次
作者: ultradev (QQ)   2019-03-17 00:17:00
这是行销活动,准不准确不重要,差不多就好了
作者: bahia (bahia)   2019-03-17 00:26:00
其实是使用电子票证的第一百亿乘客
作者: abc480528 (Treebase)   2019-03-17 00:52:00
第100亿遇到单程票直接下一位递补就好了吧
作者: mono1023 (阿沛)   2019-03-17 02:47:00
结论是根本测不准吧 会有同时间进站 还有资料进系统的延迟时间
作者: evanzxcv (左蝦餃.易釩斯)   2019-03-17 17:36:00
实务上应该只能从同时第100亿人次的那一群人里面随机抽
作者: jimmylily (jimmylily)   2019-03-17 22:21:00
推medium好平台~~
作者: ultratimes   2019-03-18 11:52:00
实际上不可能遇到同时进站,只是时间太近可能会超过电脑可以识别的范围而已就算动作同步到 电视辅助判决都无法看出快慢但只要时间能分割的够细,还是能看出快慢的两台一样的电视 同样片源 一起拨放 或许一般人无法看出哪台电视延迟的比较多,会觉得都是一起拨放但真的有办法用高速摄影机去看,一定会有些微落差
作者: lookers (实体店面 货到付款 宅配)   2019-03-18 15:46:00
作者: mark10133 (TED1010)   2019-03-18 16:19:00
作者: aquarsx3 (长耳跳兔)   2019-03-19 14:05:00
作者: s59654655 (s596546ff)   2019-03-20 12:03:00

Links booklink

Contact Us: admin [ a t ] ucptt.com