[整理] 病毒演化系统发生树

楼主: naieeliao (♪~~)   2020-04-19 18:37:27
这里只是来宣传一下这两周做的小project
https://github.com/PinguPinga/hCoV-2019-phylogenetic-analysis
从 GISAID 的数据库抓病毒定序资料
Project1 => 筛出高品质的序列
Project2 => 分析并画出树状图
Git里面有pdf档可以参考
https://i.imgur.com/rELDNzQ.png
当初看 nextstrain.org 的资料
自己简单玩了一下发现有出入 (C241T是假的,定序误差)
所以就把 GISAID 原始的序列抓来分析了
https://i.imgur.com/WhUWCF9.png
概念图
树根的原点是使用大家统一定义的参考序列,采集地点在武汉,这并不重要
真要追溯到蝙蝠,说真的,没完没了
接下来要讲故事了
https://imgur.com/kHlMZD5
一、钻石公主号
node #450 (G11083T) EPI_ISL_408481 chongqing 2020-01-18
虽然在重庆第一次检验到,但实际上很多助攻来自第一艘爆炸的钻石公主号
如果回过头仔细分析不完整的序列,G11083T 贡献全球 1/6 的上传序列 (持续降低中)
还记得钻石公主号乘客返回以色列之后被验出来的事吗? 他有 G11083T
但这是不是日本该背的锅呢?
1. 目前最盛行这个突变的地域是欧洲 (合并 G26144T)
G26144T 偏偏也有独立的点突变
2. 日本目前很少报告有这个突变 (可是日本最近爆炸,却很少上传序列)
3. 早在钻石公主号爆炸之前,重庆、香港、新加坡就有这个突变的个案了
结论是...很难讲啊 我也不清楚
https://i.imgur.com/VPX47cI.png
二、恶名昭彰的Italy
node #136 EPI_ISL_412973 italy 2020-02-20 (C3037T C14408T A23403G)
其实在他前面有出现过一个
EPI_ISL_406862 germany 2020-01-28 (C3037T A23403G)
但是德国早期很快就遏止一间公司的群聚感染了
序列重复上传笔数只有1,所以被程式筛掉了
但是意大利真的害人不浅阿,太多观光客了,一下就传到世界各处
这个分支占了 60% 以上的笔数,欧美遍地都是他的子孙
node #375 India 就是他的子孙之一
印度上传的序列过半 (9/12) 都是他,在人口世界第二的国家,应该会爆炸吧 (?)
node #1159 Russia 也是 (11/22)
看来俄罗斯要起飞了
https://i.imgur.com/no8EZUk.png
三、Make America Great Again
事实上跟意大利同时发生的,是二月下旬到三月上旬的美国分支
美国现在最大的流派还是三月初暴涨的意大利系 (美国锁国前的飞机超毒)
node #1 EPI_ISL_413456 usa 2020-02-20
C8782T C17747T A17858G C18060T T28144C
这个分支主要在北美跟澳洲出现,普遍度还是远远不及意大利的株系
https://i.imgur.com/ZMI0Qc5.png
四、日渐壮大的西班牙无敌舰队
听说最近西班牙死比较多人? 其实西班牙的资料只侷限在两个支系
很抱歉,这株系比较难从大量数据中找到源头
node #409 EPI_ISL_418248 spain 2020-03-01
C8782T T9477A C14805T G25979T T28144C C28657T C28863T
智利就中奖了... 南美洲会不会都是他呢?
澳洲有一个小分支,接下来讨论
五、世界的大赢家,澳洲
当你以为纽澳离亚洲、欧洲、美洲都隔着汪洋大海时
澳洲真的各个病毒株系都有!一二月亚洲的株系、三四月的欧美株系
虽然说澳洲表面上好像趋缓,但现在他可是集大成者!
实际上我们还不清楚究竟对不同株系会不会有共同的免疫力
听说最近纽澳要形成共同的 travel bubble (往来的班机复航)
拭 目 以 待
六、盖牌专家,中国
自从三月后上传的有效资料数.... 手指数得出来
听说最近有班机,我们可以来验验看有没有新的演化支出现
结论:地理位置对于病毒的演化有很大的关系
冰岛就有很多专属的病毒株系,大英帝国也有少部分
以上是我个人的意见,解说到这边,谢谢大家 (我不是专门研究病毒的,很抱歉)
※禁止转载※
最近没投2330,失望啊....

Links booklink

Contact Us: admin [ a t ] ucptt.com