[观点] 续谈现代中国-东南亚-日韩人的来源 (一)

楼主: a46911a149 (a149)   2023-04-03 00:43:20
在我先前在本版写过的文章
[观点] 现代中国-东南亚人群(基因)来源
https://www.ptt.cc/bbs/historia/M.1676192356.A.CC2.html
系列文中
我已引述数篇学术论文的内容
对中国与东南亚人的来源进行初步探讨
但由于前几篇论文的分析,主要通过常染色体来进行分析
常染色体分析一方面也可能产生各种bug与误差
一方面也可能产生误导性的分析
一方面也不容易确认细节
所以本文的内容
主要放在进一步统整东南亚人的Y染色体类型与比例
以Y染色体分析东南亚人/东亚人的来源
以对前文进行补充
以及补充中国新石器文化的Y染色体类型,与现代人进行比较
当然,Y染色体的比例,不能代表常染色体的比例
因为Y染色体只来自父方,只能代表人群父系祖先来源,
粒线体来自母方,代表人群的母系祖先来源
而常染色体均匀的来自父方与母方,代表所有父系母系祖先来源
但一个使用Y染色体来分析的原因是
是因为Y染色体遗传漂变的速度更快
这指的是,Y染色体多样性减低的速度更快
举例来说,在中国,距今一万~两万年的Y染色体支系,
大概只要十几支,就能覆蓋99%的人口
(表示99%的中国人,都是十几个 一万多年前的男性的父系后代)
但同年代的粒线体,可能要成百上千支,才能覆蓋99%的人口 (我不太清楚确切的数字)
这导致使用Y染色体,分析晚近人群来源更直观
用粒线体分析更复杂,相关来源也比较难找
不过本文还是会简单的叙述一下,东亚人粒线体的来源情形
一. 东亚人粒线体来源简论
https://i.imgur.com/DZeGpBU.png
来源:
https://en.wikipedia.org/wiki/Human_mitochondrial_DNA_haplogroup
此外,如此图也能看出
这种几万年级别的粒线体,黄种人(东亚人)内部的类似性是比较高的
上图主要是3万~7万年共祖的粒线体,在不同人群中的分布情形
在北方汉人 南方汉人 越南人 傣族 内部有程度不低的重叠状况
但已与欧洲人 印度人 非洲人展现出明显的差异
另一张图:
https://i.imgur.com/XJgIbSK.jpg
来源:
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3913319/
可以看出,中南半岛的缅甸 泰国 老挝 越南 香港人,
在三万~七万年共祖的粒线体上,都是具有一定重叠性的
M 与 N 是唯二两个走出非洲的粒线体 (大约六万~七万年前共祖)
所有非洲以外的智人,都是M与N的母系后代
而非洲黑人主要是粒线体L的后代 (虽然 M 与 N 也是L的后代)
示意图:
https://i.imgur.com/CeLJxxu.jpg
如图,
标浅绿色的支系是东欧亚人/黄种人的粒线体类型
蓝色是西欧亚人(欧洲/中东人)的粒线体
紫色是印度人独有的粒线体
红色是非洲黑人的粒线体
黄色是大洋洲人群的粒线体
南岛人的粒线体的大类型其实主要与其他东亚人重叠
只有E这个分支有比较强的南岛特色
(但这些都是三万~七万年的分支,细分到一两万年内的小支系,
东亚人内部仍能展现出甚大的族群差异)
这也是为什么23魔方官方文章的粒线体分析,
挑出来比较的粒线体,只能覆蓋到50%的人口
(因为同年代粒线体支系的数量甚大,
只能挑出人口占比较高/地域特色明显的支系方便分析)
https://i.imgur.com/25DO5za.jpg
中国人的粒线体来源,亦可参考
https://academic.oup.com/mbe/article/36/8/1643/5423190
这篇中国的学术论文的样本资料
此篇论文中,中国各省的粒线体比例,与23魔方那篇文章列出的粒线体比例一致度甚高
东亚人/黄种人常见的粒线体类型
有 A B C D F M7 M9a 等等
其中粒线体D4 ,有比较强的北方色彩,在日本人中,可以占到30%~40%,韩国人25%~30%
https://i.imgur.com/jWVOz0i.png
但在东南亚人中,比较缺乏,少于1%~5%
在中国由北向南递减,在河南一带大概 20%,湖北16%~17%,福建12%~13%,广东广府8%~9%
二. 资料来源
本段落主要罗列部分本文的参考来源
并罗列出一些,有助于用来分析人群的Y染色体的工具
(1). 中国基因公司23魔方的官方网站
https://www.23mofang.com/ancestry/ytree/D-Z27269
优点:
中国的基因公司,具有几十万中国人的y染色体样本
分支细,可以精细到查询不同y染色体支系,在各中国地籍市的占比
还能查询中国少数民族的Y染色体占比
缺点:
该公司的中国少数民族样本,包含不少一两代内跟外族通婚过的
导致该公司的样本,少数民族的纯度更低(学术论文至少能过滤掉近两三代内通婚的样本)
而且该公司只有中国人的样本,缺乏中国以外人群的样本
也没有公开粒线体的样本
(2). theytree网站
https://www.theytree.com/tree/O-M119
https://i.imgur.com/0ZJM9QZ.png
该网站为另一家中国的基因公司,微基因公司架的网站
微基因这家公司,除了提供商业性的基因测试以外,也有从事一点基因相关的研究
该网站,为该公司蒐集世界各地学术机构,公开的Y染色体样本
所整理出的Y染色体分支树,可以查询世界各国人群的Y染色体分支状况
优点:
包含世界各国/各民族的样本,分支细,而且包含考古遗址的Y染色体样本
有粒线体的版本
缺点:
样本数不均衡 (例如有的国家的样本数很少)
无法用来分析Y染色体分支在人群中的比例
样本没有第一手来源的连结
(3). ISOGG的官方网站
ISOGG (International Society of Genetic Genealogy)
为一个国际非营利组织,专门促进世界各国对基因溯源的研究
https://isogg.org/tree/
此网站为该组织架的网站,用来规范化世界各地对Y染色体的命名标准
因为有些机构,在发现新的Y染色体支系以后,会自己帮Y染色体取名字
然后他们就会到ISOGG这个组织进行登记,登记Y染色体的突变点与名称
(例如中国的23魔方与微基因这两家公司,就会去ISOGG登记他们帮Y染色体取的名字)
ISOGG会整理 重名的Y染色体支系,帮他们统一命名
所以遇到不同机构/学术单位,使用的Y染色体名称不一致时,
就可以去ISOGG的官网查询
(4). familytree网站
https://www.familytreedna.com/public/y-dna-haplotree/O
美国的某家基因公司,架的Y染色体基因库 (类似中国23魔方的Y染色体基因库网站)
缺点:
可能因为欧美国家重视隐私权的关系,欧美的基因公司,比较不会公开顾客的样本
该网站主要来自志愿者提供样本,所以样本数很少
(尤其亚洲人的样本非常非常少)
所以其实用处很小,只能勉强用来当一个参照比较的对象
(5). 英语维基百科
https://en.wikipedia.org/wiki/Y-DNA_haplogroups_in_populations_of_East_and_Southeast_Asia
英语维基百科,会整理各种学术论文的内容,
列出各国/民族人群,Y染色体类型的比例
优点:
资料来源多,内容丰富
有粒线体的版本
而且可以透过英语维基百科引用的参考资料来找论文
缺点:
学术论文的品质良莠不齐,有的样本数非常少,准确度差
有的论文是十几二十年前的过时论文
三. 中国新石器遗址概述
https://i.imgur.com/FrYzBgR.jpg
https://i.imgur.com/C2oAWwA.png
Y染色体分支图:
https://i.imgur.com/o8vsHUU.png
https://i.imgur.com/NjuGTld.png
https://i.imgur.com/P3nHZ9n.png
中国距今4000~5000年的新石器文化示意图:
https://i.imgur.com/BhPmi7x.jpg
可以看出,如此图,仰韶文化能作为黄河中上游,一系列考古遗址的合称
上图(Y染色体分支图),标注为"黄河土著"的Y染色体类型,
多数都有在仰韶相关遗址中测出(主要根据微基因架的网站),
(包含 O-F8 O-F46 C-F978 N-M1819 等)
且依照其上游的多样性与分布频率,
推测早期分布地在黄河流域,源自仰韶文化相关人群的扩张
根据微基因的网站,仰韶相关遗址,测出的y染色体类型其实不少
(也不只有上面标出的)
但我不清楚是否都有对应的第一手论文
大汶口文化的人群来源,推测亦为黄河中上游人群东进,
与更早的山东土著混合后产生的
(但我不清楚大汶口文化有没有测过Y染色体)
山东新石器早期的文化为后李文化
后李文化测出的y染色体类型以在上图(Y染色体分支图)标出,
以N1b为主,好像还有 C-F978
湖北的屈家岭文化与之后的石家河文化 (距今4000~5000年前),
取代了年代更早的大溪文化
但目前没听说屈家岭与石家河有测过基因
所以尚不清楚,屈家岭/石家河文化,主导人群是否仍是大溪文化人群,
或者受到多大程度仰韶人群的影响
大溪文化(距今5300~6400年前)
(分布地在湖北湖南一带)
考古遗址出土六例Y染色体,有4例属于 O-M7 ,一例 O-PK4 ,一例其他 O2a
(其中根据23魔方的备注,大溪文化测出的O-PK4,有可能属于O-M1284这支下游)
根据大溪文化出土的Y染色体(但没测常染色体)
大溪文化可能参与了 原始南亚语人群的成形
O-M7 与 O-M1284/O-PK4 皆在东南亚(含中南半岛与海岛东南亚)分布广泛
可能是南亚语人群的特色Y染色体
相关论文:
https://link.springer.com/article/10.1007/s00439-007-0407-2
良渚文化(距今5300年至4000年前),是长江下游,浙江北部一带的史前文化
同一篇论文提供的资料,良渚文化测了两个地点,测出来九例样本全数为O1a
但良渚文化在距今四千年前消失了,之后江浙一带的新石器文化,
虽然含有少量良渚元素,然于风格比起良渚,仍具有明显差异性
之后江浙一带的新石器文化,由于暂时没听说有测过基因
尚不清楚主导者是良渚遗留的人群,还是其他外来人群
不过在春秋时期,吴越地区强劲爆发的Y染色体 O-F619
(在现代浙江占比14%,华南各省8%)
是 O1a 的下游,且它的上游也一直在长江下游一带,很有可能是早年良渚人群的遗留
现代浙江也是中国 O1a 占比最高的地区
https://i.imgur.com/nQrWNIt.png
由于春秋战国/秦汉以后,江南人的扩散
现代中国南方人的O1a,应该有不少源自晚近的长江下游人群
但O1a也有江西湖南/岭南土著支
而同一篇论文,也有提到吴城文化的Y染色体类型
吴城文化,是江西的史前文化遗址,年代大致与商代重叠 (已进入青铜器时代)
据说从考古遗址,能看出吴城文化有受商文化影响
检测的三例Y染色体样本中,有两例为 O-PK4(O1b),一例为 O2a
此外,
南岛语人群可能来自同年代的昙石山文化
昙石山文化测过常染色体,常染色体为高纯度的南岛成分
而昙石山文化测出的y染色体类型,也与现代南岛人群的特色类型十分吻合
根据微基因的网站
O1a2(O-F3288) (5690年共祖) 有在昙石山文化测出
此外,O1a2 在台湾南部的原住民,菲律宾人都有10%~20%的分布,
其他南岛人群也有一定分布,但少见于台湾北部的原住民
O1a2(O-F3288)在中国的分布状况:
https://i.imgur.com/9omscIN.png
https://i.imgur.com/6Fy2LB0.png
O1a2在现代福建只有 0.21%,最高频地点在广西
可能是因为早期福建的南岛人群也有对两广土著产生影响
且现代广西的土著浓度较高所致
昙石山文化测出的应该不只有 O1a2,也有其它类型,
但我目前没有找到相关的第一手论文
下篇待续...
作者: IAMCSH (BorninMCMXCVIII)   2023-04-03 14:38:00
作者: hedgehogs (刺猬)   2023-04-03 14:40:00
作者: shihpoyen (伯劳)   2023-04-03 15:18:00
喜欢这系列
作者: moslaa (万变蛾)   2023-04-03 17:43:00
谢谢整理。

Links booklink

Contact Us: admin [ a t ] ucptt.com