[观点] 汉人史前时代的Y染色体支系(兼谈南岛语族

楼主: a46911a149 (a149)   2022-12-27 09:57:36
由于在我写的上一系列的文章
https://www.ptt.cc/bbs/historia/M.1671135035.A.A03.html
之中,已大致叙述闽人近三千年的Y染色体支系来源状况
故本文的重点,即放在整理并简述
距今两万年前~夏商时期,汉人的Y染色体支系类型
此外本文也会提及部分东南亚人的Y染色体支系
与 南岛语族人群的来源
https://i.imgur.com/FrYzBgR.jpg
如前文所提及,黄种人的Y染色体来源
有 O N Q C D 五种大类型
其中
O系 共祖于三万两千年前,为新亚洲人支系
N系 共祖于两万三千年前,为新亚洲人支系
Q系 共祖于三万年前,为新亚洲人支系
C系共祖于四万八千年前,为老亚洲人支系
D系共祖于四万七千年前,为老亚洲人支系
https://i.imgur.com/YVcnWfC.png
这张图虽然过度简化,但也能大致看出不同Y染色支系,在亚洲的迁徙分布状况
可以大致看出, Q N 早期分布地偏北亚一带,O系则比较偏南
此外,关于NO进入东亚,是走北线(经西伯利亚)还是南线(经中国西南)
目前仍有争议
以下便逐一叙述在汉人中有分布的各类Y染色体支系
一. O2a 华北新石器三大支
https://i.imgur.com/gFXKo4v.png
O2a 是汉人/中国人中,较主流的Y染色体支系,共祖于距今约两万三千年前
其中汉人的O2a,有颇高的比例,又分别属于O2a底下的三大下游支系
分别为
O-M117 ( 13190年前共祖 )
O2a-002611 ( 12770年前共祖 )
O-F114 ( 15330年共祖 )
其中Y染色体属于这三个支系的汉人,又有颇高比例,为三个支系底下
下游 O-F8(7030年前共祖) / O-F11(9490年前共祖) / O-F46(9280年前共祖)
的后代
在复旦大学的论文
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4149484/
之中,便有提及,约有 40% 的汉人属于此三个下游支系的后代
(复旦大学论文的共祖年分与23魔方计算出的共祖年分有差异,
本文中采用23魔方算出的年分)
O-F8 O-F11 O-F46 三个下游支系,皆广泛分布于中国北方的新石器文化
这三个支系虽是从北方起源扩散,但在当代的南北汉人中,皆有高比例分布
这些支系虽有部分在史前时代,便已在中国南方,
但也不必过于低估历史时代南下的比例,仍有不低的比例源于历史时期的南下
部分在史前时代南下的分支,在上表中便已单独列出 (如 O-SK1730)
这些支系的下游中,也有一部分是在距今三千~五千年前,
从北方溢出,流入楚地或长江流域,之后再经由楚人带至更南方的地域
以至于这些支系虽是自北方扩散,但在中国南北分布的比例仍算颇为接近
例如 O-F17 ,便是 O-F11 底下一支5530年共祖的楚地支
https://i.imgur.com/QqtuI8s.png
https://www.23mofang.com/ancestry/ytree/O-F17
(1). O-M117
在上面三个中国北方起源的支系中,O-M117被部分学者,
认为可能是原始汉藏语系人群携带的Y染色体支系
汉语与藏语 缅甸语同源(具有共同祖先),在语言学界是没有争议的
从基因上来看,汉人与缅族 西藏人 确实有部分共享的基因
在Y染色体上,汉人与西藏人 缅甸人共享的基因便是 O-M117
O-M117在西藏人 缅人中皆有大量分布
超过30%的西藏人与缅人的Y染色体为 O-M117
但另外两支中国北方起源的 Y染色体支系,在西藏人与缅人中却罕有具备
所以有些学者以此推断,认为O-M117是原始汉藏语人群的特色Y染色体
如图,O-M117的分布状况,明显看出在西藏与缅甸高比例分布
https://i.imgur.com/9ao70fN.png
英语维基百科相关页面:
https://en.wikipedia.org/wiki/Haplogroup_O-M117
O-M117在中国的分布状况:
https://i.imgur.com/FMx4KzU.png
(上表是几年前的数据,与增加大量样本后的最新数据,在比例上会稍有差异)
O-M117虽然可能是原始汉藏语人群携带的Y染色体
但其下游中,有一支3600年前共祖的支系O-SK1730
在史前时期就流入广东广西,
在今天的广东人中占比5% (广东广府人 7% 客家人3% 如上图),
广西占比10%(广西汉人占比 8.7% 如上图)
两广人中的 O-SK1730,是属于O-M117的藏缅语族分支 O-Z25921( 6180年前共祖) 的下游
推测是史前时代,藏缅语人群南下时,有一支溶入广东广西土著中所致
福建的 O-M117 占比偏高,是因为魏晋南北朝时,
在福建爆发的前两大Y染色体支系,皆属于 O-M117底下的分支
以至于拉高了 O-M117 在福建的比例
(2). O2a-002611
O2a-002611( 12770年前共祖 ),是 O-F11(9490年共祖)的上游
https://i.imgur.com/XsjG0p0.png
不论是在汉人还是闽南人中,都有不低的占比
其也是一支在中国北方距今4000~10000年前的新石器文化中,有大量分布的支系
此外,O2a-002611 也存在于韩国人与越南人中
9%的韩国人y染色体属于O2a-002611,在越南则为14%
但从
https://onlinelibrary.wiley.com/doi/full/10.1111/j.1759-6831.2012.00244.x
这篇论文的论述来看
越南人的O2a-002611可能在7000年前便已与中国的O2a-002611分离
另一篇关于 O2a-002611的文章
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5430735/
这两篇论文,对O2a-002611的起源地,都没给出确切的结论
尽管如此,从中下游支系的分布状况来看,南方汉人的O2a-002611
应该仍主要是源于历史时期北方汉人与楚人南下的结果
二. 其他 O2a底下的大支系
1.O-AM01822 (O2a2b2) (15470年前共祖)
https://i.imgur.com/9dbnrjp.png
O-AM01822也是一支早期分布于中国北方的支系,
其底下大部分的下游也有比较鲜明的北方特色
不过其下游有一支O-AM01756为南岛语族支,参与了南岛语族的成型
(5800年共祖)
为玻里尼西亚人的主流Y染色体单倍群
(不过福建人的O-AM01822 大部分跟南岛语族支没什么关系,
虽然O-AM01756仍有在福建测到少量样本)
https://i.imgur.com/zDeUwwF.png
https://www.theytree.com/tree/O-AM01756
https://i.imgur.com/qj0gJWS.png
2. O-M188 (O2a2a) (18190年前共祖)
https://i.imgur.com/MhFMO7x.png
O-M188为一支南方色彩比较鲜明的支系
其下游支系 O-M7 (13700年前共祖) ,
为在苗瑶语族,南亚语族 族群中,都有广泛分布的支系
在中南半岛人,东南亚南岛语族,都有一定占比
https://en.wikipedia.org/wiki/Haplogroup_O-M122#O-M7
从上面英语维基百科的资料来看,大约10%的马来人 印尼爪哇人Y染色体类型是O-M7
而从
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4083334/
这篇论文来看
同样,大约10%的马来人、印尼人、越南人,6%的泰国人 Y染色体为O-M7
但O-M7在台湾原住民中几乎没有分布,在菲律宾人也很少见
故可以推测 东南亚南岛语族的O-M7,
是早年另一支从中南半岛南下的古南亚语人群所带入的
O-M7在中国的分布状况,如图:
https://i.imgur.com/boO5zC6.png
https://i.imgur.com/uLW1ltw.png
与苗瑶语族在中国分布的地区(贵州湖南),重叠性还是比较高的
O-M188 底下的另一分支,上表中有单独列出的 O-M159 (8020年前共祖)
可能是闽粤赣土著来源
https://i.imgur.com/UzSH4gV.png
https://i.imgur.com/sCt2puR.png
在闽南人中占比约 4% ,广东的客家地区也有约3%~4%的占比
此支系在东南亚也有极少量的分布, 1.04%在西印尼,0.68%在菲律宾
(根据英语维基百科,但样本数极少,所以东南亚的比例参考看看即可)
https://en.wikipedia.org/wiki/Haplogroup_O-M122#O-M159
三. C底下的大支系
https://i.imgur.com/bf1vpv8.png
1. C2b (17030年前共祖)
俗称C北支,主要分布在北方游牧民族中,在蒙古人 通古斯民族中皆有广泛分布
2. C2c1 (31160年前共祖)
俗称C南支,后代绝大多数属于10430年前下游C-F978的后代
于一万年前便已广泛分布于黄河流域
四. D底下的大支系
https://i.imgur.com/olCoKxw.png
1. D-F1070 (23810年前共祖)
https://i.imgur.com/3ExVJcu.png
广西湖南广东土著支
一半以上的后代,聚集在下游
D-Z41068 (3380年前共祖) 这个广西土著支底下
有趣的是,D-F1070虽然是土著型的支系
但在广西汉人中,占比比广西壮族还高
梧桐市是一个汉族比例为 97% 的城市
(广西人口中约有三分之一是壮族,二分之一是汉族)
2. D1a1 ( 17300年前共祖 )
可能与历史上氐、羌等藏缅语族群有关
分布在中国西北 西南一带 (西北西南一带受古藏缅语祖群的影响比较明显)
西藏人的D就属于这个类型,D系在藏族中占比高达40%
是在原始汉藏语人群进入西藏以前,西藏地区的土著类型
五. O1a底下的大支系
https://i.imgur.com/f9VovHu.png
O1a是早年分布于中国南方的支系
此外,从上面提到的论文
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4083334/
之中,可以看出
台湾原住民各族的y染色体
有高比例属于O1a1(别名O-Z23193) (15770年前共祖)
在台湾原住民各族占比 50%~90%
而中国的O1a绝大多数也属于O1a1的后代
此外台湾原住民各族中,也有10%~20%属于O1a2
O1a2在中国的分布就比较少
其下游5680年共祖的O-F3288
https://i.imgur.com/G5uxA1B.png
聚集在广东广西与西南一带
中国的O1a支系,创建了长江流域的良堵文化(距今5300年前至4000年前)
不过良渚文化后来衰败了,也使得O1a在繁衍上后继乏力,
后来一定程度上被北方的O2a支系稀释掉
O1a现在在中国南方能占15%~20%
很大程度上,还是凭借春秋时期爆发的繁衍王者 O-F619
凭一己下游之力,大幅拉高了O1a在中国南方的占比
此外O1a也是在东南亚南岛语族分布广泛的支系
六. O1b底下的大支系
https://i.imgur.com/LYTQRur.png
O1b1a2(O-Page59) 主要分布于中国东部沿海省份等地
O1b2常见于朝鲜半岛、日本,在日韩人中占比30%以上
其他O1b1 主要分布于中国南方与东南亚
1. O1b1 ( 26840年前共祖)
O1b1在越南人中占比约四成,在广西壮族中占比约50%,广西汉族中占比约20%
在越南人 广西壮族 泰国人等 南亚语系 壮傣语系族群中均广泛分布
在南岛语系的东南亚人(马来人印尼人)中也有分布,可能是被古南亚语人群带过去的
其中广西壮族与广西汉人的O1b1,
主要集中于O1b1a1(O-PK4)这个13050年共祖的支系底下 (这个支系在东南亚也广泛分布)
O-PK4在中国的分布状况:
https://i.imgur.com/r0EryYA.png
相关来源:
https://en.wikipedia.org/wiki/Haplogroup_O-K18
https://www.23mofang.com/community/602e26d236f034000672e728
2. O-page59 (O1b1a2 / 16050年前共祖)
可能是早年分布在中国北方的支系,其一半以上的后代
都聚集在下游3690年共祖O-F3323支系底下
该支系底下又有同年代福建支
https://i.imgur.com/7Gh8cbF.png
可能是三千多年前,南下进入福建的分支
该分支也拉高了 O-page59在福建潮汕的占比
七. R
https://i.imgur.com/hEG3w0B.png
R是在欧洲人 印度人 中亚人中都有广泛分布的Y染色体
在维吾尔族中也有广泛的分布
是古印欧语系人群携带的Y染色体支系
部分中国早期的游牧民族也有携带R
汉人中的R,可能是源于早期的游牧民族 元朝的色目人 其他西域来客 或 印度人
https://i.imgur.com/zGUCVwy.png
https://i.imgur.com/d7vg2jt.png
R系在泉州的占比,比起其他南方地区偏高,
可能是因为南宋时泉州曾为中国第一大国际贸易港,有较多的异域来客所致的
八. N
https://i.imgur.com/YCTNoc2.png
https://i.imgur.com/nLvU4NY.png
1. N1a (N-F1206) (16720年前共祖)
除了在汉人以外,在北亚人 芬兰人中也有广泛的分布
N1a在中国的分布
https://i.imgur.com/5g25rmh.jpg
2. N1b (15910年前共祖)
距今5000~10000年前便已广泛分布在中国北方的新石器文化
其有一半以上的后代,聚集在6670年前共祖的下游N-M1819底下
N-M1819在藏缅语族群中也有分布,可能是原始汉藏语人群携带的y染色体
N-M1819在中国的分布状况:
https://i.imgur.com/vSy4DRU.png
下游有4310年共祖的分支N-F1525,主要分布在中国西南
https://i.imgur.com/1xe9YX9.png
可能与藏缅语族的某一支南下有关
九. Q
Q系是美洲原住民的主流Y染色体,此外在北亚人群中也有分布
https://i.imgur.com/4EJhwjW.png
1.Q-M120 (9090年前共祖)
其在中国绝大多数的后代,集中在 4380年前共祖的下游分支Q-F1626底下
该支系的分布较偏中国西北(陕西山西),可能早年的起源在中国西北一带
Q-F1626在中国的分布状况:
https://i.imgur.com/wvarBjD.png
十. 南岛语族的来源
https://link.springer.com/article/10.1007/s00439-015-1620-z
该篇跨国研究论文中的内容,为透过父系y染色体 常染色体 母系mtdna
探讨东南亚南岛语族的人群来源
we analysed 2216 mtDNA sequences from Island Southeast Asia (556 from the
Philippines, 340 from Borneo, and 1320 from the rest of Indonesia), including
320 new sequences from ISEA (183 from Sabah, Brunei and Kalimantan in Borneo)
论文中研究了556个菲律宾人 340个婆罗洲人 1320个其他印尼人等等
https://i.imgur.com/zYuqN8D.png
该研究发现,东南亚南岛语人,其y染色体与母系粒线体,共祖的支系集中在三个年代
第一批为距今2万~5万年前的支系
第二批为距今8000年前的支系
第三批为距今4000~5000年前的支系
再加上台湾原住民的基因支系中,缺乏东南亚南岛语人群有的支系
故该文推断出东南亚南岛人群,基因来源于三波人的南下
其中第一波为老亚洲人(Y染色体为 C D)
第二 三 波皆为新亚洲人(Y染色体O)
The mtDNAs coalescing at the time of the first settlement (~50 ka) accounted
for ~10 to 20 % of modern mtDNA lineages in ISEA.
第一波人(五万年前移民)贡献了今东南亚南岛语族 10%~20%母系粒线体
Overall, the migration at ~8 ka contributes the most lineages to the current
gene pool of ISEA with a fraction of ~40–50 % in both mtDNA and Y-chromosome
variation
第二波人贡献了40%~50%的父系与母系基因
A previous survey (Karafet et al. 2010) also suggested that O3, O2a1 and O1a*
entered ISEA from the mainland before the Neolithic period.
一个之前的研究指出,部分东南亚南岛语人的基因,为新石器时期以前,
从大陆东南亚(中南半岛)进入海岛东南亚
(这一段指的是第二波移民的来源,从常染色体来推测,第二波移民可能是
来自中南半岛的古中南半岛土著人群)
第三波人应该就是从福建或台湾南下的古南岛语族群,在4000~5000年前进入海岛东南亚
但文中也怀疑了,第三波人可能也包含其他从中南半岛南下的成分
文中另外附了常染色体分析结果:
https://i.imgur.com/F3ogM1P.png
常染色体分析的方法,一般会取一个K值
然后按照所有测试者的基因异同性,分成K类
同一类的基因有较多相同的成分,所以推断那一类的基因可能代表某个曾经存在的古人群
当然,这类的推断,未必准确,K值如果设的不当,很容易造成较大的误差
某种程度上像是先射箭再画靶
但这种分析,仍然能用来判断不同人群的基因远近程度
从上图可见,K=10时
可以分析出一个灰色的古南岛语人群成分
该成分在台湾原住民中占比颇高,在菲律宾人中也不低,
但在印尼的主流民族爪哇人中,只占了不到一半
浅绿色的成分,在云南与泰国的南亚语系少数民族中
皆有大量分布,此外在印尼人马来人中,也有不低的占比
所以推断浅绿色成分,可能可以代表古南亚语人群的基因
他们也是第二波进入海岛东南亚的人
此外也能看出,马来西亚的马来人有少量印度人血统
此外也能看出,广西人与泰国人,共享蓝色成分
泰国人,从语言学上判断,属于壮傣语系的民族
(泰语与壮语的差异,比闽南语与粤语的差异还小)
是近一千五百年内,来自中国广西的壮傣民族,
有一分支先进入云南,再进入中南半岛后,
同化当地南亚语系土著的结果
(虽然这样讲也不准确,泰国人除了语言是壮傣语系的语言以外,文化文字宗教上都是
全盘采用中南半岛的本地文化 (柬埔寨/孟族文化等))
所以图中也能看出,泰国人与广西人也有一定程度基因共享,
这可能部分是源于历史上壮傣民族的南下
下图中的浅蓝色成分
应是源于第一波移民(老亚洲人)的基因
因为与东亚不同
在东南亚,仍有少量 没什么新亚洲人血统的 纯血老亚洲人族群存在
(例如澳大利亚原住民)
他们人口数很少,不论基因还是长相,都与主流东南亚人差很大
(一般肤色偏黑,类似非洲人)
此外也可以对照另一篇论文的常染色体分析(我之前文章引用过的)
https://i.imgur.com/5XfqiBL.png
来源:
https://www.science.org/doi/10.1126/science.1177074
此图也能得出与上一篇论文,相似的结论
此外也能看出,虽然广西壮族与泰国人一样,语言上都是壮傣语系的族群
但常染色体上,比起泰族,广西壮族更接近广东汉人
那应该是因为壮傣语系群族在进入中南半岛后,吸收了大量本地土著基因的结果
从长相上也可以看出来,比起广西壮族,泰国人一般长的更像东南亚人
作者: moslaa (万变蛾)   2022-12-27 10:18:00
考杯 你这样认真整理研究 我也要加油 >o<我期望自己本周推出某一篇新文,依据资料都凑齐了 嘻嘻好几个话题想写 都没什么时间 >o<
楼主: a46911a149 (a149)   2022-12-27 10:40:00
我也希望历史版能有更多不同的文章,哈哈
作者: IAMCSH (BorninMCMXCVIII)   2022-12-27 13:53:00
大推,真的很认真。
作者: moslaa (万变蛾)   2022-12-27 15:05:00
这么认真的人 真的很少了有时候回头去看旧文 比如2010年的 留言帐号多数我不熟感觉现在会来这里的人更少了。还有人愿意这样整理 真是... Q^Q基于高龄化少子化等时代因素 我明白历史板要兴旺不可能(是说 大概也没兴旺过)但至少希望延缓没落瓦解的时间点不然 像我这种现实没朋友的边缘人 只有这里有人听我废话啊感谢所有曾经回应我的板友们 那怕是嘘也是一种回馈感动 我爱大家 大家圣诞愉快 元旦愉快 ^_^
作者: kingoftwray (kingoftwray)   2021-01-02 22:52:00
推 非常完整的整理
作者: jack0123nj (墨坎)   2021-01-09 19:00:00

Links booklink

Contact Us: admin [ a t ] ucptt.com