[观点] 续谈现代中国-东南亚-日韩人的来源 (二)

楼主: a46911a149 (a149)   2023-04-04 03:11:15
四. 东南亚人的来源与基因组成
1. 东南亚矮黑人
东南亚矮黑人
泛指在南亚语人群/南岛语人群进入东南亚前,东南亚与大洋洲的土著人群
包含 和平文化人群 大洋洲人群 等等
在英文中,通常用 Negrito 指称东南亚矮黑人
(虽然我不确定这个词汇是否包含所有矮黑人,还是仅仅指菲律宾印尼一带的矮黑人)
矮黑人其实不是一群有共同血统的人群
不同的矮黑人族群基因差异甚大,基因多样性高
共通点是肤色都偏黑,类似非洲人的肤色
此外其实没太多的共同点 (不同的矮黑人族群,语系 长相 可能都不同)
可以把矮黑人看成,没有演化成黄种人的早期东欧亚人的后代
(因为矮黑人一直住在热带地区,无法演化出浅肤色)
他们也是东南亚与大洋洲历史悠久(数万年)的土著人群
如下图,可以看出
不同的矮黑人族群 Mlabri 美拉尼亚人 Aeta (菲律宾矮黑人) 等,
都各分析出一种完全不同的常染色体成分 (不过有些人群语言上已被南亚语系同化)
https://i.imgur.com/BNVALlK.png
现存的矮黑人族群,包含
菲律宾矮黑人 Aeta
马来西亚矮黑人 Semang
安达曼人 (位于印度统辖的安达曼群岛)
澳洲土著
新几内亚土著
等等
东南亚矮黑人族群的Y染色体,包含
C D底下的某些支系
K* S M 等等
(K的后代中, O与N演化成黄种人,而S M (可能还包含K*) 待在东南亚,
所以为矮黑人族群携带的Y染色体)
N, O1 与 O2 应该是专属于东亚人的Y染色体
(此外 C底下的 C2 也与东南亚矮黑人没有关系,只有 C1 与东南亚和平文化人群有关)
https://i.imgur.com/o8vsHUU.png
但现存的矮黑人中,有些也或多或少混到东南亚人的血统
2. 南亚语系
南亚语系 (Austroasiatic),其实跟南亚(印度)毫无关系
是东亚/东南亚人的语系
旧称 孟高棉语系
(孟高棉语族,其实算是南亚语系底下的主流语族)
目前主流的假说,可以参考这支影片
https://www.youtube.com/watch?v=RExAsmaXxIw
认为南亚语系大约在 4000~5000年前,从云南一带进入中南半岛
之后曾一度占据整个中南半岛,又一定程度扩散到海岛东南亚(印尼-马来西亚)
直到藏缅语与侗台语人群之后的南下,大幅削减南亚语系在中南半岛的领地
如图,根据主流假说,南亚语系的巅峰期(西元前1000~0年):
https://i.imgur.com/zC7bTKe.png
现代南亚语系分布:
https://i.imgur.com/j55jOEb.png
南亚语系,在中南半岛,呈现高度的语言多样性,
确实能展现出它在中南半岛比较悠久的历史
而南亚语系,在中国,只有在云南(靠近中南半岛的边境)有零星分布
反观侗台语系,在中南半岛的语言多样性极低 (反而在广西海南,呈现较高多样性)
东南亚的侗台语,几乎都聚集在泰语支,这支共祖时间不到1500年的语支底下
南亚语系的名人:
孟人(泰国土著,在缅甸也有分布)
高棉人(柬埔寨主体民族)
佤族(云南少数民族)
蒙达人(Munda) (印度少数民族)
越南人(京族)
芒族 (越南人的兄弟民族,语言属于越语支,但汉语借词更少
疑似躲藏在深山丛林里,没有受汉文化影响的越南北部土著的留存)
其他大量知名度低,人口数少 的中南半岛/马来半岛 少数民族
南亚语系的特色Y染色体:
O-PK4 (O1b-> O1b1a1)
O-M7 (O2a-> O2a2a -> O-M7)

3. 侗台语系
侗台语系(Kra-dai),又名仡台语系,壮侗语系,侗泰语系、台-卡岱语系等等
英文称为 kra-dai语系 或 Tai–Kadai语系
侗台语系分支图:
https://i.imgur.com/cTQVy3m.png
现代侗台语系分布图:
https://i.imgur.com/vDmLWCh.png
可以看出,壮傣语族/语支(Tai),是侗台语系底下的一个分支
而泰语支(Southwestern Tai),是壮傣语族/语支底下的一个分支
用 Tai 来称呼壮傣语支,主要是西方学者提出的名称
中国的壮族,不使用 Tai 一词作为族群的称呼
仅有泰语支(Southwestern Tai)底下的人群使用 Tai作为族群的称呼 (也包含中国的傣族)
壮傣语支,从语言学上来判断,同源的时间其实很晚近,大约成型于两千年前
壮傣语在全盛时期,应该曾一度大致覆蓋广西全境
且壮傣语在广西的扩散,也是很晚近的事,几乎是在历史时期(南越国/秦汉以后)
才在广西境内扩张,同化了广西更早的其他土著(例如同属侗台语系的仡央语人群)
现在的广西壮族,指的就是使用壮傣语的人群(排除泰语支)
广西虽然在西汉时,便已并入中国,
但一直到南宋,都是土著语言习俗占主体的地方
(类似越南,但广西在宋代,汉化程度可能不如越南)
(可以参考岭外代答 方舆胜览 等 宋朝人的著作)
一直到南宋,才渐渐开始有较多汉人迁入广西,减低壮傣语在广西的覆蓋范围
在现代,
广西的东部,是纯粤语区,
北部,是汉语西南官话与北部壮语的混合区
西南部,是比较纯的南部壮语区 (虽然也有一些粤语分布)
中部,是壮语与粤语 西南官话的混合过度带
此外在越南北部,贵州,也有壮语分布
而广东的情形,其实与广西也有点类似
广东虽然在西汉时,就并入中国境内,
但也有一段时间,是土著语言风俗都很浓厚的地区
(可以参考冼夫人的事蹟,洗夫人是 南北朝/隋代,广东土著中的名人 )
广东的土著,早年被称为 俚僚,俚与黎(海南黎族)是同义词
僚是壮傣语民族的自称,也是对广西壮族的旧称
可见广东的土著,跟广西壮族与海南黎族可能是性质类似的一群人
现代东南亚的老挝,寮 与 僚 可能是同源词,都源于壮傣语人群的自称
此外,近现代粤西(广东西部),有几个村子,
被发现村内讲的方言属于侗台语系的语言 (虽然当地人未必知道,可能以为是汉语方言)
(参考 标话 吉兆话)
这也反应在Y染色体上,根据微基因的网站/23魔方的基因库,
广府人与广西壮族 泰人,共享一部分共祖年代晚至两三千年前的支系
可见广东的土著,与广西壮族分家的时间确实非常晚
例如 O-SK1730 就是一支典型的壮傣或侗台特色支,
在泰人/广西壮族/广东广府人中都大量分布
https://i.imgur.com/2wAIylE.png
https://i.imgur.com/70GLdDp.png
https://i.imgur.com/P2ZOYQm.png
可见 O-SK1730的分布,由西向东递减,粤西最高频,可达7%~9%
珠三角 4%~7%,粤东客语区 2%~3%
https://i.imgur.com/y6HDOEd.png
这支分布比例最高的地方,落在广西东部的粤语区,可达12%~15%
其次才是广西西部的壮语区,大约落在9%~10%
可见O-SK1730早年的起源地,应该在广东,或者至少是粤西桂东一带,向西扩散
以至于在粤西桂东粤语区的占比,不低于西部的壮语区
O-SK1730虽然是共祖时间三千多年的支系,
但有约一半的后代,聚集在2500年共祖的下游 O-Z26029底下
而这支2500年共祖的下游,同样在广东广西人与泰人中都广泛分布
https://i.imgur.com/6CfkNDo.png
https://www.theytree.com/?snp=O-Z26029
https://www.23mofang.com/ancestry/ytree/O-SK1730
不过当然,广东的土著成分,与广西壮族的成分也没有完全重叠
因为土著人群也会存在基因上的地域差异
广西壮族的y染色体支系中,包含了一些近两三千年才(疑似)从广东流入的成分
也包含一些更早就流入广西的土著成分 (或许与侗台语系的仡央语人群有关?)
也包含一些疑似与南亚语人群有关的成分(而在广东较缺乏,例如O-m1284这支Y染色体)
此外,粤西(广东西部) 桂东(广西东部) 的粤语区,土著浓度也高过珠三角
可能因为珠三角是广东经济政治中心,又与客语区接壤等原因,有较多移民所致
(但粤西桂东的客家/闽人移民也不少)
不过珠三角的土著类型,也大致与粤西桂东属于同一个类型
而现代的广府人群,虽然有显著的土著成分,但土著成分应该也不是主体
从Y染色体来看,岭南土著来源的比例可能落在 20%~40%之间
(不含湖北江浙江西移民携带的南方成分)
(但这不是来自严谨学术来源的推测)
当然,广西的侗台语人群,也不见得是历史悠久的土著
侗台语人群应该是在距今四千~五千年内,才(疑似从江西湖南)流入两广
广西五六千年前的古人群(隆林人等),也测过基因,与现代的广西壮族差异很大
甚至不是东亚人种
至于东南亚的泰人,从基因上来看,确实与广西壮族存在不少联系
像是参考23魔方与微基因所列出,秦汉时期的广西大族
通常都在泰国有不少的后代
例如秦汉时期,广西第一大族 (广西韦氏)
在现代广西人口占比接近7% (其中60%是壮族,30%是汉族),
同样在泰国有不少的后代
https://i.imgur.com/O60IROH.png
其他一些战国~秦汉时期的广西(壮族)大族,也是类似
https://i.imgur.com/H0Rsv4M.png
(壮族起汉姓的时间其实没那么早,只是同一氏族/部落的人会起同一个汉姓,所以
同一支Y染色体下有主流姓氏)
这也符合从语言学与一些历史背景做出的推断
认为泰人大约在距今1000~2000年前,才从广西一带扩散至中南半岛
可以参考,侗台语系扩散史,这个影片
https://www.youtube.com/watch?v=PT9v_LoJb4g
但这个影片还是描绘的太保守了,
侗台语唐宋以前,覆蓋范围应该要包含广东(至少粤西珠三角)
现代侗台语系的名人:
泰人(含 泰国/老挝主体民族,缅甸的掸邦)
壮族(含 越南的侬族)
傣族(中国境内的泰语人群)
海南黎族
侗族/水族/仡佬族/临高人 等等
侗台语的特色Y染色体
O-PK4 (O1b-> O-PK4)
O-SK1730 (O2a -> O-M117 -> 0-F8 -> O-SK1730)
此外 O1a 或者其他Y染色体底下也有一些疑似可以当成侗台特色支
4. 越南人
越南北部,在距今约2100~2300年前,被南越国并吞
之后到了西汉初年,又被并入汉朝的版图
之后越南在中国境内,一直持续到宋代,越南才独立成一个国家
越南独立后,在中南半岛大肆扩张,灭了在其南方的占城
(占城为南岛语系的占族人建的国家,受印度文明影响)
之后越南并吞了占城的领土,又并吞了部分柬埔寨原本的领土,逐渐成为当代越南
越南刚独立时 (宋朝时) 的版图:
https://i.imgur.com/NXzlQQ3.png
越南在大肆扩张,消灭占城,蚕食柬埔寨后的版图 (即现代越南版图):
https://i.imgur.com/5uHHsHQ.png
越南的主体民族 京族,占越南人口86%
主要发源于越南北部的红河平原
也是汉代~宋代时的交趾/交州人的后代
交州在宋以前,发展程度还在广西之上,曾经在唐朝时出过本土进士
至于越南人(京族)在基因上,
应该主要是 南亚语土著/侗台语人群/历史时期流入的汉人
以某种比例混合
越南人的y染色体构成,找不太到优质的样本来源,
只有一些样本数很小的来源,能勉强做为参考
例如英语维基百科引用的,某篇样本数为70的来源
显示出越南人 O2 40% , O1b 32.9% , O1a 5.7% ,N 2.9%,C 4.3%,D 2.9%
另一篇较新的论文:
https://i.imgur.com/j8jRAJW.jpg
来源:
https://www.nature.com/articles/s41431-019-0557-4#Tab2
但这篇的样本数更少,只有50
另外某张来源不明的图:
https://i.imgur.com/UnfmJWc.jpg
(这张图应该来自多年前的数据,所以使用过时的名称,
O3指的是现在的O2a,O2a是现代的O1b)
另一个来源:
https://i.imgur.com/aycqElA.png
https://www.researchgate.net/figure/Classification-tree-of-26-NRY-haplogroups-along-with-their-frequencies-in-four_fig2_224959093
这篇的样本也是非常小
另一个英语维基百科提供的资料:
https://i.imgur.com/V3NZbHt.png
https://i.imgur.com/P3nHZ9n.png
总之越南人的O2a 与 O1b,应该分别介于 30%~40%之间
且越南人的 O1b 绝大多数属于 O-PK4
然后也混有一些 O1a C N 等等 (但因为样本太小,无法确定具体的比例)
越南人的 O1b/O-PK4,可能源于侗台语或南亚语人群
至于越南人的O2a,里面应该有3%~10% 属于 O-M7
O-M7应该源自南亚语人群
此外越南人的O2a ,可能来自历史时期的汉人移民,与侗台语/其他土著人群自带的成分
而除了 O-M7 以外,越南人的O2a底下的类型似乎很杂
而且不同来源显示的比例不太一致(因为样本数太小)
根据微基因建的网站,越南人的y染色体支系中,有不少像是源自晚近的汉人移民
但仍然难以估计具体的比例,而且微基因的网站,越南人的样本数量也没有到很多
根据一些常染色体分析工具,越南人的常染色体,是与北部泰人/壮族比较接近的
https://i.imgur.com/QFiNaqw.png
但这是因为晚近的同源关系,还是刚好混出来的比例接近
仍然难以断定
5. 泰人
https://i.imgur.com/vDmLWCh.png
(只有 Southwestern Tai 这支是泰人)
泰人进入中南半岛的时间十分晚近,
大约在距今1000~1500年前,才陆续从广西,扩散进入云南南部,中南半岛北部
之后泰人继续深入中南半岛腹地,移入孟人的地盘居住
当时泰国的土著居民为孟族,
孟族已在今天泰国的领土上,建立数个国家
孟人国家在柬埔寨帝国的势力范围内,与柬埔寨的关系,
可能有点类似 西周与诸侯国的关系 (柬埔寨是西周,孟人国家是诸侯国)
柬埔寨/孟人的文化主要受印度文明影响,信仰印度教/印度传来的佛教
使用印度字母,来创建文字
后来泰人源源不绝的进入孟人的领地后,就起兵反抗孟高棉人的统治,
在当地建立泰人王国
素可泰王国,是现代泰国的前身,由泰人所建立,成立于西元1238年,
泰国中南部,再之前的国家都是孟人国家
不过泰人在中南半岛,建立的王国也不只有素可泰王国
在云南边境,中南半岛北端,在同年代,也有数个泰人建立的王国
(兰纳,澜沧王国等等,后者演化成了现在的老挝)
不过泰人在进入中南半岛时,本身应该是没有很高的文化水平的 (例如没有文字)
所以文化上,很大程度,采用了孟高棉人的文化
包含信仰印度式佛教,用印度字母来创建文字 等等
泰人参考了孟高棉人用的印度字母,替泰语创建了文字
后来泰人国家,陆续把原先孟人的领地都并吞了,
又在中南半岛大肆扩张,并吞一部分马来人的领地
逐渐形成现代的泰国
泰国还差一点与越南一起瓜分了柬埔寨
(幸好柬埔寨遇上欧洲人的殖民时代,成为法国殖民地,法国人还帮柬埔寨要回失土
不然再晚几百年就要被越南与泰国瓜分了)
泰人虽然发源于中国南方,
且因为历史时期的接触,壮傣语支吸收了不少古汉语的词汇
(例如泰语的数词,就有不少源自古汉语,可以明显的辨认出来)
但泰人迁入中南半岛时,受汉文化的影响仍然很小,
而且泰人没有他们进入中南半岛以前的历史记忆
泰人的民族叙事,最远只能追溯到在云南南方/中南半岛建国
再往前就都是神话传说
但传统泰人的民族主义叙事,仍然认为他们是外来者
而不是孟高棉人的后裔
所以在近代语言学兴起之前,泰人与广西壮族,都不知道他们之间有关连
(中国的傣族除外,傣族与东南亚的泰人确实文化上有更密切的关系)
尽管语言上同源,文化上,泰人与广西壮族的差异仍很大
广西壮族在近现代,汉化程度已很高(例如有部分已自我认同为汉人),
也没有受印度文化影响
而泰人主要受 印度文化/孟高棉人的文化影响
泰国人的Y染色体:
https://i.imgur.com/4UCQ7Vn.jpg
来源:
https://academic.oup.com/mbe/article/36/7/1490/5449617
左边是泰族(泰语人群),右边是南亚语系(孟高棉人群)
可以看出,泰人主流的Y染色体,跟越南人一样,也是
O1b 与 O2a
因为样本数很小(每一条都只有几十个样本),加上泰国的地域差异等缘故
不同的泰人样本,在y染色体的比例上,也出现不小的差异
除了 O1b 与 O2a 以外
泰人还有其他成分
C D 可以来自侗台语人群自带的成分,
C 也可以来自晚近的华人移民,D也可以来自藏缅语人群
此外 C D 也可以来自东南亚和平文化/矮黑人人群
N 可以来自侗台语人群自带的成分,藏缅语人群,或晚近的华人移民
R J H 来自印度人 (早年的印度移民,将印度文化传播给孟高棉人)
另一篇泰人的Y染色体来源:
https://i.imgur.com/eOJRuFd.jpg
(O-M111 是 O-PK4底下的分支,O-M324=其他O2a) / (除了LW 与 MO 其他都是泰人)
来源
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5524406/
可以看出,泰国北部的泰人,主要是 O-PK4(O1b) O-M117
混有少量的 O-M7 其他O2a 与 其他成分(主要是 C D O1a 等等)
https://i.imgur.com/b4B48XW.png
C2 也是侗台语人群自带的成分,另外也可以来自汉人/华人移民
至于其他C,上图没有详列底下的类型,不确定是否与和平文化人群(矮黑人)有关
K应该来自和平文化人群(矮黑人)
J H来自印度人
D1a1 是西藏土著/部分藏缅人群的成分,岭南的侗台语人群也携带这种成分
泰人的 O1b 绝大多数聚集在 O-PK4底下,
O-PK4可能来自侗台语,也可能来自南亚语人群
而泰人的O2a ,较多聚集在 O-M7 与 O-M117底下
O-M7来自南亚语人群,而 O-M117可以来自侗台语自带的那支 O-SK1730,
也可以来自藏缅语人群
但泰人的O2a也有其他类型,但这里面也不易判断有多少来自华人移民
有多少是侗台语人群自带的成分,或者另有来源
此外,泰国北部人与泰国南部人,也存在明显的基因差异
在常染色体上,泰国北部人与中国境内的傣族、广西壮族等较接近
而泰国南部人,常染色体与现代孟高棉人更接近
这表示泰国中南部人,应该是具有大量孟高棉血统的
尽管如此,历史上孟高棉人与泰人交流密切,也可能受到泰人的渗透
仍不好轻易的判断,这种常染色体的接近,
有多少是因为 南部泰人主体基因是孟高棉血统,
或者因为孟高棉人也受到泰人渗透
尽管如此,中南部的泰人有大量南亚语/孟高棉基因,仍然是没什么争议的
纵使是泰国北部的泰人,南亚语基因含量也高过广西境内的壮族
关于常染色体,可以参考美国基因公司23andme的常染色体分析
https://i.imgur.com/4dnjdXe.jpg
与泰国人有关的类别:
Chinese Dai (中国傣族)
Vietnamese (越南人)
Indonesian, Thai, Khmer, Myanma (印尼 泰国 高棉 缅甸)
这几个类别中,第三个类别,可以看成泛东南亚成分
第三个类别的共同点,就在于都含有浓度不低的南亚语成分
而第一个类别,可以看成原始泰族成分(以侗台成分为主流,但本身就自带一点南亚语成分
这个常染色体分析,泰国/老挝北部人,会测出较高比例的 Chinese Dai 与 Vietnamese
而泰国南部人,会测出较高的 Indonesian, Thai, Khmer, Myanma
甚至很多泰国南部人,会测出高纯度的Indonesian, Thai, Khmer, Myanma
测出来的结果,与柬埔寨人的结果是比较接近的
某个老挝北部人的测试结果:
https://i.imgur.com/kHB9oZg.jpg
https://www.reddit.com/r/23andme/comments/x0q3br/lao_american_update/
然后这个广西人去测,会是south chinese 与 Chinese Dai以某种比例混合
https://i.imgur.com/hgZlDDf.jpg
https://www.reddit.com/r/23andme/comments/11nd58b/after_21_years_i_know_my_dna_wasnt_expecting/
某个广西人的测试结果,很有可能是壮族
(但测试者是被领养的美国人,所以只知道是广西裔,不知道具体的来源)
下篇待续...
作者: hedgehogs (刺猬)   2023-04-05 19:47:00
推,精彩

Links booklink

Contact Us: admin [ a t ] ucptt.com