Re: [问题] distance matrix 能否作回归?

楼主: andrew43 (讨厌有好心推文后删文者)   2013-12-08 00:04:02
※ 引述《gsuper (Logit(odds))》之铭言:
:
: 每片样本 , 是一个栖地微生物的菌相组成 , 内部含有约 200~1000 种细菌
: proportional data 总和为 1 (可想像每片样本是一圆饼图)
:
: distance matrix 方面 ,
: 因为欧氏距离等方法不太合理 , 采用演化距离 (UniFrac distance)
:
: 首先先以各个细菌的 16s rRNA 序列数据库作为依据 (约 10000 种序列)
: node 为细菌 , edge 为 16s rRNA sequence pairwise alignment 的 score
: 依照上述资料建了一棵演化树
:
: 依赖这棵演化树 , 一次 input 两片样本
: 计算 weighted UniFrac distance (tree-based & abundance-based)
:
: 概念上是
: sum of occuped edge length and adjusted by abundance of bacteria
你做的工作已经超出我的能力,不过我想我还是可以提供一些想法。
不过这和 R 本身没什么关系了。
1. 假如你已经建好一个距离矩阵,那我想有好几个多变量的方法可以解。
例如 dbRDA 可以有一个以上的自变量来解释该矩阵,
或是更传统的多变量方法来检视不同样点的差异性。
前题是,这个矩阵与套用的分析可以正确地解决你的问题。
2. 既然你也建了亲缘树,那可能可以考虑比较方法中的分析方法。
或许你目前的做法正是如此,但我不懂该课题所以不能说更多。
不过我不了解一件事,就是你的每个抽出样本都有一堆序列,
那你的亲缘树是怎么跑出来的?树的每一枝是一种菌还是一个样点?
所以枝与枝的距离是什么意义?我目前还不了解。
3. 是不是可以将你目前的工作可以描述成
“栖地条件(如温度)如何影响细菌群落相”,同意吗?
是的话,我想分析上的概念和大多数群落生态学的分析方法大同小异。
不同之处只是材料上(物种、功能群或遗传序列)的不同而采用适当的方法或模型。
或许你可以从这个角度来找解决办法。
在这个角度中,最常见的例子就是“不同种类栖地的某类生物相是否不同”,
或是“栖地的某些特定条件如何影响某类生物相”。
只不过你的材料是细菌还外加亲缘树,我没学过,不能给你更多建议了。

Links booklink

Contact Us: admin [ a t ] ucptt.com