[问题]有关基因分析之 .tepd档与PLINK问题

楼主: sinclairJ (KEEP MOVING FORWARD)   2014-07-13 02:18:26
[问题类型]:
程式咨询
PART1.
最近手上拿到一组有关基因的data
分别是.tped档及.tfam档
在网络上有查到如何将data load进R中的相关资讯如下
http://www.inside-r.org/node/102009
语法:
convert.snp.tped(tpedfile, tfamfile, outfile,strand = "u", bcast = 10000)
但对于上述的用法还是不够清楚
所以想上来询问有人是否也处理过类似的分析
可以指引小弟一条明路
小弟的两个档案名称分别为NC_BP.tped与NC_BP.tfam
有用上述的语法试着load看看 但都还是失败
所以想请问高人 对于这两个档案的话
其完整的语法应该为何?outfile是指我要输出的所在路径吗?(需要先建空白档?)
然后strand和bcast所代表的又是什么意思
PART2.
小弟另外也有查到有关基因这方面分析的软件 PLINK 资讯如下
http://pngu.mgh.harvard.edu/~purcell/plink/
在这边想请教有从事过这方面分析的高人
对于基因染色体序列分析
是否可单纯用PLINK处理就好?
还是必须搭配着R作分析?
因为小弟对于R和PLINK的功力皆属于初心者阶段
所以想说是否可以专心研究其中一个软件来完成分析即可(R或PLINK)
[软件熟悉度]:
入门(写过其他程式,只是对语法不熟悉)
之前大学做专题时有使用过Eclipse开发过APP
[问题叙述]:
请简略描述你所要做的事情,或是这个程式的目的
如上~主要是想利用基因序列的资料
并用资料探勘的手法 找出其有用潜在资讯
但在一开始load资料的时候就卡关了...
[程式范例]:
张贴能够重现错误的程式码,可以帮助版友更快的帮你解决问题
因为手边目前没资料(放在学校)
但又碍于焦急的心态
所以待日后补上
想说先上来询问各位高手~
[关键字]:
选择性,也许未来有用
GenABEL套件、PLINK、基因分
作者: king31815 (口八押系)   2014-07-13 23:07:00
建议利用plink转档,将ACTG转成AB_call的genotype,输出csv之后,在使用R做资料处理与分析会建议使用plink转档是因为...R在这方面真的有点慢
楼主: sinclairJ (KEEP MOVING FORWARD)   2014-07-14 00:35:00
感谢楼上!我会试着用看看 因为资料也有数万笔...

Links booklink

Contact Us: admin [ a t ] ucptt.com