[问题] bioinformatics, XStringset格式

楼主: cb1040 (Absurde.Y)   2015-11-09 17:12:54
[程式咨询] Bioinformatics的XStringset格式转换
[入门]
2010修课玩过VBA,不过之后就没了直到今日,也算新手吧
此版首po,请前辈们指教
[问题叙述]:
小弟我刚踏入bioinformatics,用Bioinfomatics with R cookbook 自学中
在MSA, Multiple Sequence Alignment部分,
使用下面这个package时卡关了
muscle, (multiple sequence comparison by log-expectation)
我的问题是:
如何转换XStringset格式,且是多笔资料转换
(有查询Biostrings 中AAString功能,但仍不知道如何使用)
[程式范例]
这是原书步骤
http://imgur.com/eFWyDjk
http://imgur.com/94zPqQQ
这是会用到的fasta档案
http://tinyurl.com/q6kjpru
以下是我的内容
pastie版 (第一次使用,还不熟,请见谅)
http://pastie.org/10540288
自己截图版
http://imgur.com/ecLpoF1
http://imgur.com/4BqdEng
http://imgur.com/rT9PEqr (后面是其他物种的序列,共十种,我就不贴了)
http://imgur.com/0WvRNXJ
因为教材有点年份,code有些出入
例如install.packages("muscle")会找不到东西
或是没有muscle::read.fasta这个功能
这里再说一次我的问题
有查询Biostrings 中 XStringset、AAString功能,但仍不会使用
想请问: 如何将多笔资料转换成XStringset格式
[环境叙述]:
直接截图
http://imgur.com/u42f95X
[关键字]: R, muscle, Biostrings, multiple sequence alignment, XStringset
作者: Godkin (山里的人)   2015-11-09 23:57:00
用readDNAStringSet("fastaMSA.fasta", format="fasta")读这个package请用bioconductor上的新版本多笔资料可以直接通通塞到同一个fasta档里头跑
楼主: cb1040 (Absurde.Y)   2015-11-10 10:25:00
我用source(http://bioconductor.org....) 然后biocLite ("muscle") 安装,这样应该是最新版对吧我用readXStringSet成功了!!谢谢!!!关于第三点,是我必须额外存一个新的fasta档案对吗
作者: Godkin (山里的人)   2015-11-10 17:16:00
对, 可以用cat去串联每个fasta档

Links booklink

Contact Us: admin [ a t ] ucptt.com