我有两个DNA database:
database A 有约18 万条序列,每条约500nt
database B 有约5 万条序列,每条约5000nt
我希望让这A、B两个database 互相比对,
以找出A、B两个database中,共有相同20nt 的两笔序列。
我先用 "foreach" 将database A 每条序列分开,
再用 "substr" 每20个nt 搜索 (DNA 的正反股都要搜索)
再用 "foreach" 将database B 的序列逐一检查跟 "substr" 相同者
结果... 我用小一点的database 测试并且估算,
这样用笔电算完,总共要四千天左右 XD
想请教先进们
是否有节省时间的运算方式?
或是换好一点的电脑会算比较快吗?
先谢不吝赐教!!