[闲聊] Sisyphean tasks

楼主: Neisseria (Neisseria)   2017-04-13 10:29:15
这篇有一些个人主观意识
但小弟不是要刻意引战
希望大家就事情本身来谈论
激发出一些新的想法 感恩
我们实验室有时候需要查询一些数据
目前的模式是我老板跟我讲需求
例如“找出所有的可生成胺基酸的基因”
然后小弟我就用 AWK 或 Perl one-liner
从一些文字档案萃取出这些资讯
然后把萃取出来的结果交给我老板
为什么会用这种模式呢?
因为上游的数据就是存在一些文字档案中
(注:像是 GTF 或 GFF 等档案)
我老板和我确认过 Excel 无法处理
因为档案行数过多 (档案约 2~3 GB 左右)
这种模式运作了一阵子 倒是还算顺利
但时间一久 发现自已好像在重复做一些手工
表面上是在写程式 但每次需要时都重写一次
感觉好像是有数据库 但是要每次手动写 SQL 语法
不知道有没有减少手动的方式
我有想过把资料转为 SQLite database
然后请老板装 SQLite viewer 不确定有没有搞头
或是教其他同学 AWK 或 Perl (别人的小孩死不完 XD)
这就是传承的概念 (烟)
当然 这个模式目前还是会运作下去
只是上来 brain storming 一下
开放推嘘文 感恩 XD

Links booklink

Contact Us: admin [ a t ] ucptt.com