[建议] 用于处理分字段文字档的程式语言或软件

楼主: Neisseria (Neisseria)   2017-02-21 14:03:51
我们实验室最近在跑某个科学运算软件
出来的格式是以 tab 分栏的文字档,如下例:
case 2 case 4 case 1 case 3 ctrl 3 ctrl 2 ctrl 4 ctrl 1
item 1
item 2
item 3
...
主要的问题在于 case 1, case 2, case 3, ... 和 ctrl 1, ctrl 2, ctrl 3, ...
的顺序会随机排列,而且找不到参数去改变这个行为
目前只能手动将其按顺序重排
我自己先前是用 GAWK (GNU AWK) 来处理
但是现在这部分想转给其他同学做,而这些同学大部分没啥程式设计经验
想问有没有相对友善的程式语言或工具可用?
我自己有想到以下方案:
1. Babun (Cygwin) + GAWK
2. CSVKit
3. Excel
选项 1. 对没 Unix-like 系统经验的人来说似乎不太友善,我介绍几个身边的人
使用,似乎最后都不了了之。虽然 AWK 其实不难学,但对不懂文字流的使用者来说
似乎不太好上手
选项 2. 似乎有点希望,虽然也是要打指令,至少比 AWK 好学一些些
选项 3. 当然可行。只是当 case 和 control 的数量变多后,就变得比较不好处理
而且当 item 数变大后,Excel 反应会比较迟顿
或是其他方案也可以
尽量以 Windows 上也可行的方案为主
先在这里感谢各位大大看完我的问题
[Update]
后来找了这个...
https://github.com/BurntSushi/xsv
用 Rust 写的 操作难度和 CSVKit 差不多 功能比较简略一点
好处是可以编译成单一的执行档 操作速度也不错 (有 benchmark 资料)
我只要预先编译和写简易 tutorial 就可以了
对于疑心病重 怕别人放料的 就传网址叫对方自己去编 www

Links booklink

Contact Us: admin [ a t ] ucptt.com