※ 引述《Lordaeron (Terry)》之铭言:
: : 后面那两个是不是真的就快我不太确定,只是有文件宣称,我没用过。
: Python vs
: perl
: http://benchmarksgame.alioth.debian.org/u64q/perl.php
: java
: http://benchmarksgame.alioth.debian.org/u64q/python.php
......
: 纯比较,有兴趣的人自已玩玩吧.
岔回原文好了。我不太想提别人的成功案例多漂亮,因为那些案例是累积了多少
个人的多少个人时做出来的。而你我呢,一天顶多8个人时。
我用python工作并且制作产品,最爽的部分就在于XML的处理。我要处理的XML档案
动则上GB的尺寸。XML规格不详,只能看情况,一件归一件。主要的处理方式,是
自己定义需要截取哪些字段资料,拿出来另存为CSV。
path = []
for event, node in xml.etree.ElementTree.iterparse(File,
events=('start', 'end')):
if node == 'start':
path.extend([node.tag])
if node == 'end':
if '/'.join(path) == 'xxx/yyy/zzz':
yield take_values(node)
path = path[:-1]
node.clear()
以上述的程式为核心,写出来之后交出去。交出去的东西,就是所谓“产品”。
这样,需求满足,他高兴,我也高兴,程式也不会因为资料太大就当掉。
当然这是所谓的“另存新档”的类型,是IO-bound,但不算资料分析,
效能方面,就给他用线性速度就能接受了。有什么不满意吗?
没什么不满意的,因为,这是工作,而不是我个人的作品。
我觉得,就好像在机车行修车,就好好修车,不要幻想你修过的引擎会升级为
喷射机的引擎。