请教各位:
https://data.gov.tw/dataset/32500
本国专利技术名词中英对照词库,可以从上面网址下载。档案格式为xml,而且档案很大
,约800mb。
我想把它下载下来,当作电脑中的字典使用。于是写了两组code。
第一组使用ET.iterparse;第二组使用ET.parse。
https://repl.it/@ides13chen/dictionary
书中写说ET.iterparse使用的内存量比较小,但是我执行后查了电脑中的内存使用
量最后到达700mb,和预期的7mb差很多,是我哪里做错了吗?
另外,run了这两组code后,觉得有点慢。感觉xml格式不适合当字典使用?
如果转成数据库档会比较快吗?可以提供建议吗?谢谢。