各位大大晚安,不才想请教两个问题<(_ _)>
我目前希望可以处理一份很巨大的xml,但是我手上的xml档没有树根!
经过测试我发现会报错QAQQQ
我看到别人的解法好像是先把档案开启来,然后写入树根?
但是我目前需要动态迭代,因为档案很大,无法一次存入内存,
我试着引用查到的程式码,我的程式目前长如下网址
http://codepad.org/bPqMyuly
感觉好像不适合用那种open然后加入树根的方式,不知道版上大大有好建议嘛?
譬如怎么跟着迭代动态写入树根?
我的XML格式如下:
<doc id="13" url="https:XXX" title="XX">
content 1
</doc>
<doc id="15" url="https:XXX" title="XX">
content 2
</doc>
另外想问我希望搜寻文档中xml的content,然后如果我的keyword有出现在content中,
就回报我content的id,让我知道哪些content中有出现我的keyword,
我操作如下
先把xml分析出id和content之后,存入MySQL数据库,
再借由SELECT id FROM table WHERE content = "%keyword%"
找出哪些文章出现我的关键字
这样子的操作会有问题嘛?譬如MySQL会搜很慢之类的?
如果有问题,我怎样做比较好?
p.s我的关键字都是中文