开发平台(Platform): (Ex: VC++, GCC, Linux, ...)
linux, gcc
问题(Question):
文件是xml
采用UTF-8编码
如果用char *[]去处理的话 之后要针对标点符号split会失败
所以我查到用wchar_t *[]去处理
可是结果不如预期
喂入的资料(Input):
底下连结是xml档案
https://dl.dropboxusercontent.com/u/100819329/file.zip
预期的正确结果(Expected Output):
<?xml version="1.0" encoding="UTF-8"?>
<xml>
<p>
<id>01</id>
<p>你好</p>
错误结果(Wrong Output):
<?xml version="1.0" encoding="UTF-8"?>
<xml>
<p>
<id>01</id>
<p>
程式码(Code):(请善用置底文网页, 记得排版)
https://gist.github.com/anonymous/11058612
补充说明(Supplement):
我从下午6点用到晚上2点还没搞定@@
或是有别的方法可以把UTF-8的xml正确读入呢@@?
之后要能够支援依照标点符号切割成子字串..
请高手指点!
谢谢