[问题类型]:
程式咨询(我想用R 做某件事情,但是我不知道要怎么用R 写出来)
[软件熟悉度]:
入门(写过其他程式,只是对语法不熟悉)
[问题叙述]:
各位前辈好, 我目前手边有一个xml的档案, 我想要取出其中的parent跟children node,
merge在一起.
Page(我的parent node)为分页, 范例中有两页.
Text与[email protected], lly, urx, ury为我的children node.
我预期我的data.frame为:
Page Text llx lly urx ury
1 D1.2 70.87 43.56 94.53 31.56
1 Date 109.17 156.75 131.80 144.75
2 Forms 70.87 43.56 94.53 31.56
2 only 264.74 43.56 286.73 31.56
目前参考这边的做法 https://tinyurl.com/ya3yh5cj
连结的作法为, 取出每个page的node, 并放在list中.
(就范例而言, 会创造出一个list, 其中有两个element, 分别代表两个page)
接着, 利用lapply结合xpathApply, 对每个element取出我要的children node.
但, 我发现在values这个list中, 她的确有两个element,
其中每个elements都是重复page 1 and 2 的资讯.
如下:
[[1]] [[2]]
D1.2 D1.2
Date Date
Forms Forms
only only
烦请各位指教, 谢谢!
程式码: https://ideone.com/D2kbyw
范例档案: https://ideone.com/jqS8fo