[问题] xml_node转成text但保留tag资讯

楼主: locka (locka)   2019-07-08 18:27:10
[问题类型]:
程式咨询(我想用R 做某件事情,但是我不知道要怎么用R 写出来)
[软件熟悉度]:
使用者(已经有用R 做过不少作品)
[问题叙述]:
版友好:
如题,想请问我用rvest的read_heml()爬下来的东西大概长这样
> test
{xml_document}
<html>
[1] <body><table border="1">\n<caption>title ...
如果执行 test %>% html_text() 则解析html标签 只剩下
[1] "title\n id\n aaa\n d\n ddd\n
e\n eee\n "
不知道能否单纯把爬下来的html转成字串,保留所有的标签呢?
想要的结果:
<table border="1">
<caption>title</caption>
<tbody>
<tr>
<th>id</th>
<td colspan="3">aaa</td>
</tr>
<tr>
<th style="width:15%">d</th>
<td style="width:35%">ddd</td>
<th style="width:15%">e</th>
<td style="width:35%">eee</td>
</tr>
</tbody>
</table>'
google了一下好像没找到相关解法所以上来发问
谢谢!
[程式范例]:
https://ideone.com/bbRbpg
[关键字]:
选择性,也许未来有用
作者: andrew43 (讨厌有好心推文后删文者)   2019-07-08 19:22:00
as.character()
作者: celestialgod (天)   2019-07-08 19:22:00
as.character
楼主: locka (locka)   2019-07-09 18:15:00
原来还有这招…谢谢楼上两位大大!

Links booklink

Contact Us: admin [ a t ] ucptt.com