[问题] 想请问在使用str_subset时\\.的功能

楼主: a6409tw (爆蝾螈)   2018-02-26 23:18:42
[软件熟悉度]:
入门(写过其他程式,只是对语法不熟悉)
[问题叙述]:
最近正在练习使用R来爬虫
但一直无法理解
str_subset(x,"\\.html")中\\.
我的理解是
左边的\将右边的\功能跳脱
使得结果变成在x中寻找符合\.html的元素
可是这样.的功能并没有被跳脱
一直都想不通
另外如果将程式码改成
str_subset(x,".html")竟然跟
str_subset(x,"\\.html")的结果一样
str_subset(x,"\\.html")的结果一样
我已经彻底混乱了
拜托各位大大了QQ
[环境叙述]:
Win10 64bit Version 1.1.383
[关键字]:
正则表示法、爬虫
选择性,也许未来有用
作者: celestialgod (天)   2018-02-26 23:24:00
你试试看x 多放一个xhtml的元素,看这个会不会被抓.在regex里面被当作万用字符,不是原本的.请查regex
作者: cywhale (cywhale)   2018-02-27 00:23:00
\\. 就代表你真的要找dot 这个字符 而只有dot在regex当中代表可以match任何字符 所以.html 可以match xhtmlR中'\' blackslash本身就是特殊字符 所以需要'\\'escapebackslash 打错字
作者: celestialgod (天)   2018-02-27 07:24:00
你试试看x 多放一个xhtml的元素,看这个会不会被抓.在regex里面被当作万用字符,不是原本的.请查regex
作者: cywhale (cywhale)   2018-02-27 08:23:00
\\. 就代表你真的要找dot 这个字符 而只有dot在regex当中代表可以match任何字符 所以.html 可以match xhtmlR中'\' blackslash本身就是特殊字符 所以需要'\\'escapebackslash 打错字
作者: eric500g (鱼头)   2018-02-27 20:26:00
左边\是strings的跳脱,右边\是regex的跳脱
作者: eric500g (鱼头)   2018-02-27 12:26:00
左边\是strings的跳脱,右边\是regex的跳脱

Links booklink

Contact Us: admin [ a t ] ucptt.com