[问题] 网址撷取特定字串 love11098787 PTT批踢踢实业坊

[问题] 网址撷取特定字串

楼主: love11098787 (Laipi_lai) 2020-11-21 01:19:22

[问题类型]:
程式咨询
[软件熟悉度]:
入门
[问题叙述]:
https://l.facebook.com/l.php?u=https%3A%2F%2Fwww.abc.com.tw%2Fday%2F1234%3Futm_source%3Dfacebook-abc%26utm_medium%3Dpost%26utm_campaign%3Dday%26utm_content%3Dlink-202010-happy%2F1234&h=AT0QK64y8zcRN3Of6strNOOhm2lESra4yGyR73iofDkVvVIYkPTmiVHee6RsQlfU1-delepwkeworiewj0rw2142_jifdks22313
1.想要撷取 %3Dlink 后面的 202010-happy
2.想要撷取 %2F 后面的 1234
试过用很原始的方式strsplit()，但切出来的东西与想像的不符合
想询问各位R大神有没有其他建议的语法QQ
by对于正规式表达还是很不熟悉的R入门菜鸟
[关键字]:
特定字串撷取

作者: Gjerry 2020-11-21 03:31:00

可以试试看用 % 符号来切割字串，再找你要的字串片段。另外可以试着去查 regular expression ，以及grep 等 functions，或是 stringr package 的用法

作者: cywhale (cywhale) 2020-11-21 19:38:00

y <-regexpr('%3Dlink-(?:[a-zA-Z0-9\\-]+)%2F[0-9]+',x)y值156 你打y还会显示attr(,"match.length") 27或者attributes(y)$match.length得到27 总长度另外这里用了两个'饰词't1<-nchar('%3Dlink-')为8 %2F为3设给t2啊要分两次t<-regexpr('%3Dlink-(?:[a-zA-Z0-9\\-]+)%',xsubstr(x, t+t1, t+attributes(t)$match.length-2)会得到"202010-happy" 一样抓它的长度t3<-nchar(...) 得到12substr(x, y+attributes(t)$match.length+nchar(t2)+1,y+attributes(y)$match.length-1) 就会抓到'1234'抱歉一边写用不到t3但要分两次,或抓一次用%2F做strsplit

作者: chuubbyy (byetos) 2020-11-22 00:30:00

str1 <- str_extract(string, '(?<=%3Dlink-).+(?=%2F)')str2 <- str_extract(string, paste0('(?<=', str1, '%2F).+(?=&)'))

继续阅读

[问题] 征R语言家教/协助解题jenniferhsia [问题] shiny 输入CSV后所产生的报错asdfrtg [问题] 爬虫问题il0306 [问题] 正则排除某个单字BUQ [问题] shiny upload csv and print consoleasdfrtg [问题] shiny upload csvasdfrtg [问题] 征求R语言家教peggyb195 [问题] 在 excel 镶嵌图片xiangying [问题] 无法使用R Markdown发布lalawa [问题] 如何由组合后的字串导向变量名称?muscidae