[问题] 筛选含特定文字的资料

楼主: e181280 (冥 〞)   2018-06-05 16:51:16
- 心得: 当你自己想要分享经验时,请使用这个类别。
- 讨论: 当你自己已经有答案,但是也想听听版友意见时。
[问题类型]:
程式咨询(我想用R 做某件事情,但是我不知道要怎么用R 写出来)
[软件熟悉度]:
入门(写过其他程式,只是对语法不熟悉)
[问题叙述]:
目前在自学写PTT爬虫,暂以Stock版为例,由于是抓所有资料,
想要筛选出[请益]的那一行的资料,但用filter等一些网络查到的方法去处理
却一直无法处理完成,所以想请问如何解决,谢谢
做出来的:
datetime title month day
<dttm> <chr> <chr> <chr>
1 2018-06-02 21:22:17 Re: [请益] 台湾程式交易工具现况 06 02
2 2018-06-02 21:55:47 Re: [新闻] 加入MSCI首日 沪指跌0.66% 创业板 06 02
3 2018-06-02 22:06:30 Re: [心得] 第一季寿险到底亏多少? 06 02
4 2018-06-02 22:44:21 [请益] 最近生技股在涨什么呢? 06 02
5 2018-06-02 22:46:47 [请益] 是不是没人价值派转技术派? 06 02
6 2018-06-02 23:00:09 "[标的] 3029 零壹 多 " 06 02
7 2018-06-02 23:01:49 [请益] 国泰科技ETF 06 02
8 2018-06-03 01:06:21 Re: [心得] 如果能生存,交易是不是最棒的 06 03
9 2018-06-03 02:27:24 Re: [请益] 台湾程式交易工具现况 06 03
10 2018-06-03 04:16:50 "Re: [请益] 请问 \"量缩到极尽\" 怎么看? 06 03
希望做到:
datetime title month day
<dttm> <chr> <chr> <chr>
1 2018-06-02 22:44:21 [请益] 最近生技股在涨什么呢? 06 02
2 2018-06-02 22:46:47 [请益] 是不是没人价值派转技术派? 06 02
[程式范例]:
filter(article.table,title %in% '请益')
[环境叙述]:
# A tibble: 0 x 4
#.. with 4 variables: datetime <dttm>, title <chr>, month <chr>, day <chr>
[关键字]:
filter
作者: eri820503 (snoopyahoo)   2018-06-05 16:58:00
可以看看regular expression
作者: cywhale (cywhale)   2018-06-05 17:02:00
wl <- regexpr("^[0-9](.*?)\\s(\\[|[a-zA-Z])",x)substr(x,wl,attributes(wl)$match.length-2) 抓时间substr(x,wl,attributes(wl)$match.length, nchar(x))抓title

Links booklink

Contact Us: admin [ a t ] ucptt.com