[问题] 抓取中文字串

楼主: locka (locka)   2015-10-30 15:22:00
各位大大午安:
我今天有一组中文的资料,例如:
location <- as.factor(c("彰化县溪州乡高速公路", "澎湖县马公市关帝庙前"...))
想要请教该怎么做我才可以只取出每个字串的"前三个字"呢?
我想到的方式是用grep,可惜遇到中文就失败了...
以下是我失败的指令:
city <- grep("\\D", location, value=TRUE, perl=TRUE)
有查到似乎regular expression比对中文可以用 [u4e00-\u9a05]
可是不是很清楚该如何使用...
可以提供一些意见吗?或是其实根本是我用错方法了?谢谢!
参考程式码:
https://ideone.com/ccOlwz
[软件熟悉度]:
请把以下不需要的部份删除
入门(写过其他程式,只是对语法不熟悉)
[环境叙述]:
R version 3.2.2 (2015-08-14)
Platform: i386-w64-mingw32/i386 (32-bit)
Running under: Windows 7 x64 (build 7601) Service Pack 1
作者: celestialgod (天)   2015-10-30 15:24:00
substr(location , 1, 3)
楼主: locka (locka)   2015-10-30 15:30:00
忘记最直觉的这招了!感谢c大!!!m(__)m

Links booklink

Contact Us: admin [ a t ] ucptt.com