[问题] 抓取中文字串 locka PTT批踢踢实业坊

[问题] 抓取中文字串

楼主: locka (locka) 2015-10-30 15:22:00

各位大大午安：
我今天有一组中文的资料，例如：
location <- as.factor(c("彰化县溪州乡高速公路", "澎湖县马公市关帝庙前"...))
想要请教该怎么做我才可以只取出每个字串的"前三个字"呢?
我想到的方式是用grep,可惜遇到中文就失败了...
以下是我失败的指令:
city <- grep("\\D", location, value=TRUE, perl=TRUE)
有查到似乎regular expression比对中文可以用 [u4e00-\u9a05]
可是不是很清楚该如何使用...
可以提供一些意见吗？或是其实根本是我用错方法了？谢谢！
参考程式码：
https://ideone.com/ccOlwz
[软件熟悉度]:
请把以下不需要的部份删除
入门(写过其他程式，只是对语法不熟悉)
[环境叙述]:
R version 3.2.2 (2015-08-14)
Platform: i386-w64-mingw32/i386 (32-bit)
Running under: Windows 7 x64 (build 7601) Service Pack 1

作者: celestialgod (å¤©) 2015-10-30 15:24:00

substr(location , 1, 3)

楼主: locka (locka) 2015-10-30 15:30:00

忘记最直觉的这招了!感谢c大!!!m(__)m

继续阅读

[问题] 指令 solve 原理?loser113 Re: [问题] 21点qhair [问题] ggplot 原点位置elone Re: [问题] dendextend package使用问题gbd37 [问题] 搜索并读取 zip 中的档案Edster Re: [问题] dendextend package使用问题celestialgod [问题] dendextend package使用问题gbd37 Re: [问题] 21点celestialgod [问题] 21点cano7127 Re: [问题] optim functioncelestialgod