Re: [问题] jiebaR 针对文字档读取档案处理

楼主: andrew43 (讨厌有好心推文后删文者)   2016-09-12 00:13:43
我不知道那是 bug 还是如何。
就用我习惯的方式写一个例子。
str0 <- scan("/somewhere/temp.txt", "character", fileEncoding = "big5")
str1 <- paste0(str0, collapse = "")
mixseg <= str
另外,按你给的资料,不觉得用 readr::read_table() 是好方法,
改用 scan() 吧。
※ 引述《wanson》之铭言:
: 请问一下
: 他的教学网站中提到"./temp.dat"
: 可以load 档案进去
: 以下是他的说明
: 支持对文件进行分词:
: cc["./temp.dat"] ### 自动判断输入文件编码模式,默认文件输出在同目录下。
: ## segment( "./temp.dat" , mixseg )
: 英文说明
: You can pipe a file path to cut file.
: cutter <= "./temp.dat" ### Auto encoding detection.
: ## OR segment( "./temp.dat" , cutter )
: 很奇怪的是我自己怎样尝试都无法成功
: 这是我自己的目录
: setwd("C:/SASMACRO/data/F2+Blank")
: mixseg <= "./temp.dat"
: 另外我如果使用read_table 去读取txt档案,如果档案内只有简单的几个字
: 读档可以成功
: 但如果档案有点大,而且一开始很多分行
: 就会失败
: 例如下列的档案 (temp.txt)
: https://www.dropbox.com/s/wdwgk8t64xgrlu9/temp.txt?dl=0
: 怎样也都无法读进去
: 想请教一下版上的高手
: 谢谢

Links booklink

Contact Us: admin [ a t ] ucptt.com