[心得] 中文编码处理

楼主: Wush978 (拒看低质媒体)   2015-11-14 01:20:57
[关键字]: R, Encoding
[重点摘要]:
上个月我在台大授课时撰写了一份swirl 教材:
https://github.com/wush978/DataScienceAndR
其中 RBasic-07-Loading-Dataset 写了目前我知道的数个R 处理Encoding的方法。
由于坊间比较少解决加载中文资料的R 教材,
而且我今天晚上才刚更新这门课程的内容,需要有网友帮忙测测看相容性。
所以希望有任何想了解如何解决中文资料编码问题的网友,可以一边学,一边帮我测。
以下列出教材中有提到的部分:
1. file + 参数 encoding
- 在windows上遇到如UTF-16仍然会出错
2. readBin + stringi::stri_encode + textConnection + 参数 encoding
- 目前可以解决我手上所有中文的状况,但是效能稍差
有兴趣帮忙测试的网友,
请依照README的只是安装课程之后,直接进入RBasic-07-Loading-Dataset进行课程。
有任何问题或feedback(安装看不懂、解释看不懂、电脑爆炸...)
欢迎截图贴到 https://github.com/wush978/DataScienceAndR/issues 开issue给我
先谢谢各位
作者: cywhale (cywhale)   2015-11-14 18:20:00
stringi+encoding help in many cases~ Thanks sharing~

Links booklink

Contact Us: admin [ a t ] ucptt.com