嗨大家好!想来这边跟大家分享小弟自制的套件 PTTmineR!
PTTmineR 开发的目的是希望以 PTT 为材料的舆情、SNA以及文字探勘分析人员可以不用
写爬虫专注在分析工作上,相较于一般的爬虫 PTTmineR 有以下特色:
- 友善使用者的语意化使用方式
- 整合多种 PTT 文章搜寻方式
- 内部高效率的资料处理(使用data.table)
- 支持平行运算(使用future)
以上特色可以让使用者简单快速地获取 PTT 的文本,相关使用方法都可以先参考 repo
首页的文件,如果有相关建议或是想回报 bug,可以直接跟我说或是在 issue 中做讨论
!谢谢!(如果觉得这个套件有帮助到你也请帮我点个星星XDD)
github repo:https://github.com/shihjyun/PTTmineR
如果有任何问题或是建议,可以在 issue 中让我知道!