Re: [问题] tuber套件撷取YouTube频道资讯

楼主: iambakr (123)   2020-06-23 00:50:48
原文恕删
后来我用以下方式可以成功抓到想要的资讯了!!
# Get Channel description
get_description <- function(id) {
get_channel_stats(id)$snippet$description
}
description <- lapply(data$id, get_description)
description_df <- do.call(rbind, lapply(description, data.frame))
# Get Channel region
get_Country <- function(id) {
get_channel_stats(id)$snippet$country
}
Country <- lapply(data$id, get_Country)
Country_df <- as.data.frame(data.table(Country))
但以上方式虽然成功抓到资料,有几个问题也想请教前辈
1. 这边只列出抓两种资讯(description & country)
但假设我要抓五个以上资讯的话,只能像上述写法写五组吗?
2. 由于抓出来的资讯有包含英文, 中文, 日文甚至是阿拉伯文在内
我用以下写法产出的CSV档,非英文都会出现乱码或是大量这种<U+25B6>
write.table(x = data, file = "Youtube.csv",
fileEncoding = "UTF-8", row.names = F)
设定了Sys.setlocale("LC_CTYPE", "Japan")等语系都还是不行
想请问该如何解决?
谢谢各位
补上 sessionInfo()
R version 4.0.0 Patched (2020-04-26 r78306)
Platform: x86_64-w64-mingw32/x64 (64-bit)
Running under: Windows 10 x64 (build 18363)
Matrix products: default
locale:
[1] LC_COLLATE=English_United States.1252
LC_CTYPE=English_United States.1252
LC_MONETARY=English_United States.1252
[4] LC_NUMERIC=C
LC_TIME=English_United States.1252
system code page: 950
作者: locka (locka)   2020-06-23 09:38:00
1. 你get_description这个function只做一件事(…$snippet$description取值),那为什么不直接写就好XD 上篇讨论的写法还是没解决吗?2. 请参考前面 UTF-8 写入问题那一篇,用readr套件应该可以解决你的问题

Links booklink

Contact Us: admin [ a t ] ucptt.com