[问题]中文的断句存成data.frame

楼主: empireisme (empireisme)   2020-04-28 09:55:55
如题 假设我有一段文章
content <- "纽约商业交易所(NYMEX)6月原油期货5月6日收盘上涨0.31美元或0.5%成为
每桶62.25美元,因伊朗的局势升温,欧洲ICE期货交易所(ICE Futures Europe)近月布
兰特原油上涨0.39美元或0.6%成为每桶71.24美元。路透社报导,美国正在向中东部署一
个航母打击群和一个轰炸机特遣部队,美国代理国防部长称伊朗政权的威胁是可信的。
卡达半岛电视台网站5月5日报导,美国本月起取消对8个经济体(中国、印度、日本、韩
国、台湾、土耳其、意大利和希腊)购买伊朗石油的豁免,相比去年11月美国对伊朗石油
出口实施制裁的时候允许这些国家在6个月内继续购买以避免过度影响油价,显然美国认
为如今油市已经有足够的供应。美国国务卿蓬佩奥(Mike Pompeo)表示,美国已经与主
要产油国家进行沟通,希望确保油市的供应充足;加上美国国内的产油也在持续增长,这
令美国有信心油市的供应不会匮乏。 不过,实际局势可能未必如美国所想。目前有多个
产油国家内政动荡并影响产量,包括阿尔及利亚、安哥拉、利比亚、伊朗、尼日利亚与委
内瑞拉,一旦动荡升级,随时会进一步影响油市供应。此外,伊朗重质原油也并非任何国
家都能替代,遑论美国的轻质原油,与伊朗原油在品质上最为相近的是沙特阿拉伯,其
次为阿拉伯联合酋长国。"
我要如何把这段文章去做断句
存成一个表格
第一列 是第一个句子 纽约商业交易所(NYMEX)6月原油期货5月6日收盘上涨0.31美元或0.5%成为每桶62.25美

第二列 是第二个句子 因伊朗的局势升温
作者: locka (locka)   2020-04-28 10:40:00
regular expression为什么要存成表格/dataframe?list不好吗XDstringr::str_split(content, regex("[,。]"))
作者: locka (locka)   2020-04-28 02:40:00
regular expression为什么要存成表格/dataframe?list不好吗XDstringr::str_split(content, regex("[,。]"))
作者: cywhale (cywhale)   2020-04-28 15:36:00
tstrsplit(content,',|。') 会是你要的吗?~~
楼主: empireisme (empireisme)   2020-04-29 16:48:00
谢l大,因为习惯表格xdc大那不work即使加了s也一样喔
作者: cywhale (cywhale)   2020-04-29 16:56:00
我忘了tstrsplit是data.table的,用strsplit功能也一样

Links booklink

Contact Us: admin [ a t ] ucptt.com