[其他] 读取含有逗号等标点符号的CSV档

楼主: HenryLin123 (HenryLin123)   2017-06-12 23:09:55
我有一个.CSV档格式如下
id tags text
0 ABC DEF ghj,dd.
1 OKG RRF dd!xx?aa, bb cd.
如果我想要把text里面的标点符号全部删掉,然后一个一个单字读取的话该呼叫何种函数?
或着我先开excel把标点符号都先去掉吗?
另外想问如果每行数量不一的话,函数要怎么打,目前我查到用textread,但是不确定该怎么用才对。
感谢各位了。
作者: sppmg (sppmg)   2017-06-13 03:22:00
mat2cell(s,1,diff([0,find(s==','),numel(s)]))很无聊的试了一下,s是逗点分隔字串,输出为cell阵列
楼主: HenryLin123 (HenryLin123)   2017-06-13 19:12:00
感谢 我等等试试看
作者: sppmg (sppmg)   2017-06-13 21:50:00
类似功能的还有split, strsplit ,不过要注意一下支援的版本。find也可以改用regexp做更灵活的搜寻
作者: Yugaa (对酒当歌人生几何)   2017-06-15 00:50:00
楼主加油~
作者: chocopie (好吃的巧克力派 :))   2017-06-15 23:07:00
行数数量不一可google countlines.pl,但你的状况比较像是栏数数量不一。这我就不知道怎么解了,一般都是想办法在ETL阶段先把资料弄整齐。

Links booklink

Contact Us: admin [ a t ] ucptt.com