楼主:
TZULIU (消费券收购商)
2019-01-30 12:08:39我打算分析100多个会议文件,
范例如下:https://tinyurl.com/yalydvd8
但在分析之前,我想先将文件转成资料储存,
资料中的每一行,第一个数值是发言者,第二个数值是发言者的发言内容。
例如:["张三","我今天早上吃了一碗卤肉饭,超好吃的。"]
我目前的进度如下:
Name = []
sentence = []
file = open('会议文件','r')
for line in file:
if line.find(':') != -1:
tokens = line.split(":")
Name.append(tokens[0])
else:
sentence.append(line + " ")
我现在想不通该怎么样把得到的发言者姓名和内容放在一起,
然后再继续找下一个发言者和发言内容。
还请各位高手帮忙解惑,谢谢!
作者:
nini200 (200妮妮)
2019-01-31 01:29:00只用:判断 后面不同人的发言 没法分类正确吧?大致上有写出来了 给你参考先找出所有说话者 重复的用集合去掉我的方法 A阵列储存要的名字行号B阵列储存非要的名字行号C阵列将AB阵列合并例A=[0,9]B=[3,6,11]C=[0,3,6,9,11,16]0-3 9-11就是要的内容 C阵列16是最后一行打错 B阵列储存非要名字含冒号的行号我的方法比较麻烦 有更好方法烦请告知