counter_dict = dict()
with open(output_file, 'wb') as fo:
with open(file1, 'rb') as fi:
for line in fi.read().splitlines():
try:
pair = left, right = line.split('>') # format check
for item in pair:
try:
counter_dict[item] += 1
except:
counter_dict.setdefault(item, 1)
fo.write("{l}.{num_l}>{r}.{num_r}\n".format(
l = left, num_l = counter_dict[left],
r = right, num_r = counter_dict[right] )
except ValueError: # this line is not "X>Y"
# case 1: "too many values to unpack"
# case 2: "need more than 1 value to unpack"
fo.write('Invalid line: {original}\n'.format(original=line))
continue
except: # unexpected error
raise
能保证输入的格式的话
外层的try、except可以拿掉 (最内层要留着)
但应该不会感觉到速度差异
没有真的测过,只是练习一下语法
希望没有错太多,欢迎各位高手指正
※ 引述《Dong0129 (阿东)》之铭言:
: 标题: [问题] 该怎么用dict处理这个问题?(附上code@@)
: 时间: Mon Apr 27 21:19:14 2015
:
: 各位版友好,
:
: 请问我该如何运用dict转换以下需求?
:
: file1:
: 2>4
: 1>2
: 2>3
: 3>5
: 3>1
: 1>4
: 4>2
: .
: .
: .
: 转换成:
: file2:
: 1.1>2.1
: 3.1>1.2
: 1.3>4.1
: 4.2>5.1
: 4.3>3.2
: 3.3>2.2
: 2.3>1.4
: .
: .
: .
:
: 即.左边的数字为第几种,而.右边的数字为出现几次,
:
: 麻烦各位大大帮帮忙了!
:
:
: 目前撰写的程式为:
:
: rfd=open(file1,"r")
: wfd.open(file2,"w")
: dict_file=dict()
: num={}
: seq={}
: for line in rfd.read().splitlines():
: item1,item2=line.split('>')
: for item in (item1,item2):
: if not item in num:
: num[item]=1
: seq[item]=len(num.keys())
: else:
: num[item]+=1
: dict_file.setdefault(item,str(seq[item])+"."+str(num[item]))
: wfd.write(dict_file[item1]+'>'+dict_file[item2])
: rfd.close()
: wfd.close()
:
: file2的内容:
: 1.1>2.1
: 3.1>1.1
: 1.1>4.1
: .
: .
: .
:
: