楼主:
hohiyan (海洋)
2015-03-31 05:09:07使用的是 Python 3.4
字串格式如:
Ahearne M, 1999, INT J RES MARK, V16, P269, DOI 10.1016/S0167-8116(99)00014-2
字段是以逗号分隔,所以资料分别为 author, year, paper, volumn, page, doi
因为有些资料会缺字段(例如没有year或volumn...)
所以用 str.split(',') 的话可能会有不同笔资料字段不同的问题
paper 这个字段一定是全部都大写
因此想用正规式来抓取,但目前功力有限,
试了很久一直写不出有效的规则
请各位高手指教