[问题] 多字段去除重复元素方式?(求思路)

楼主: nini200 (200妮妮)   2019-02-23 09:06:57
多字段去除重复元素方式?(求思路)
目前爬取公司名称和电话
将各个网站爬取资料整合起来时
会有以下状况
字段一(地区) 字段二(公司名) 字段三(电话)
台中市 公司名1 123456
中市 公司名1- 123456
中市西区 公司1 123456
以电话相同为基准去重 公司名任意留一个
三列处理完 希望只剩下一列
请问有什么方式处理吗
提个思路或套件都可以
感谢大家
作者: charlie11438 (煞气a查理)   2019-02-23 09:16:00
https://bit.ly/2twYpqC 这个呢?转成DataFrame去重
楼主: nini200 (200妮妮)   2019-02-23 21:34:00
好 谢谢分享
作者: CodingMan (程式侠)   2019-02-24 09:32:00
if key in list: del else: add to listkey = 你的电话
作者: adrianshum (Alien)   2019-02-24 18:29:00
[c.tel:c for c in company_list].items() ?

Links booklink

Contact Us: admin [ a t ] ucptt.com