使用merge后出现数据重复问题

 
-------------------------------------------------------------
已经解决了。
开始我在网上查阅了很多,应该不是函数的问题。但看到其对于两表内重复数据的处理后,我想到可能是因为自己的数据有问题。我自己写的“归属文件”中(秦皇岛:人名)这个键值对我写了两遍,所以合并后的数据也就重复了。 
 
 
---------------------------------------------------老师您好,这是我在实际操作数据运用中遇到的问题。我需要把属性中的负责人姓名匹配到业务表中。使用merge后却发现部分数据重复了,我觉得可能是联接方式不对,但试了inner,left,等联结方法也不正确,希望老师能帮忙看下。
 
具体数据的excel在附件中:
代码如下:
import numpy as np
import  pandas as pd
car_data = pd.read_excel("业务数据报表.xlsx")
city_manage_name = pd.read_excel("归属.xlsx", sheetname = 0)

car_data_weekly = pd.merge(car_data,city_manage_name,how = "left",on ="城市")
car_data_weekly[car_data_weekly["城市"]=="秦皇岛"]
car_data[car_data["城市"]=="秦皇岛"]
 

微信图片_20180327094120.png

 
 

 

时间嘚朋

赞同来自: fish

我觉得你的问题描述不够清晰,我看了一下你的数据文件,业务数据报表里本来就有很多重复数据,不知道你说的重复是什么意思

要回复问题请先登录注册