在Python中跨多个列删除所有重复行

pandasdrop\u duplicates功能非常适合“非限定”数据帧。但是,要传递的关键字参数之一是take_last=Truetake_last=False,而我希望删除跨列子集重复的所有行。这可能吗

A B C
0 foo 0 A
1 foo 1 A
2 foo 1 B
3巴1 A

例如,我想删除与列AC匹配的行,因此这应该删除行0和1

现在,使用drop_duplicates和keep参数,在pandas中,这要容易得多

将熊猫作为pd导入
df=pd.DataFrame({“A”:[“foo”,“foo”,“foo”,“bar”],“B”:[0,1,1],“C”:[“A”,“A”,“B”,“A”]})
drop_duplicates(subset=['A','C'],keep=False)

发表评论