一、drop_duplicates函数用途

pandas中的drop_duplicates()函数可以通过SQL中关键字distinct的用法来理解,根据指定的字段对数据集进行去重处理。

二、drop_duplicates()函数的具体参数

*
用法:
DataFrame.drop_duplicates(subset=None, keep=‘first’, inplace=False)

*
参数说明

参数 说明
subset 根据指定的列名进行去重,默认整个数据集
keep 可选{‘first’, ‘last’,
False},默认first,即默认保留第一次出现的重复值,并删去其他重复的数据,False是指删去所有重复数据。
inplace 是否对数据集本身进行修改,默认False
三、drop_duplicates用法举例

* 根据指定字段进行去重,保留第一次出现的数据 import pandas as pd #创建数据框 df=pd.DataFrame({ 'a':[1,2,
4,3,3,3,4], 'b':[2,3,3,4,4,5,3] }) print('去重前:\n',df) #根据字段a进行去重,保留第一次出现的数据 df.
drop_duplicates(['a'],keep='first',inplace=True) print('去重后:\n',df) >>> 去重前: a b
0 1 2 1 2 3 2 4 3 3 3 4 4 3 4 5 3 5 6 4 3 去重后: a b 0 1 2 1 2 3 2 4 3 3 3 4

技术
©2020 ioDraw All rights reserved
Vue2.0+jsonserver+axios模拟本地请求接口数据django不关闭CSRF中间件,自定义通过CSRF检测的post请求网上赚钱的门路方法,大部分人都是利用这三种方法!JS基础重点知识实验总结(全)HashMap实现LRU(最近最少使用)缓存更新算法特征工程vue el-input 禁止输入特殊字符 只可输入数字 正则验证抖音比较火的 黑客帝国-代码雨(免费送)携程2019校招 LRU Cachek8s删除pod