博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
pandas常用函数
阅读量:6708 次
发布时间:2019-06-25

本文共 957 字,大约阅读时间需要 3 分钟。

1. df.head(n): 显示数据前n行,不指定n,df.head则会显示所有的行

2. df.columns.values获取所有列索引的名称

3. df.column_name: 直接获取列column_name的数据

4. pd.unique(Series)获取Series中元素的唯一值(即去掉重复的)

注意和nunique的区别,nunique只作用于Series,用法是Series.nunique()

可以看得出,nuinque()是查看该序列(axis=0/1对应着列或行)的不同值的数量。用这个函数可以查看数据有多少个不同值。

5. max,min可直接作用于Series取最大和最小值

6. pd.value_counts(Series)统计Series中不同元素出现的次数

7. df.groupby和agg的使用

(1)变量grouped是一个DataFrameGroupBy对象,它实际上还没有进行任何计算,只是将数据进行了分组

(2)可以使用agg对分组好的数据进行处理,传入的参数为函数,返回一个标量结果。使用自定义的函数时应加引号。

下图的例子是对分组好的数据按每列求平均值。

(3)agg的参数可以传入多个函数

(4)还可以指定对不同的列使用不同的函数进行处理

8. df.index获取行索引

9. 使用条件筛选:下列例子中的三个条件criteria1表示fuelType1中的元素满足isin([]),criteria2表示fuelType2中的元素满足isnull(),

criteria3表示atvType中的元素不等于‘Hybrid’,vehicles_non_hybrid = vehicles[criteria1&criteria2&criteria3]表示vehicles_non_hybrid

是vehicles同时满足这三个条件筛选出来的数据。

10. pandas.DataFrame.reset_index(level=None, drop=False, inplace=False, col_level=0, col_fill='')

转载于:https://www.cnblogs.com/Finance-IT-gao/p/9978602.html

你可能感兴趣的文章
ubuntu14.04/16.04无法设置成中文解决办法
查看>>
Eclipse的Debug各种视图介绍(二)
查看>>
servlet:servletContext简介和方法使用
查看>>
CSS属性 table 的 border-collapse 边框合并
查看>>
P1364 医院设置
查看>>
Winform、WPF、Silverlight、MFC区别与联系
查看>>
装有Win7系统的电脑在局域网不能共享的解决方案
查看>>
Spring系统学习:20180612--aop配置中表达式的写法
查看>>
JavaWeb实战——记录网站上一次访问时间
查看>>
自学ng2 - 模板与数据绑定
查看>>
查看自己的笔记本是否支持64位系统
查看>>
joda-time
查看>>
Loading CSS without blocking render
查看>>
网易新闻客户端
查看>>
并行编程模式
查看>>
【Windows7】win7启动 报错 AutoIt错误,不能打开脚本文件
查看>>
SQL语句大全--<技巧>
查看>>
C# 值类型与引用类型(1)
查看>>
git中的远程分支被删除后还可以查看到的解决办法
查看>>
将商品SKU数据按商品分组,组装成json数据
查看>>