Pandas学习笔记(二)

Author Avatar
Brian Lee 4月 04, 2018
  • 在其它设备中阅读本文章

内容承接Pandas学习笔记(一)


数据排序

索引排序

函数
.sort_index(axis=0, ascending=True)
  • axis: 默认对0轴索引进行排序
  • ascending: 默认为升序
示例

索引排序

数值排序

函数
Series.sort_values(axis=0, ascending=True)
DataFrame.sort_values(by, axis=0, ascending=True)
  • by: axis轴上某个索引或索引列表
  • NaN 同一放到排序末尾
示例

数值排序


基本统计分析

函数

适用于Series和DataFrame
方法 说明
.sum() 计算数据的总和,按0轴计算,下同
.count() 非NaN值的数量
.mean() .median() 计算数据的算术平均值、算术中位数
.var() .std() 计算数据的方差、标准差
.min() .max() 计算数据的最小值、最大值
.describe() 针对0轴(各列)的统计汇总
只适用于Series
方法 说明
.argmin() .argmax() 计算数据最大值、最小值所在位置的索引位置(自动索引)
.idxmin() .idxmax() 计算数据最大值、最小值所在位置的索引(自定义索引)

示例

Series

Series示例

DataFrame

DataFrame示例


累计统计分析

函数

累计计算
方法 说明
.cumsum() 依次给出前1、 2、 …、 n个数的和
.cumprod() 依次给出前1、 2、 …、 n个数的积
.cummax() 依次给出前1、 2、 …、 n个数的最大值
.cummin() 依次给出前1、 2、 …、 n个数的最小值
滚动计算
方法 说明
.rolling(w).sum() 依次计算相邻w个元素的和
.rolling(w).mean() 依次计算相邻w个元素的算术平均值
.rolling(w).var() 依次计算相邻w个元素的方差
.rolling(w).std() 依次计算相邻w个元素的标准差
.rolling(w).min() .max() 依次计算相邻w个元素的最小值和最大值

示例

累计统计分析


相关分析

函数

方法 说明
.cov() 计算协方差矩阵
.corr() 计算相关系数矩阵, Pearson、 Spearman、 Kendall等系数

示例

import pandas as pd

hprice = pd.Series([3.04, 22.93, 12.75, 22.6, 12.33], index=['2008','2009','2010','2011','2012'])
m2 = pd.Series([8.18, 18.38, 9.13, 7.82, 6.69], index=['2008','2009','2010','2011','2012'])

print(hprice.corr(m2))

结果为:0.5239439145220387


本博客采用 CC BY-NC-SA 3.0 许可协议。转载请注明出处!
本文链接:http://brianleelxt.top/2018/04/04/pandas-learn2/