pandas求平均数和中位数的方法实例

  • Post category:Python

Pandas求平均数和中位数的方法实例

Pandas是Python中常用的数据分析库,它提供了很多方便的数据读取、处理、计算等功能。其中计算平均数和中位数是很常见的操作,下面介绍两种方法。

方法一:使用pandas.DataFrame.mean()和pandas.DataFrame.median()方法

pandas.DataFrame.mean()可以计算出一个DataFrame中所有数值列的平均值,而pandas.DataFrame.median()可以计算出所有数值列的中位数。

以一份名为student.csv的学生数据为例,代码如下:

import pandas as pd

df = pd.read_csv('student.csv')
print('平均数:')
print(df.mean())
print('中位数:')
print(df.median())

运行结果如下:

平均数:
number     3.000000
math      68.666667
english   73.333333
dtype: float64
中位数:
number     3.0
math      69.0
english   74.0
dtype: float64

如上所示,mean()方法输出了所有数值列的平均值,median()方法输出了所有数值列的中位数。

方法二:使用numpy库中的函数计算平均数和中位数

除了pandas内置的方法,我们还可以使用numpy库中的函数计算平均数和中位数。下面是一个例子,你可以参考它:

import pandas as pd
import numpy as np

df = pd.read_csv('student.csv')
print('平均数:')
print(np.mean(df, axis=0))
print('中位数:')
print(np.median(df, axis=0))

在上述代码中,np.mean()和np.median()函数分别计算出所有数值列的平均值和中位数,并在axis=0的方向上进行计算。运行结果如下:

平均数:
[ 3.         68.66666667 73.33333333]
中位数:
[ 3. 69. 74.]

总结

本文介绍了计算平均数和中位数的两种方法。除了本文提到的两种方法外,还有很多方法可以完成这个任务,例如使用numpy库中的其他函数、调用pandas.DataFrame.describe()方法等。在实际工作中,你可以根据数据量和需求选择更适合自己的方法。