python pandas中的agg函数用法

  • Post category:Python

Python Pandas中的agg函数用法

在Python的数据分析领域中,Pandas是一个经常使用的数据处理库。agg函数是Pandas中较为实用的一个函数,主要用于对DataFrame进行聚合操作。本文将详细讲解Pandas中agg函数的用法。

agg函数的语法

通常情况下,agg函数主要有两种语法形式:

DataFrame.agg(func, axis=0, *args, **kwargs)
Series.agg(func, axis=0, *args, **kwargs)

其中,参数func可以是一个单独的聚合函数或者是一组聚合函数。当传入一组聚合函数时,agg函数会对整个DataFrame逐列应用这些函数。

示例1:计算平均值与方差

首先,我们创建一个示例DataFrame,包含三列数据:

import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]})

接着,我们可以通过如下代码对DataFrame进行聚合操作:

df.agg(['mean', 'var'])

运行上述代码后,会输出下面的结果:

          A         B         C
mean  2.000000  5.000000  8.000000
var   1.000000  1.000000  1.000000

通过agg函数将mean和var函数分别应用到DataFrame的每一列上进行聚合操作,得到了各列的平均值和方差。

示例2:传入字典,设置不同列的聚合函数

除了传入列表,agg函数还可以传入字典,以设置不同列使用不同的聚合函数。

例如,创建一个包含三列数据的示例DataFrame:

import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]})

现在,我们可以通过如下代码对每列分别进行聚合操作,求出总和和平均数:

df.agg({'A': 'sum', 'B': 'mean', 'C': 'sum'})

输出结果为:

A     6.0
B     5.0
C    24.0
dtype: float64

总结

agg函数是Pandas中用来对DataFrame进行聚合操作的一个实用函数,可以对整个DataFrame或者指定的列使用一组或单个聚合函数进行聚合操作。它的使用方法简单直观,为Pandas提供了更加灵活和高效的数据分析能力。