Python pandas入门系列之众数和分位数

  • Post category:Python

Python Pandas入门系列之众数和分位数

本系列教程旨在帮助初学者快速入门Python Pandas库。本篇文章将介绍众数和分位数的概念以及在Python Pandas中的使用方法。

什么是众数?

众数(mode)是指在一组数据中出现次数最多的数。它在统计学中被广泛使用,特别是在描述离散型变量时。在Python Pandas中,我们可以通过使用mode()函数来计算众数。

代码示例

import pandas as pd

# 创建数据集
data = {'name': ['Alex', 'Bob', 'Carol', 'David', 'Eric', 'David'],
        'age': [18, 22, 19, 20, 21, 22],
        'salary': [5000, 6000, 5500, 5800, 5700, 6000]}
df = pd.DataFrame(data)

# 计算众数
mode_age = df['age'].mode()
print(mode_age)

在上面的例子中,我们首先创建了一个数据集,然后使用mode()函数计算了’age’列的众数。最后,我们打印出了计算结果。

什么是分位数?

分位数(quantile)是把一组数据按大小顺序排列后分成几份,在相应的位置上的数值。常用的分位数包括中位数(50%分位数)、四分位数(25%分位数和75%分位数)等。

在Python Pandas中,我们可以使用quantile()函数来计算各种分位数。

代码示例

import pandas as pd

# 创建数据集
data = {'name': ['Alex', 'Bob', 'Carol', 'David', 'Eric', 'David'],
        'age': [18, 22, 19, 20, 21, 22],
        'salary': [5000, 6000, 5500, 5800, 5700, 6000]}
df = pd.DataFrame(data)

# 计算中位数
median_age = df['age'].quantile(0.5)
print(median_age)

# 计算25%分位数和75%分位数
q1, q3 = df['salary'].quantile([0.25, 0.75])
print(q1, q3)

在上面的例子中,我们首先创建了一个数据集,然后通过使用quantile()函数计算了中位数和25%分位数和75%分位数。最后,我们打印出了计算结果。

以上就是本篇文章介绍的Python Pandas中众数和分位数的概念和使用方法,希望对大家有所帮助。