pandas数据处理基础之筛选指定行或者指定列的数据

  • Post category:Python

以下是“pandas数据处理基础之筛选指定行或者指定列的数据”的完整攻略:

1. 筛选指定行数据

Pandas提供了很多方法来筛选指定行数据,以下是其中两种方法:

1.1 使用布尔索引

使用布尔索引可以根据某一列或者多列的条件来筛选数据。例如,下面的代码将根据行政区为“北京市”或“上海市”来筛选数据:

import pandas as pd

data = pd.read_csv("data.csv")
df = data[(data["行政区"] == "北京市") | (data["行政区"] == "上海市")]

上面的代码通过使用布尔索引,生成一个True或者False的真值表来判断是否符合筛选条件。在括号中,使用了两个条件,使用“|”来将两个条件进行或运算,即只要符合其中一个条件,就会被筛选出来。

1.2 使用query()方法

query()方法可以根据指定的条件来筛选数据。例如,下面的代码将使用query()方法根据行政区为“北京市”或“上海市”来筛选数据:

import pandas as pd

data = pd.read_csv("data.csv")
df = data.query('行政区=="北京市" | 行政区=="上海市"')

上面的代码将条件“行政区==’北京市’ | 行政区==’上海市’”作为字符串传递给了query()方法进行筛选。其中“|”表示逻辑或运算。

2. 筛选指定列数据

Pandas提供了.loc[]方法和[]运算符来筛选指定列的数据。

2.1 使用.loc[]方法

.loc[]方法可以根据行和列的标签来筛选数据。例如,下面的代码将从数据中选择名字列的数据:

import pandas as pd

data = pd.read_csv("data.csv")
df = data.loc[:, "名字"]

上面的代码中,使用.loc[]方法,第一个’:’表示选择所有行,逗号后面的”名字”表示选择名字这一列的数据。

2.2 使用[]运算符

[]运算符可以通过传递列名或者列的位置来筛选数据。例如,下面的代码将从数据中选择名字列和成交量列的数据:

import pandas as pd

data = pd.read_csv("data.csv")
df = data[["名字", "成交量"]]

上面的代码使用[]运算符,将一个包含多个列名的列表传递给它,来选择多个指定列的数据。

以上就是“pandas数据处理基础之筛选指定行或者指定列的数据”的完整攻略。