下面是详细的Python对Excel文档去重及求和的实例教程。
- 准备工作
首先,我们需要准备一份Excel文档用于实验,这里我们以以下示例文档来说明:
A | B | |
---|---|---|
1 | Product | Price |
2 | Apple | 2.99 |
3 | Pear | 1.99 |
4 | Apple | 2.99 |
5 | Banana | 3.49 |
6 | Pineapple | 4.99 |
7 | Pear | 1.99 |
- 读取Excel文档
接下来,我们使用pandas
模块中的read_excel()
函数读取Excel文档,并将数据存入一个DataFrame
对象中。以下是代码实现:
import pandas as pd
data = pd.read_excel('example.xlsx')
print(data)
输出结果如下:
Product Price
0 Apple 2.99
1 Pear 1.99
2 Apple 2.99
3 Banana 3.49
4 Pineapple 4.99
5 Pear 1.99
- 去重
我们需要按照一些规则对数据进行去重,例如在示例文档中,我们要按照产品名称和价格进行去重。可以使用drop_duplicates()
函数实现。以下是代码实现:
data.drop_duplicates(['Product','Price'], inplace=True)
print(data)
输出结果如下:
Product Price
0 Apple 2.99
1 Pear 1.99
3 Banana 3.49
4 Pineapple 4.99
- 求和
接下来,我们需要对价格进行求和。可以使用sum()
函数实现。以下是代码实现:
total_price = data['Price'].sum()
print('Total Price:', total_price)
输出结果如下:
Total Price: 13.46
- 完整代码及输出结果
import pandas as pd
data = pd.read_excel('example.xlsx')
print(data)
data.drop_duplicates(['Product','Price'], inplace=True)
print(data)
total_price = data['Price'].sum()
print('Total Price:', total_price)
输出结果如下:
Product Price
0 Apple 2.99
1 Pear 1.99
2 Apple 2.99
3 Banana 3.49
4 Pineapple 4.99
5 Pear 1.99
Product Price
0 Apple 2.99
1 Pear 1.99
3 Banana 3.49
4 Pineapple 4.99
Total Price: 13.46
- 示例说明
示例1:去重
假设我们有以下Excel文档:
A | B | |
---|---|---|
1 | Joe | 30 |
2 | Bob | 25 |
3 | Joe | 30 |
4 | Sue | 35 |
我们要将姓名和年龄列进行去重,可以使用以下代码:
import pandas as pd
data = pd.read_excel('example.xlsx')
print(data)
data.drop_duplicates(['A','B'], inplace=True)
print(data)
运行后输出如下:
A B
0 Joe 30
1 Bob 25
2 Joe 30
3 Sue 35
A B
0 Joe 30
1 Bob 25
3 Sue 35
示例2:求和
假设我们有以下Excel文档:
A | B | |
---|---|---|
1 | Joe | 2 |
2 | Bob | 5 |
3 | Joe | 3 |
4 | Sue | 4 |
我们要将B列数据求和,可以使用以下代码:
import pandas as pd
data = pd.read_excel('example.xlsx')
print(data)
total = data['B'].sum()
print('Total:', total)
运行后输出如下:
A B
0 Joe 2
1 Bob 5
2 Joe 3
3 Sue 4
Total: 14
以上就是Python对Excel文档去重及求和的实例教程,希望能够帮助到你。