Pandas 在给定的Excel表格中找出利润和损失
Pandas是Python中流行的数据操作和分析库,被数据科学家和分析师广泛使用。它提供了多个处理Excel表格数据的函数。在分析财务数据时,找出给定Excel表格中的利润和损失是最常见的任务之一。
设置
为了在Python中处理Excel文件,你需要安装openpyxl依赖项。打开终端并输入以下命令进行安装 –
pip install openpyxl
安装成功后,您可以继续尝试使用Excel文件和电子表格进行实验。
步骤
要将Excel文件中的数据读入Pandas DataFrame,请使用内置于Pandas中的 read_excel() 方法。为了计算利润和损失,我们必须从总收入中扣除整个成本。以下阶段可用于总结利用Pandas计算利润和损失的算法−
- 使用 read_excel() 方法将Excel表格读入Pandas DataFrame。
-
应更新DataFrame,添加新的列用于利润和损失。
-
从总收入中减去总成本,以确定每行的利润和损失。
-
在DataFrame中累加利润和损失列,以确定总体利润和损失。
示例1
以下代码读取名为 ‘sales.xlsx’ 的Excel表,并创建一个DataFrame。然后增加了一个用于利润和损失的新列,并计算了每行的利润和损失。
import pandas as pd
# read excel sheet into pandas dataframe
df = pd.read_excel('sales.xlsx')
# calculate total cost
df['Total Cost'] = df['Units Purchased'] * df['Unit Cost']
# calculate total revenue
df['Total Revenue'] = df['Units Sold'] * df['Unit Price']
# calculate profit/loss
df['Profit/Loss'] = df['Total Revenue'] - df['Total Cost']
# print the resulting dataframe
print(df)
# save the resulting dataframe to a new excel sheet
df.to_excel('sales_results.xlsx', index=False)
输出
Units Purchased Unit Cost Units Sold Unit Price Item Name Total Cost Total Revenue Profit/Loss
50 5.00 40 9.00 Apples 250.00 360.0 110.00
100 3.50 80 7.00 Oranges 350.00 560.0 210.00
25 12.00 20 15.00 Pineapples 300.00 300.0 0.00
75 1.75 60 3.50 Bananas 131.25 210.0 78.75
200 0.50 180 1.25 Carrots 100.00 225.0 125.00
450 2.00 120 4.50 Potatoes 900.00 540.0 -360.00
40 8.00 30 12.00 Avocados 320.00 360.0 40.00
80 1.50 70 3.00 Tomatoes 120.00 210.0 90.00
300 20.00 25 25.00 Mangoes 6000.00 625.0 -5375.00
60 4.00 45 8.00 Grapes 240.00 360.0 120.00
在这个示例中,我们首先导入Pandas库,然后使用 read_excel ()函数读取Excel表格。然后我们在数据框中创建新列来计算每个产品的总成本、总收入和利润/损失。最后,我们打印包含计算值的新列的结果数据框,并将其保存到新的Excel表格中以供进一步处理。
示例2:使用过滤器计算利润和损失
import pandas as pd
# read excel sheet into pandas dataframe
df = pd.read_excel('sales_results.xlsx')
# filter the dataframe to include only the products with profit
df_profit = df[df['Total Revenue'] > df['Total Cost']]
# calculate the total profit
total_profit = df_profit['Total Revenue'].sum() - df_profit['Total Cost'].sum()
# filter the dataframe to include only the products with loss
df_loss = df[df['Total Revenue'] < df['Total Cost']]
# calculate the total loss
total_loss = df_loss['Total Cost'].sum() - df_loss['Total Revenue'].sum()
# print the total profit and loss
print(f"Total Profit: {total_profit}")
print(f"Total Loss: {total_loss}")
输出
Total Profit: 773.75
Total Loss: 5735.0
首先导入 Pandas 库,然后使用read_excel()函数读取上个示例保存的Excel表格。然后我们 筛选 数据框,只包括有利润的产品,并计算总利润。类似地,我们筛选只包括亏损的产品,并计算总亏损。最后,我们使用print()函数打印总利润和亏损。
使用Pandas计算利润和亏损的应用
- 金融数据分析 - 企业可以使用Pandas来分析其财务信息,确定各种商品和服务的利润和亏损。
-
投资分析 - 使用Pandas,投资者可以检查公司的财务信息,判断其是否有利可图。
-
业务预测 - 企业可以利用Pandas通过分析历史数据来预测未来的收入和亏损。
结论
对于从Excel表格中分析和计算利润和亏损,Pandas是一个强大的Python包。由于其简单的接口和强大的功能,Pandas是任何数据分析师或财务专家的重要工具。开发人员可以通过本文提供的示例使用Pandas分析其财务数据并了解其业务成功情况。