Python读取Excel文件
Excel是由微软开发的电子表格应用程序。它是一个方便访问的工具,用于组织、分析和存储表格中的数据。它在全球范围内的许多不同应用程序中被广泛使用。从分析师到首席执行官,各种专业人士都使用Excel进行快速统计和严肃数据处理。
Excel文档
Excel电子表格文档称为工作簿,以 .xlsx 扩展名保存在文件中。电子表格的第一行主要用于标题,而第一列用于标识抽样单位。每个工作簿可以包含多个工作表,也称为工作表。特定列和行的方框称为单元格,每个单元格可以包含数值或文本。包含数据的单元格网格形成一个工作表。
活动工作表定义为用户当前查看或在关闭Excel之前最后查看的工作表。
从Excel文件中读取
首先,您需要编写一个命令来安装 xlrd 模块。
pip install xlrd
创建工作簿
一个工作簿包含Excel文件中的所有数据。您可以从头开始创建一个新的工作簿,或者您可以轻松地从已经存在的Excel文件创建一个工作簿。
输入文件
我们已经对工作簿进行了快照。
代码
# Import the xlrd module
import xlrd
# Define the location of the file
loc = ("path of file")
# To open the Workbook
wb = xlrd.open_workbook(loc)
sheet = wb.sheet_by_index(0)
# For row 0 and column 0
sheet.cell_value(0, 0)
说明: 在上述示例中,首先我们引入了xlrd模块并定义了文件的位置。然后我们从已经存在的Excel文件中打开了工作簿。
从Pandas中读取数据
Pandas被定义为一个建立在NumPy库之上的开源库。它提供了快速的数据分析、数据清洗和数据准备功能,并支持从URL中同时读取xls和xlsx扩展名的文件。
它是一个Python包,提供了一个有益的数据结构,称为数据框。
示例:
Example -
import pandas as pd
# Read the file
data = pd.read_csv(".csv", low_memory=False)
# Output the number of rows
print("Total rows: {0}".format(len(data)))
# See which headers are available
print(list(data))
从openpyxl中读取数据
首先,我们需要使用命令行上的pip安装openpyxl模块。
pip install openpyxl
之后,我们需要导入这个模块。
我们还可以使用openpyxl从现有的电子表格中读取数据。它也允许用户执行计算并添加原始数据集中不包含的内容。
示例
import openpyxl
my_wb = openpyxl.Workbook()
my_sheet = my_wb.active
my_sheet_title = my_sheet.title
print("My sheet title: " + my_sheet_title)
输出:
My sheet title: Sheet