pandas如何读取excel文件

使用pandas读取Excel文件

在数据处理过程中,我们经常需要读取和写入Excel文件。Pandas提供了一种解决方案来完成这项任务,即使用Pandas的read_excel()和to_excel()函数。

1.读取Excel文件

Pandas的read_excel()函数提供了读取Excel文件的功能,使用该函数可以轻松地将Excel文件中的数据加载到Pandas DataFrame中。下面是使用Pandas读取Excel文件的步骤:

安装pandas库,使用pip install pandas命令进行安装

导入pandas库

使用read_excel()函数读取Excel文件

例如,我们将读取以下Excel文件:

我们可以使用以下代码读取Excel文件:

import pandas as pd

data = pd.read_excel("data.xlsx")

print(data.head())

read_excel()函数可以接受以下参数:

io:Excel文件的路径或类文件对象

sheet_name:Excel工作表的名称(可选,默认为第一个表)

header:指定用作列名的行号(可选,默认为0,表示第一行)

index_col:指定用作行索引的列号或列名(可选,默认为None)

skiprows:要跳过的行数(可选,默认为0)

usecols:要读取的列(可选,默认为所有列)

dtype:每列数据的类型(可选,默认为None)

2.写入Excel文件

使用to_excel()函数可以将Pandas DataFrame的数据写入Excel文件中。下面是使用Pandas写入Excel文件的步骤:

导入pandas库

使用to_excel()函数将DataFrame数据写入Excel文件中

例如,我们将在Excel文件中创建以下数据:

我们可以使用以下代码将DataFrame数据写入Excel文件:

data = {'Name': ['Tom', 'Jerry', 'Mickey', 'Minnie'],

'Age': [21, 20, 19, 18],

'Gender': ['M', 'M', 'M', 'F']}

df = pd.DataFrame(data)

df.to_excel("output.xlsx", index=False)

to_excel()函数可以接受以下参数:

io:Excel文件的路径或类文件对象

sheet_name:写入Excel的工作表的名称(可选,默认为Sheet1)

header:是否写入列名,默认为True

index:是否写入行索引,默认为True

startrow:写入Excel的起始行数

startcol:写入Excel的起始列数

engine:指定写入Excel的引擎。'openpyxl'或者'xlsxwriter'。'openpyxl'引擎用于写入大型文件,'xlsxwriter'用于优化性能。

3.读取多个Excel文件

有时候我们需要读取多个Excel文件中的数据,Pandas的ExcelFile类可以帮助我们完成这项任务。首先,我们需要从Excel文件中创建ExcelFile对象,然后可以使用该对象的parse()方法读取每个工作表中的数据。

例如,假设我们有以下两个Excel文件:

book1.xlsx:

book2.xlsx:

我们可以使用以下代码读取这两个文件中的数据:

import pandas as pd

xls1 = pd.ExcelFile("book1.xlsx")

xls2 = pd.ExcelFile("book2.xlsx")

data1 = pd.read_excel(xls1, "Sheet1")

data2 = pd.read_excel(xls2, "Sheet1")

print(data1.head())

print(data2.head())

在上面的代码中,我们首先使用pd.ExcelFile创建ExcelFile对象,然后使用read_excel方法解析ExcelFile对象和工作表名称以读取数据。

总结

对于Excel文件的操作,Pandas是一个非常好的选择,它提供了read_excel()和to_excel()函数,使读取和写入Excel文件变得非常容易。此外,ExcelFile类的出现使得读取多个Excel文件变得非常容易。

后端开发标签