```markdown

使用 `pandas` 读取 Excel 文件的多个 sheet

在数据分析中，pandas 是一个非常强大的工具，尤其在处理 Excel 文件时。pandas 提供了非常简便的方法来读取 Excel 文件中的多个工作表（sheet）。本文将介绍如何使用 pandas 读取 Excel 文件中的多个工作表，并进行相关的数据处理。

1. 安装必要的库

首先，确保你已经安装了 pandas 和 openpyxl（openpyxl 是 pandas 用来读取 .xlsx 文件的引擎）：

bash pip install pandas openpyxl

2. 读取 Excel 文件中的多个 sheet

2.1 读取所有工作表

使用 pandas.read_excel() 函数时，如果不指定 sheet_name 参数，它默认会读取第一个工作表。如果你想要读取所有的工作表，可以将 sheet_name 设置为 None，这样会返回一个字典，字典的键是工作表的名称，值是相应的 DataFrame。

```python import pandas as pd

读取 Excel 文件中的所有 sheet

file_path = 'example.xlsx' dfs = pd.read_excel(file_path, sheet_name=None)

输出所有工作表的名称

print(dfs.keys())

访问某个特定的工作表

df_sheet1 = dfs['Sheet1'] ```

在上面的代码中，dfs 是一个字典，其中的每个键是工作表的名称，值是对应工作表的数据（以 DataFrame 的形式存储）。你可以通过键来访问特定的工作表。

2.2 读取多个指定的工作表

如果只需要读取特定的几个工作表，可以通过将 sheet_name 设置为一个列表来指定。

```python import pandas as pd

读取指定的多个工作表

file_path = 'example.xlsx' sheets = ['Sheet1', 'Sheet2'] dfs = pd.read_excel(file_path, sheet_name=sheets)

输出工作表的数据

df_sheet1 = dfs['Sheet1'] df_sheet2 = dfs['Sheet2'] ```

在这个例子中，dfs 字典中只包含 Sheet1 和 Sheet2 的数据。

2.3 读取工作表时返回一个字典

如果你需要读取的工作表非常多，也可以考虑直接将结果返回为一个字典，便于管理。

```python import pandas as pd

读取多个工作表并返回一个字典

file_path = 'example.xlsx' sheets = ['Sheet1', 'Sheet3'] dfs = pd.read_excel(file_path, sheet_name=sheets)

输出字典中的所有数据

for sheet_name, df in dfs.items(): print(f"Data from {sheet_name}:") print(df.head()) ```

3. 处理 Excel 数据

读取完数据后，你可以对每个工作表的数据进行各种操作。例如，你可以对工作表的数据进行清洗、合并、分析等。

```python

假设 df_sheet1 和 df_sheet2 已经被读取

df_sheet1_cleaned = df_sheet1.dropna() # 删除缺失值 df_sheet2_cleaned = df_sheet2[df_sheet2['ColumnA'] > 100] # 筛选数据

合并两个数据框

df_combined = pd.concat([df_sheet1_cleaned, df_sheet2_cleaned], axis=0) ```

4. 总结

通过 pandas 提供的 read_excel 函数，我们可以非常方便地读取 Excel 文件中的多个工作表。可以通过设置 sheet_name=None 来读取所有工作表，或者通过设置为列表来指定读取某些工作表的数据。读取后，你可以利用 pandas 提供的强大功能进行数据清洗、转换和分析。

希望本文对你有帮助，助你更好地处理 Excel 数据！ ```

热搜
行业
快讯
专题

使用 pandas 读取 Excel 文件的多个 sheet

1. 安装必要的库

2. 读取 Excel 文件中的多个 sheet

2.1 读取所有工作表

读取 Excel 文件中的所有 sheet

输出所有工作表的名称

访问某个特定的工作表

2.2 读取多个指定的工作表

读取指定的多个工作表

输出工作表的数据

2.3 读取工作表时返回一个字典

读取多个工作表并返回一个字典

输出字典中的所有数据

3. 处理 Excel 数据

假设 df_sheet1 和 df_sheet2 已经被读取

合并两个数据框

4. 总结

使用 `pandas` 读取 Excel 文件的多个 sheet