Pandas操作Excel详细指南
一、Pandas简介
Pandas是Python中用于数据处理和分析的强大库。它提供了高性能、易于使用的数据结构和数据分析工具。在处理Excel文件时,Pandas能极大地简化数据的读取、写入、清洗、分析等操作。
二、安装与导入
在使用Pandas操作Excel之前,需确保其已安装。若未安装,可使用pip install pandas进行安装。安装完成后,在Python脚本中导入Pandas:
import pandas as pd
通常还需要导入numpy库,因为Pandas在很多操作中依赖numpy:
import numpy as np
三、读取Excel文件
读取单个工作表
使用pd.read_excel()函数读取Excel文件中的单个工作表。例如,读取名为data.xlsx文件中的第一个工作表:
df = pd.read_excel('data.xlsx')
若要指定工作表名称或索引,可使用sheet_name参数:
# 按工作表名称读取
df = pd.read_excel('data.xlsx', sheet_name='Sheet2')
# 按工作表索引读取(从0开始)
df = pd.read_excel('data.xlsx', sheet_name=1)
读取多个工作表
将sheet_name参数设置为None,可以读取Excel文件中的所有工作表,返回一个字典,键为工作表名称,值为对应的DataFrame:
excel_data = pd.read_excel('data.xlsx', sheet_name=None)
for sheet_name, df in excel_data.items():
print(f"工作表: {sheet_name}")
print(df.head())
读取特定列和行
通过usecols参数指定要读取的列,通过skiprows参数跳过指定行数:
#