详解pandas的read_excel函数
一、官网参数
pandas官网参数网址:pandas.read_excel — pandas 1.5.2 documentation
如下所示:
二、常用参数详解
1、io
一般指读取文件的路径。【必须指定】
import pandas as pd
df = pd.read_excel(r"C:\Users\wwb\Desktop\data3.xlsx")
print(df)
2、sheet_name
因为一个excel文件有多个sheet,所以可以通过此参数,指定读取哪个sheet。【默认读取第一个sheet】
读取sheet1:
import pandas as pd
df = pd.read_excel(r"C:\Users\wwb\Desktop\data3.xlsx",sheet_name='Sheet1')
print(df)
读取sheet2:
import pandas as pd
df = pd.read_excel(r"C:\Users\wwb\Desktop\data3.xlsx",sheet_name='Sheet2')
print(df)
3、header(表头)
表头即列名,默认第0行数据为表头。【从0开始计数】,以下为excel示意表头。
同read_csv函数参数,不再赘述,附read_csv函数参数的连接:详解pandas的read_csv函数_Python伊甸园的博客-CSDN博客
4、names(列名)
用于原始数据无表头,又想设置列名的情况。如下数据,直接读取,默认0、1、2为列名:
同read_csv函数参数,不再赘述,附read_csv函数参数的连接:详解pandas的read_csv函数_Python伊甸园的博客-CSDN博客
5、dtype(数据类型)
指定字段数据类型。例如:
同read_csv函数参数,不再赘述,附read_csv函数参数的连接:详解pandas的read_csv函数_Python伊甸园的博客-CSDN博客
6、engine(引擎)
指定解析数据时使用的引擎。支持的引擎包括:“xlrd”, “openpyxl”, “odf”, “pyxlsb”。各个引擎的区别在于:
- xlrd支持旧式的Excel文件,如xls文件。pandas1.2.0发生变化,xlrd引擎现在只支持解析xls文件。
- openpyxl支持较新的Excel文件格式。
- odf支持OpenDocument文件格式如odf,ods,odt。
- pyxlsb支持二进制Excel文件。
此参数默认为None,pandas会自动判断数据格式进行引擎的使用。
(1)如果数据格式为 xls 文件格式,可选引擎 xlrd、openpyxl;
(2)如果数据格式为 xlsx 文件格式,可选引擎 openpyxl;
【如果碰到特别老的xls文件,当openpyxl不可用时,需要选择xlrd引擎】
其他引擎同理,多数情况用不上。
7、skiprows(跳过指定行)
对于前N行数据不想要读进内存,可以指定此参数跳过。
同read_csv函数参数,不再赘述,附read_csv函数参数的连接:详解pandas的read_csv函数_Python伊甸园的博客-CSDN博客
以上就是最常用的pandas读取数据文件参数信息。