read_table - 读取分隔符文本文件
read_table()方法读取分隔符文本文件的内容并返回DataFrame。
方法原型
pandas.read_table(filepath_or_buffer: Union[str, pathlib.Path,
IO[~AnyStr]], sep='t', delimiter=None, header='infer',
names=None, index_col=None, usecols=None, squeeze=False,
prefix=None, mangle_dupe_cols=True, dtype=None, engine=None,
converters=None, true_values=None, false_values=None,
skipinitialspace=False, skiprows=None, skipfooter=0,
nrows=None, na_values=None, keep_default_na=True, na_filter=True,
verbose=False, skip_blank_lines=True, parse_dates=False,
infer_datetime_format=False, keep_date_col=False,
date_parser=None, dayfirst=False, cache_dates=True, iterator=False,
chunksize=None, compression='infer', thousands=None, decimal=b'.',
lineterminator=None, quotechar='"', quoting=0, doublequote=True,
escapechar=None, comment=None, encoding=None, dialect=None, error_bad_lines=True,
warn_bad_lines=True, delim_whitespace=False, low_memory=True,
memory_map=False, float_precision=None)[source]
参数:
- filepath_or_buffer:文件路径字符串、路径对象或类文件对象
- sep:分隔符,默认值:\t
- delimiter:分隔符别名,默认值:None
- header:标题行,默认值:infer,自动推导
- names:列名,可选
- index_col:索引列,默认值:None
- usecols:
- squeeze:布尔值,默认值:False。对单列数据是否压缩为序列
- prefix:字符串,可选,表示列名前缀
- mangle_dupe_cols:布尔值,默认,True。是否重命名重复的列名。
- dtype:数据类型,可选
- engine:解析引擎,c/python,可选。
- converters:字典,可选,定义指定列的值转换器
- true_values:列表,可选,定义视为True的值
- false_values:列表,可选,定义视为False的值
- skipinitialspace:布尔值,默认:False,是否跳过分隔符后的空白
- skiprows:可选,定义文件头部跳过的行数
- skipfooter:可选,定义文件尾部跳过的行数
- nrows:可选,定义要读取的行数
- na_values:可选,定义视为NA/NaN的值
- keep_default_na:布尔值,默认值:True,解析时是否包含默认的NaN值
- na_filter:布尔值,默认值:True,是否检测缺失值
- verbose:布尔值,默认True,是否显示非数值字段中NA值的数量
- skip_blank_lines:布尔值,默认True,是否跳过空白行
- parse_dates:默认值:False,是否解析日期
- infer_datetime_format:默认值:False,是否解析日期格式
- keep_date_col:默认值False,是否保留日期列
- date_parser:可选,日期解析函数
- dayfirst:默认值False,是否将日期放在月份之前:DD/MM
- cache_dates:默认值True,是否缓存日期
- iterator:默认值False,是否返回文本迭代器
- chunksize:可选,
- compression:默认值:infer,定义压缩格式
- thousands:可选,千位分隔符
- decimal:默认值:. ,小数点符号
- lineterminator:可选,定义行结尾符
- quotechar
- quoting
- doublequote
- escapechar
- comment
- encoding
- dialect
- error_bad_lines
- warn_bad_lines
- delim_whitespace
- low_memory
- memory_map
- float_precision
示例代码
>>> pd.read_table('data.csv') # doctest: +SKIP