专栏名称: 极客挖掘机
高级软件工程师
目录
相关文章推荐
元素和同位素地球化学  ·  《人类简史》人性的底层逻辑及其与文明发展的悖论 ·  15 小时前  
元素和同位素地球化学  ·  《人类简史》人性的底层逻辑及其与文明发展的悖论 ·  15 小时前  
文汇学人  ·  张巍 | 史家修昔底德的“艺术散文” ·  5 天前  
为你读诗  ·  平生不读《道德经》,读书万卷也枉然 ·  3 天前  
为你读诗  ·  中国书法的智慧所在,不止坐落笔端 ·  3 天前  
51好读  ›  专栏  ›  极客挖掘机

小白学 Python 数据分析(14):Pandas (十三)数据导出

极客挖掘机  · 掘金  ·  · 2020-03-09 02:59

正文

阅读 21

小白学 Python 数据分析(14):Pandas (十三)数据导出

人生苦短,我用 Python

前文传送门:

小白学 Python 数据分析(1):数据分析基础

小白学 Python 数据分析(2):Pandas (一)概述

小白学 Python 数据分析(3):Pandas (二)数据结构 Series

小白学 Python 数据分析(4):Pandas (三)数据结构 DataFrame

小白学 Python 数据分析(5):Pandas (四)基础操作(1)查看数据

小白学 Python 数据分析(6):Pandas (五)基础操作(2)数据选择

小白学 Python 数据分析(7):Pandas (六)数据导入

小白学 Python 数据分析(8):Pandas (七)数据预处理

小白学 Python 数据分析(9):Pandas (八)数据预处理(2)

小白学 Python 数据分析(10):Pandas (九)数据运算

小白学 Python 数据分析(11):Pandas (十)数据分组

小白学 Python 数据分析(12):Pandas (十一)数据透视表(pivot_table)

小白学 Python 数据分析(13):Pandas (十二)数据表拼接

引言

先说个题外话,今天有位小朋友在后台给我留言,说我的公众号头像太吓人了,不敢关注我,怕我入侵她的手机。。。。。。。。。。。

emmmmmmmmmmmm,我都这么牛逼了么,我怎么不知道。

不知道有多少人是因为我的头像太吓人不敢关注我,所以我决定向广大的智慧超群的粉丝群体征集一个头像,没啥要求,积极、阳光、正面即可,如果能和公众号的名字极客或者挖掘机挂钩最佳,方式可以添加小编的微信(allen_6174)发给小编即可,如果采纳,将会全平台更换(可怜的我这个用了近一年的头像啊,我当时还觉得挺 cool 来着)。

闲话少说,我们开始今天的正题,数据导出。

当我们在对数据做完相应的处理后,想要将数据保存下来的时候,就需要用到数据导出了。

其实在前面的文章中,小编曾经使用过一次数据导出成 Excel ,当时没有详细介绍,本文我们详细介绍一下数据导出。

Excel 导出

在做数据导出前,我们需要现有一份 DataFrame 数据,这里的数据小编偷懒,就直接读取之前示例中的 Excel 了,当然这么做并没有什么意义,仅用来演示导出数据。

在 Pandas 中导出 Excel 的时候,需要使用到的方法是 to_excel() 方法,在导出 Excel 文件的时候,一定要写对文件路径,我们在前面的文章中有介绍过文件路径的书写方法,小编这里不多 BB ,直接上示例:

import pandas as pd

# 数据读取
df = pd.read_excel("table_join_exp.xlsx", sheet_name='Sheet1')

# 数据导出
df.to_excel(excel_writer=r'D:\Development\Projects\demo.xlsx')
复制代码

我们来看下 to_excel() 这个方法的语法:

DataFrame.to_excel(self, excel_writer, sheet_name='Sheet1', na_rep='', float_format=None, columns=None, header=True, index=True, index_label=None, startrow=0, startcol=0, engine=None, merge_cells=True, encoding=None, inf_rep='inf', verbose=True, freeze_panes=None) → None
复制代码

to_excel() 这个方法中的参数还是比较多的,我们挑几个常用的介绍一下:

  • excel_writer :文件路径或现有的ExcelWriter
  • sheet_name :字符串,默认是 “Sheet1”
  • float_format :格式化浮点数的字符串
  • header :写出列名。如果给定字符串列表,则假定它是列名称的别名。
  • index :写索引
  • columns :设置要导出的列
  • encoding :编码格式,一般我们选择 'utf-8'
  • na_rep :缺失值处理
  • inf_rep :无穷值的处理

接下来看示例,这个示例小编会尽量写得复杂一点,把我们上面的属性尽可能的都用上,并且标注好注释:

df.to_excel(excel_writer=r'D:\Development\Projects\demo.xlsx',
            sheet_name='测试文档', # 创建 sheet 名称
            index=False,  # 设置索引不显示
            columns=['编号', '姓名'],  # 设置要导出的列
            encoding='utf-8', # 设置编码格式
            na_rep='0', # 缺失值处理
            inf_rep='inf'  # 无穷值处理
            )
复制代码

CSV 导出

在导出 CSV 的时候,要使用到的方法是 to_csv() ,和上面导出 Excel 实际上相差并不大,一样是要先设置文件路径,接下来可以设置索引、导出的列、分隔符号、编码格式、缺失值等等。

还是先来看下 to_csv() 语法:

DataFrame.to_csv(self, path_or_buf: Union[str, pathlib.Path, IO[~AnyStr], NoneType] = None, sep: str = ',', na_rep: str = ''






请到「今天看啥」查看全文