专栏名称: 小蚊子数据分析
数据分析知识、培训、招聘分享。
目录
相关文章推荐
中国地震台网  ·  新疆阿克苏地区沙雅县发生3.6级地震 ·  13 小时前  
新疆949交通广播  ·  降雪、大风,气温下降5~8℃ ·  15 小时前  
新疆949交通广播  ·  这12种首次违法和轻微违法行为,不予处罚! ·  昨天  
新疆949交通广播  ·  乌鲁木齐,上榜前三! ·  3 天前  
新疆是个好地方  ·  新疆,全国前五! ·  3 天前  
新疆是个好地方  ·  新疆,全国前五! ·  3 天前  
51好读  ›  专栏  ›  小蚊子数据分析

跟小白学Python数据分析——数据导入2

小蚊子数据分析  · 公众号  ·  · 2020-01-17 08:38

正文

Mr.林: 今天继续学习数据导入操作,昨天我们已经学会了导入CSV数据文件,今天我们学习导入TXT与EXCEL数据文件。

小白: 好啊!

Mr.林: 首先是导入TXT数据文件,使用的是 Pandas模块 中的read_table函数,数据还是与昨天一样,只是存为了TXT文件。有了昨天CSV数据文件的导入经验, 导入TXT数据文件 就轻车熟路了, 打开 spyder ,输入以下代码


1import pandas
2data = pandas.read_table(
3'D:/D/data.txt',
4 engine='python',
5 sep=',',
6 encoding='utf8'
7)


小白: 这个比导入CSV 文件多了个参数SEP,是设置列分隔符的意思吧?


Mr.林: 聪明,同样我给代码加上对应的注释,使用#来添加注释,这样解析器就不会执行注释所在的行的内容。
 1# 导入pandas模块
2import pandas
3# 使用pandas模块中的read_table导入data.txt文件
4data = pandas.read_table(
5# 第一个参数为数据文件所在的路径,因为是字符串需要用单引号引起
6'D:/D/data.txt',
7# 第二个参数是为了解决路径中包含中文字符无法导入的问题
8 engine='python',
9# 第三个参数是设置列之间的分隔符号
10 sep=',',
11# 第四个参数是设置数据文件对应的编码格式
12 encoding='utf8'
13)

Mr.林: 在变量浏览窗口中就可以看到刚导入的data变量了,双击打开data变量,就可以得到下面这张表


Mr.林: 接下来是导入EXCEL数据文件 使用的是 Pandas模块 中的read_excel函数, 输入以下代码


1# 导入pandas模块
2import pandas
3# 使用pandas模块中的read_excel导入data.xlsx文件
4data = pandas.read_excel(
5# 第一个参数为数据文件所在的路径,因为是字符串需要用单引号引起
6'D:/D/data.xlsx',
7# 第二个参数是设置需要导入的工作表名称
8sheet_name='Sheet1'
9)


小白: 这个最简单了,只要设置下需要导入的工作表名称是吧。


Mr.林: 是的 在变量浏览窗口中就可以看到刚导入的data变量了,双击打开data变量,就可以得到下面这张表


Mr.林: 小白,你发现没有,id、age这两列都有不同颜色标识

小白: 对呀,这是为什么呢?其他列为什么没有?

Mr.林: 因为这两列数据类型为整数型,你看打开的这个数据框最下面有一个 Background color选项被勾选上,这个功能相当于Excel条件格式中的色阶功能,它仅对整数型、浮点型有效,对其他数据类型无效。

我们可以使用下列命令查看下每列的数据类型


1data.dtypes


可以看到只有id、age是int64型,其他都是object类型







请到「今天看啥」查看全文


推荐文章
中国地震台网  ·  新疆阿克苏地区沙雅县发生3.6级地震
13 小时前
新疆949交通广播  ·  降雪、大风,气温下降5~8℃
15 小时前
新疆949交通广播  ·  乌鲁木齐,上榜前三!
3 天前
新疆是个好地方  ·  新疆,全国前五!
3 天前
新疆是个好地方  ·  新疆,全国前五!
3 天前