Excel文件导入python进行判断处理并输出

爬虫俱乐部 · 公众号 · · 2018-07-31 10:03

正文

暑期Stata培训班招生啦！！！ 接力线上的网课培训，我们在今夏又开始新一轮的线下培训啦！ 8月4日至12日 ，爬虫俱乐部期待与您的相遇！培训具体内容详见推文《暑期Stata编程技术定制培训班》。

有问题，不要怕！点击推文底部“ 阅读原文 ”下载爬虫俱乐部用户问题登记表并按要求填写后发送至邮箱[email protected],我们会及时为您解答哟~

喜大普奔~爬虫俱乐部的github主站正式上线了！我们的网站地址是： https://stata-club.github.io ，粉丝们可以通过该网站访问过去的推文哟~

好消息：爬虫俱乐部隆重推出数据定制及处理业务啦，您有任何网页数据获取及处理方面的难题，请发邮件至我们邮箱 [email protected] ，届时会有俱乐部资深高级会员为您排忧解难！

最近武汉的天气“不负众望”，气象台连续发布高温橙色预警，还发短信提醒笔者注意防范，感动感动！但是，在这样“ 温暖 ”的日子里，笔者防不胜防啊，竟然因为吹空调感冒了！！！（ 此处省略一百字的复杂心情描述 ）妈妈提醒自己要赶紧喝药，喝药？！拿起药的第一反应竟然是看生产药品的厂家，不求长生、但求多福啊！炎炎夏日，笔者还要跟着大家一起好好学习python呐~

笔者这里有一份申银万国的行业分类下的医药生物行业的 287 家上市公司的相关信息，包括 证券代码 、 证券简称 、 上市日期 、 公司属性 和 上市地点 。笔者想要将这份Excel文件导入到Python中并进行判断处理和输出。

一、将Excel文件导入Python

若要实现将Excel文件导入到Python中，也就是在Python中读取Excel文件，这需要借助于第三方模块。今天笔者跟大家分享的是 xlrd 和 openpyx l模块。

在介绍两个模块前，笔者先来问大家一个常识问题：Excel的后缀.xls与.xlsx有什么区别？（此处没有答案，有需要找度娘）在了解了 .xls 与 .xlsx 的区别后，让我们继续往下看吧。

1.xlrd

xlrd 模块下的 open_workbook (filename) 函数可以实现Excel文件的读取，其中Excel文件的版本包括 .xls 和. xlsx。

在进行文件读取之前，首先需要在Python中安装 xlrd 模块，命令如下：

pip install xlrd

安装完成后，接着在Python中导入 xlrd 模块：

import xlrd

之后我们就可以读取Excel文件了。通过下图我们可以看到这份包含287家医药生物行业上市公司信息的Excel文件的后缀是.xlsx。

现在开始读取这份文件，命令如下：

workbook = xlrd.open_workbook('F:\爬虫俱乐部\爬虫俱乐部微信运营\推文\推文9\SW医药生物.xlsx')

通过控制台界面我们可以看到文件读取正常。我们将文件的后缀名改为 .xls 后文件的读取依然正常。

2. openpyxl

openpyxl 模块的功能较多，可实现Excel文件的读取和编写，但不能处理.xls文件。 openpyxl 模块下的 load_work book(filename) 函数可以实现文件的读取。同样，首先我们需要安装 openpyxl 模块，然后在Python中导入模块，接着读取文件。最后的控制台显示读取文件结果正常。

pip install openpyxl(命令提示符环境下)
import openpyxl
workbook = openpyxl.load_workbook('F:\爬虫俱乐部\爬虫俱乐部微信运营\推文\推文9\SW医药生物.xlsx')

二、文件内容的判断处理与输出

在成功读取Excel文件后，我们就可以进行处理了，比如笔者想实现输入某一股票名称就可以知道它的相关信息的功能应该怎么做呢？

在这里，笔者定义了一个函数 stock_details() ，当运行这个函数时，我们只需要输入相应的证券简称就可以输出股票的相关信息。首先，在输入证券简称后，这个函数会将证券简称这一列信息转为列表数据，并遍历所有的证券简称；其次，遍历证券简称这一列列表的元素个数，当证券简称与我们寻找的股票名称相匹配时，就输出这一行相应的 股票信息 ，如果没有这只股票的信息，则 没有输出结果 。

def stock_details():
     stock = input('Stock:')
     for col in list(sheet.columns)[1:2]: 
          for i in range(len(col)):
                if col[i].value == stock :
                      for row in list(sheet.rows)[i]:
                          print(row.value,end=" ")
stock_details()