专栏名称: 编程派
Python程序员都在看的公众号,跟着编程派一起学习Python,看最新国外教程和资源!
目录
相关文章推荐
Python爱好者社区  ·  商汤科技,彻底爆了 ·  3 天前  
Python中文社区  ·  用 Python 打造加密货币实时价格追踪器 ·  3 天前  
Python开发者  ·  劝大家早点拿下软考证,风口已经很明显了 ·  3 天前  
Python中文社区  ·  看完秒懂!用 Python 快速实现交易策略回测 ·  5 天前  
Python爱好者社区  ·  小白如何用AI写作赚到第一桶金? ·  6 天前  
51好读  ›  专栏  ›  编程派

如何用Python绘制学术报告图表?

编程派  · 公众号  · Python  · 2017-03-14 11:43

正文

作者:ExcelTing

原文:http://cnblogs.com/excelting/p/6507680.html

全文约 3581 字,读完可能需要 5 分钟。

论文中图表形式多样,常用的处理工具有excel、MATLAB以及Python等。excel自处理的方法有两个缺陷:

1.当数据较多时,容易出现excel"翻白眼"的现象; 2.需要使用subplot功能或批量处理时,使用MATLAB或Python更为方便; 3.excel处理的图在美观程度上较论文图表标准有一定的距离。

对比MATLAB以及Python的plot功能,从图的美观角度出发,Python稍占优势,下文讲简要介绍将excel中的数据提取到Python中并利用Python的matplotlib库制图的过程。

一.如何将Excel中的数据导入Python中:

此部分主要介绍如何将Excel中的数据导入python中(原始数据可能在.txt或.out文件中,且数据较为繁杂,可以先利用MATLAB或python将数据进行处理存入Excel中,包括一些简单的计算、排列等,以便于之后的绘图,或直接利用python提取.txt中数据,在此不做详细介绍),主要方法是利用python的xlrd库,流程如下:

  1. ##  导入xlrd库

  2. import xlrd

  3. ##  读取指定Excel文件(此处为excel_dir)中的数据

  4. data=xlrd.open_workbook(excel_dir)

  5. ##  读取指定data中某sheet(此处命名为sheetname)中的数据

  6. table=data.sheet_by_name(sheetname)

  7. ## 读取table中某一列的数据

  8. needs=table.col_values(0)

其中有几个需要说明的点:

1.excel_dir和sheetname如何定义?

excel_dir应写成字符串的格式(即' '或者" "),最终应以.xls或.xlsx等Excel的后缀结尾,比如读取Administrator桌面上的名为result.xls的文件可写为:

  1. excel_dir = 'C:\Users\Administrator\Desktop\result.xls'

  2. data=xlrd.open_workbook(excel_dir)

sheetname定义的方法同上,除此之外sheet还有通过索引顺序的读取方法:

  1. table = data.sheets()[0]       ## 通过索引顺序获取

  2. table = data.sheet_by_index(0) ## 通过索引顺序获取

2.如何读取某单元格或者某行的数据?

流程中所示为读取某sheet中某列的数据,同理某行数据为:

  1. table.col_values(i)

读取某单元格数据命令为:

  1. table.cell(i,j).value

3.读取某行或某列数据时,数据的范围是什么?

举个例子:当某sheet中表格如下时,会读取4×3表格中的数据。

即若想读取B列数据,代码应写为

  1. table.col_values(1)

注意:python是从0开始计数的,故column number应为1,此时计入的信息为:[u'',u'',4,u'']

且注意table的维度由各个sheet决定,及若某excel表格有多个sheet,可能出现list长度不同的情况。

4.如果想取某列2-5行如何做呢?

  1. table.col_values(i)[1:5]

5.若想取到最后一个数字,应如何编写代码?

由于各行/列的数据类型可能不同,可能会出现第一列仅4个数字,而第二列有9个数字,而最多的一列有100个数字等类似的情况,若直接用取整列的命令,会使list中掺入u'',导致下一步的绘图出错,此时可以使用如下方法:

  1. a_col=table.col_values(i)

  2. a=a_col[0,a_col.index(u'')]

但需注意,此命令不能对控制行数的列使用,否则也会报错,可编写其他判断语句进行鉴别是否使用该命令。

二.如何利用Python进行绘图:

此处介绍利用matplotlib库进行绘图的方法,首先应导入matplotlib库:

  1. import numpy as np

  2. import matplotlib.pyplot as plt

绘图方法很简单,大致流程如下:

  1. ##  绘图命令,1为图号,并设置figsize

  2. fig_drift= plt.figure(1,figsize=(12,4))

  3. ##  设置数据在x轴和y轴的坐标,以及颜色、标签等属性,此处用了两组数据

  4. plt.plot(drift[0], story,"g-",label='$Damped$')

  5. plt.plot(drift[1], story,"r-.",label='$Undamped$')

  6. ##  设置x轴和y轴的标签

  7. plt.xlabel('Drift')

  8. plt.ylabel('Storey')

  9. ##  选择显示数据组标签

  10. plt.legend()

  11. ##  设置x轴和y轴的间隔及范围

  12. plt.xticks((0.000,0.005,0.010,0.015))

  13. plt.yticks(range(1,5,1))

  14. ##  设置图名

  15. plt.title('minor')

其中需要说明的几点:

1.如何绘制多图?

很简单,只需在设置了图号名之后,插入:

  1. ax2 = plt.subplot(132)

  2. plt.sca(ax2)

后面的命令与前述一致,值得一提的是,plt.subplot(131)指的是绘制一个含有1×3子图的图,且ax2代表的是第2张图,而plt.sca(ax2)表示选择该子图。

2.设置x轴、y轴以及其他命令如何判断是赋予哪张图的属性呢?

matplotlib会直接将该属性赋予上一plot对象。

3.如何绘制散点图?

把pl.plot(x, y)改成pl.plot(x, y, 'o')即可。

4.其他一些设置参数:

  1. ##  设置x轴和y轴的上下限

  2. pl.xlim(i, j)

  3. pl.ylim(m,n)

  4. ##  显示图

  5. pl.show()

  6. ##  保存图,自动存为png格式

  7. plt.savefig(dir+name.png,dpi=600

除此之外还支持设置x轴(y轴)坐标显示,绘制饼状图、直方图等功能,在此不再一一介绍。

三.说点题外话:

曾经看过一句话:“世界上没有烂语言,只有写语言的烂人”。

每种语言各自有其优势,也有其劣势,在此不做过多评价。如何利用语言实现绘图或达到更多目标,在于我们如何选择。恰到好处地使用for或def、class等语句,能使一段代码如虎添翼,写在这里,作为给自己的提醒:遇到问题先明确方法、形成体系再进入编写,不要盲目地将看似正确的语言进行强行拼凑,返工率极高。

毕竟第一篇,有点激动,再特别介绍一下我们团队的成员吧(虽然只有两个人):算了还是不介绍了。

以上内容若有问题或疑问,请联系[email protected]


题图:pexels,CC0 授权。

点击阅读原文,查看更多 Python 教程和资源。