数据报告是作为数据分析师必不可少的工作之一,而目前大部分数据分析师所处环境可能是excel画图制表,然后制作成word或者email的方式。对于周期性的报告,每次重复操作其实蛮痛苦的。
那么今天给大家安利一个可以自动化生成报告的包knitr,笔者用了半年多,只能说对于非码农的分析师来说,简直就是天赐的福利。
系统:windows / linux(注:如果要生成PDF的报告需要安装 MiKTeX / TeX Live 2013)
环境:Rstudio /Rstudio - server
包:knitr
恩,安装包这种小活直接跳过了(library()),现在Rstduio还是蛮智能的,缺少的包可以直接帮你一次安装。
入正题:
首先建立一个knitr文档,你可以File-New File-R Markdown ,也可以直接点File下面的然后创建。
接下来会提示你生成哪一种,我们这里直接选择Document好了,如果你想做PPT可以使用Presentation。Title你可以在此处修改,也可以在生成后的文档修改,Author同理。
建立好文档之后的样子:最上面的部分是基础信息,比如标题、作者、日期、输出类型之类的,可以直接写字符串写死,也可以使用函数(后面会有演示)。
其余的部分是knitr文档自带演示,英文就不用解释了吧,就是告诉你一下基础信息balabala,可以点击Knit HTML来运行。最好提供一个单独的文件夹,如果后期你要在文档里加入诸多元素的话。
先来看一下执行结果,生成了一个html预览,同时在文件内生成了对应的html文件和rmd文件。来看一下html内容,可以看到每一个
```{r cars}
summary(cars)
```
都可以是一个单独的展示模块,无论是代码、输出结果、图表都可以展示出来,当然也可以用参数来控制显示那些部分内容,展示的尺寸等等。例如:echo = FALSE表示不显示代码,message = FALSE 表示不显示信息,warning = FALSE表示不显示警告信息,fig.width = number 表示设置展示宽度等等,更多的信息可以查看官方文档。
案例是很简单,可能觉得和报告相差的比较远啊,表着急,knitr支持ggplot2、R echarts、shiny等,可以让你的报告各种炫酷。
OK,下面我们来一个稍微简单一些实战,帮助大家进一步认识。
执行以后的结果:
是不是感觉脱离重复性作报告指日可待!当然这只是很简单的操作,也只是自动化报告的一小部分。
End.
作者:Leon(中国统计网特邀认证作者)
本文为中国统计网原创文章,需要转载请联系中国统计网([email protected] ),转载时请注明作者及出处,并保留本文链接。