前言
虽然很早就知道R被微软收购,也很早知道R在统计分析处理方面很强大,开始一直没有行动过。。。直到
直到12月初在微软技术大会,看到我软的工程师演示R的使用,我就震惊了,然后最近在网上到处了解和爬一些R的资料,看着看着就入迷了,这就是个大宝库了,以前怎么没发现,看来还是太狭隘了。直到前几天我看到这个Awesome R文档,我就静不下来了,对比了目前自己的工作和以后的方向,非常适合我。所以毫不犹豫的把这个文档汉化了,所以大家一起享受吧。
说明:本文已经提交到github,地址:
https://github.com/asxinyu/awesome-R
,由于个人知识和能力限制,部分组件特别是机器学习方面比较专业的术语无法翻译,如果有懂的朋友可以留言或者在github直接修改。一起完善。
这里有很多非常不错的R包和工具. 该想法来自于awesome-machine-learning.
这里是包的导航清单,看起来更方便 https://awesome-r.com
通过这些翻译了解这些工具包,以后干活也就方便多了。不过翻译这个东西的确要靠耐心,翻译,编辑花费了至少一周的空余时间。
在编辑本文的过程中,惊喜的发现原来博客园也有大神在翻译Awesome系列的其他资源:这个朋友 张果 ,已经翻译了3个资源,分别是JAVA,.NET和JavaScript,有空应该组个团,一起完善其他语言。
链接如下
1.DotNet 资源大全中文版(Awesome最新版)
链接:
https://github.com/jobbole/awesome-dotnet-cn
2.Java资源大全中文版(Awesome最新版)
链接:
https://github.com/jobbole/awesome-java-cn
3.JavaScript资源大全中文版(Awesome最新版)
链接:
https://github.com/jobbole/awesome-javascript-cn
1、集成开发环境
-
RStudio - 一个非常强大高效的图形界面开发环境,可以在Windows, Mac, 和Linux运行.
官网:
http://www.rstudio.org/
-
Emacs + ESS - ESS是一个emacs文本编辑器的一个统计分析的插件.
官网:
http://ess.r-project.org/
-
Sublime Text + R-Box - 一个在Sublime 2/3中使用R语言编程的插件.
官网:
http://github.com/randy3k/R-Box/
-
TextMate + r.tmblundle - TextMate 1/2的插件.
官网:
https://github.com/textmate/r.tmbundle
-
StatET - 一个基于Eclipse的R语言IDE.
官网:
http://www.walware.de/goto/statet
-
Revolution R Enterprise - 专注于大数据,大规模多处理器的功能,可以对学术用户免费提供和商业使用.
官网:
http://www.revolutionanalytics.com/get-revolution-r-enterprise
-
R Commander - 一个包括基本图形用户界面的R包.
官网:
http://socserv.mcmaster.ca/jfox/Misc/Rcmdr/
-
IRkernel - Jupyter的R语言内核.
官网:
https://github.com/IRkernel/IRkernel
-
Deducer - 一个菜单驱动的数据分析的GUI工具,类似电子表格数据编辑器.
官网:
http://www.deducer.org/pmwiki/pmwiki.php?n=Main.DeducerManual?from=Main.HomePage
-
Radiant - 一个使用R语言,独立的基于浏览器接口的业务分析平台,基于Shiny.
官网:
http://vnijs.github.io/radiant/
-
Vim-R - Vim中R语言插件.
官网:
https://github.com/vim-scripts/Vim-R-plugin
-
Nvim-R - Neovim中R语言插件.
官网:
https://github.com/jalvesaq/Nvim-R
-
JASP - 一个完整的贝叶斯和概念论相关方法的R包,和使用SPSS非常相似。
官网:
https://jasp-stats.org/
-
Bio7 - 一个包括创建,科学图像分析和统计分析的IDE.
官网:
http://www.bio7.org/
-
RTVS - Visual Studio中R开发工具.
官网:
http://microsoft.github.io/RTVS-docs/
2、语法
-
magrittr - 一个R语言高效的管道操作包.
官网:
https://github.com/smbache/magrittr
-
pipeR - 多泛型管道的实现.
官网:
https://github.com/renkun-ken/pipeR
-
lambda.r - R语言中函数式编程和简单的模式匹配.
官网:
https://github.com/zatonovo/lambda.r
-
purrr - 一个高级函数编程语言包.
官网:
https://github.com/hadley/purrr
3、数据操作
-
dplyr - 快速数据操作和数据库查询.
官网:
https://github.com/hadley/dplyr
-
data.table - 使用短小灵活的语法操作数据.
官网:
https://github.com/Rdatatable/data.table
-
reshape2 - 灵活的数据排列,聚合处理.
官网:
https://github.com/hadley/reshape
-
readr - 一个快速简单的读取表格数据到R中的包.
官网:
https://github.com/hadley/readr
-
haven - 对导入SPSS,STATA和SAS的文件进行改进.
官网:
https://github.com/hadley/haven
-
tidyr - 方便对数据进行整理、传播和收集.
官网:
https://github.com/hadley/tidyr
-
broom - 将统计分析对象转换成整齐的数据框(一种数据组织和呈现的方式).
官网:
https://github.com/dgrtwo/broom
-
rlist - 一个操作非规范化数据的工具箱.
官网:
https://github.com/renkun-ken/rlist
-
jsonlite - 一个快速解析JSON文件的包.
官网:
https://github.com/jeroenooms/jsonlite
-
ff - 设计用来存储大型数据集的数据结构.
官网:
http://ff.r-forge.r-project.org/
-
lubridate - 一组日期和时间函数.
官网:
http://cran.r-project.org/web/packages/lubridate/index.html
-
stringi - 基于ICU的字符串处理方案.
官网:
http://www.rexamine.com/resources/stringi/
-
stringr - 基于stringi之上的对字符串处理API.
官网:
https://github.com/hadley/stringr
-
bigmemory - 提供共享内存和内存映射矩阵,同时也包提供额外的工具,包括线性模型.(biglm) 和随机森林 (bigrf).
官网:
http://cran.r-project.org/web/packages/bigmemory/index.html
-
fuzzyjoin - 使用不精确匹配的方式连接表数据.
官网:
https://github.com/dgrtwo/fuzzyjoin
-
tidyverse - 简单从tidyverse下载和安装包.
官网:
https://github.com/hadley/tidyverse
4、图形显示
-
ggplot2 - 强大的绘图统计和计算图形系统的实现.强烈推荐.
官网:
https://github.com/hadley/ggplot2
-
ggfortify -一个ggplot2(流行的统计软件包)统一的接口(使用一行代码即可).
官网:
https://github.com/sinhrks/ggfortify
-
ggrepel - 排除重叠的文本标签.
官网:
https://github.com/slowkow/ggrepel
-
ggalt - ggplot2额外的坐标系统,几何和统计.
官网:
https://github.com/hrbrmstr/ggalt
-
ggtree - 可视化和注释的系统树.
官网:
https://github.com/GuangchuangYu/ggtree
-
ggplot2 Extensions - ggplot2扩展显示例子.
官网:
https://ggplot2-exts.github.io/ggiraph.html
-
lattice - 一个强大优雅的高级数据可视化系统.
官网:
http://lattice.r-forge.r-project.org/
-
corrplot - 图形显示相关矩阵或一般矩阵。它还包含一些矩阵重新排序算法.
官网:
https://github.com/taiyun/corrplot
-
rgl - R中3D可视化系统.
官网:
http://cran.r-project.org/web/packages/rgl/index.html
-
Cairo - 一个使用cairo组件创建高质量显示输出的R图形包.
官网:
http://cran.r-project.org/web/packages/Cairo/index.html
-
extrafont - 在R中图像中使用字体的工具.
官网:
https://github.com/wch/extrafont
-
showtext - 让R图形设备显示文本的时候使用系统字体.
官网:
https://github.com/yixuan/showtext
-
animation - 一个使用 ImageMagick在R中产生动画图形的工具.
官网:
http://yihui.name/animation/
-
gganimate - 用ggplot2创建简单的动画.
官网:
https://github.com/dgrtwo/gganimate
-
misc3d - 强大的3D绘图工具.
官网:
https://cran.r-project.org/web/packages/misc3d/index.html
-
xkcd - 在图表中使用xkcd风格.
官网:
https://cran.r-project.org/web/packages/xkcd/index.html
-
imager - 一个基于CImg库的图像处理包.
官网:
http://dahtah.github.io/imager/
5、HTML部件
-
d3heatmap - 使用D3绘制互动的热图.
官网:
https://github.com/rstudio/d3heatmap
-
DataTables - 将R矩阵或数据框作为交互的HTML表.
官网:
http://rstudio.github.io/DT/
-
DiagrammeR - 在R中创建JS图表和流程图.
官网:
https://github.com/rich-iannone/DiagrammeR
-
dygraphs - 在R中绘制时间序列数据图形.
官网:
https://github.com/rstudio/dygraphs
-
formattable - 可格式化的数据结构.
官网:
http://renkun.me/formattable/
-
ggvis - R中交互式的图形处理语法.
官网:
https://github.com/rstudio/ggvis
-
Leaflet - 一个非常流行的交互式地图JavaScript组件.
官网:
http://rstudio.github.io/leaflet/
-
MetricsGraphics - 可以轻松创建D3散点图、折线图和直方图.
官网:
http://hrbrmstr.github.io/metricsgraphics/
-
networkD3 - D3 JavaScriptR网络图.
官网:
http://christophergandrud.github.io/networkD3/
-
scatterD3 - D3 互动散点图.
官网:
https://github.com/juba/scatterD3
-
plotly - 使用plot.ly进行交互式ggplot2和Shiny绘图.
官网:
https://github.com/ropensci/plotly
-
rCharts - 交互式JS绘图.
官网:
https://github.com/ramnathv/rCharts
-
rbokeh - Bokeh的R接口.
官网:
http://hafen.github.io/rbokeh/
-
threejs - 交互式3D散点图和地球仪.
官网:
https://github.com/bwlewis/rthreejs
-
timevis - 创建完全交互式的时间轴可视化图形.
官网:
https://github.com/daattali/timevis
-
visNetwork - 使用vis.js类库进行网络可视化.
官网:
https://github.com/datastorm-open/visNetwork
6、复用组件研究
-
knitr - R中简单的动态报表生成工具.
官网:
http://yihui.name/knitr/
-
xtable - 将表格导出到LaTeX或者HTML.
官网:
http://cran.r-project.org/web/packages/xtable/index.html
-
rapport - 一个R模版系统.
官网:
http://rapport-package.info/#intro
-
rmarkdown - R动态文档工具.
官网:
http://rmarkdown.rstudio.com/
-
slidify - 创建和发布漂亮的html5展示效果.
官网:
https://github.com/ramnathv/slidify
-
Sweave - 使用R创建LaTeX报表的R包.
官网:
https://www.statistik.lmu.de/~leisch/Sweave/
-
texreg - 在LaTex和HTML中格式化统计模型.
官网:
http://www.philipleifeld.de/software/texreg/texreg.html
-
checkpoint - 从检查点快照服务器安装包.
官网:
https://github.com/RevolutionAnalytics/checkpoint
-
brew - 报告模板的生成框架.可以和knitr合并.
官网:
https://cran.r-project.org/web/packages/brew/index.html
-
ReporteRs - 一个生成微软Word, PowerPoint和HTML报表的R包. 、
官网:
http://davidgohel.github.io/ReporteRs/index.html
-
bookdown - 使用R Markdown编写书籍.
官网:
https://bookdown.org/
-
ezknitr - 避免使用'knitr'带来的工作目录的痛苦.
官网:
https://github.com/daattali/ezknitr
7、Web技术和服务
-
Web Technologies List - 关于如何使用R和网络的相关信息.
官网:
https://github.com/ropensci/webservices
-
shiny - 使用R创建简单的Web交互应用.
官网:
https://github.com/rstudio/shiny
-
RCurl - 常规的网络客户端接口 (HTTP/FTP/...) .
官网:
http://cran.r-project.org/web/packages/RCurl/index.html
-
httr - 使用更加友好的RCurl封装.
官网:
https://github.com/hadley/httr
-
httpuv - HTTP和WebSocket服务程序.
官网:
https://github.com/rstudio/httpuv
-
XML - R中生成和解析XML的工具.