专栏名称: 生信媛
生信媛,从1人分享,到8人同行。坚持分享生信入门方法与课程,持续记录生信相关的分析pipeline, python和R在生物信息学中的利用。内容涵盖服务器使用、基因组转录组分析以及群体遗传。
目录
相关文章推荐
51好读  ›  专栏  ›  生信媛

快速入门Julia

生信媛  · 公众号  · 生物  · 2020-02-20 14:28

正文

请到「今天看啥」查看全文


快速入门一门新的编程语言的关键是你已经熟练掌握了一门编程语言。这样子,当你遇到一门新的编程语言,你就不会因为它详细的文档而感到不安,而是可以根据自己的需要径直去查找内容。

Julia的特点是什么呢?根据它的文档,它是一门动态面向对象的编程语言,能够交互式进行数据探索,并且它基于LLVM实现的JIT使得它的性能可以媲美C语言。

软件安装

在国内的USTC镜像站点上, https://mirrors.ustc.edu.cn/julia/releases/ 根据自己的操作系统下载合适的版本。

基本入门

国内翻译了软件1.1版本的文档,见https://docs.juliacn.com/latest/

我目前只能使用MacOS,需要运行下面这一行来进入交互命令行

  1. exec '/Applications/Julia-1.3.app/Contents/Resources/julia/bin/julia'

并且我非常顺利的运行了第一条命令,也就是hello world.

不需要学习任何的Julia知识,根据你对R语言和Python理解,你就知道如何在Julia进行数值运算,以及变量创建。

  1. julia> 100 + 200

  2. 300

  3. julia> 300 / 200

  4. 1.5

  5. julia> a = "hello world"

  6. "hello world"

  7. julia> a = 2

  8. 2

  9. julia> b = 3

  10. 3

  11. julia> a+b

  12. 5

我还瞎猜了它的数据结构和一些基本函数

  1. julia > a= [1,2,3]

  2. 3-element Array{Int64,1}:

  3. 1

  4. 2

  5. 3

  6. julia> sum(a)

  7. 6

这里的a说明它是一个Array数据结构,存放了三个Int64类型的数据。它和R语言一样,都是以1作为开始下标,而不是0. 但是和R语言不一样的是,他不能做 a + 1 这种操作,这方面和Python的Numpy一样,支持下面的运算。

  1. a = [1,2,3]

  2. b = [4,5,6]

  3. a + b

Julia的函数写法有两种,一种和数学公式一样优雅

  1. julia> f(x,y) = x+ y

  2. # 支持Unicode编码

  3. julia> 武汉() = print("加油!")

  4. 武汉 (generic function with 1 method)

  5. julia> 武汉()

  6. 加油!

如果需要写出复杂的递归代码,就需要用到第二种写法

  1. > function fib(x)

  2. if (x == 0) return 1

  3. end

  4. if ( x<=2) return x

  5. end

  6. return fib(x-1) +fib(x-2)

  7. end

上面就是一个递归形式的斐波那契计算函数。

当然为了写出复杂的函数,必须借助于条件语句,循环语句。

  1. julia> if x < y

  2. println("x is less than y")

  3. elseif x > y

  4. println("x is greater than y")

  5. else

  6. println("x is equal to y")

  7. end

  8. julia> for i in [1,4,0]

  9. println(i)

  10. end

你会发现Julia的条件语句和循环语句和Python的很类似,除了你得在最后加一个end,表示结束(这让我想起了shell脚本)

数据读写和扩展安装

其实我认为如何读取数据是更加重要的内容,如果不能把自己的数据加载到程序中,那么学会上面这些操作就好比学了屠龙技,却发现没有龙。

这一点R语言比较好,知道你需要读取csv或者txt, 直接给你提供了read.table这个函数,读取之后就是数据框,就跟打开Excel一样。当然这也是R语言的问题,如果你第一门编程语言是R语言,那么你可能会忽略掉读取过程中数据流缓冲和类型判断。

但是Julia并不是原生就带着这些函数的,你需要自己额外安装一些包(就如同Python要装Numpy和Pandas一样)

  1. # 安装包

  2. using Pkg

  3. Pkg.add("CSV" )

  4. Pkg.add("DataFrames")

之后的操作,如何你学过Python的Pandas,那么你可以无缝衔接

  1. # 加载包

  2. using CSV

  3. using DataFrames

  4. df =DataFrame(CSV.File("input.csv"))

  5. # 或是试试管道的语法

  6. df = CSV.file("input.csv") |> DataFrame!

常规的数据切片

  1. df[1,:] #第一行

  2. df[:, 1] #第一列

参考对应文档了解更多内容

  • https://juliadata.github.io/DataFrames.jl/stable/

  • https://juliadata.github.io/CSV.jl/stable/

画图

R语言有ggplot2生态系统,Python里有Matplotlib为基础的绘图体系。

Julia则是Plot.jl

  1. Pkg.add("Plots")

感受下一个官方提供的代码

  1. using Plots

  2. ## 结构体

  3. mutable struct Lorenz

  4. dt; σ; ρ; β; x; y; z

  5. end

  6. ## 赋值

  7. attractor = Lorenz((dt = 0.02, σ = 10., ρ = 28., β = 8//3, x = 1., y = 1., z = 1.)...)


  8. ## 创建数据集

  9. function step!(l::Lorenz)

  10. dx = l.σ*(l.y - l.x) ; l.x += l.dt * dx

  11. dy = l.x *(l - l.z) - l.y ; l.y += l.dt * dy

  12. dz = l.x*l.y - l.β*l.z ; l.z += l.dt * dz

  13. end




  14. # initialize a 3D plot with 1 empty series

  15. plt = plot3d(1, xlim=(-25,25), ylim=(-25,25), zlim=(0,50),

  16. title = "Lorenz Attractor", marker = 2)


  17. # build an animated gif by pushing new points to the plot, saving every 10th frame

  18. @gif for i=1:1500

  19. step!(attractor )

  20. push!(plt, attractor.x, attractor.y, attractor.z)

  21. end every 10

这会生成一个GIF酷炫的GIF动图,大家可以自己试一下

当然了,上面这个图我肯定画不出来,我们可以画画R语言的鸢尾花数据集

  1. Pkg.add("StatsPlots")

  2. # load a dataset

  3. using RDatasets

  4. iris = dataset("datasets", "iris");


  5. # load the StatsPlots recipes (for DataFrames) available via:

  6. using StatsPlots


  7. # Scatter plot with some custom settings

  8. @df iris scatter(:SepalLength, :SepalWidth, group=:Species,

  9. title = "My awesome plot",

  10. xlabel = "Length", ylabel = "Width",

  11. m=(0.5, [:cross :hex :star7], 12),

  12. bg=RGB(.2,.2,.2))


  13. # save a png

  14. png("iris")

更多画图内容对应文档:

  • https://github.com/JuliaPlots/Plots.jl

Julia是一门不断发展的新兴编程语言,在2年前,当你用百度搜索的时候,我都怀疑百度在开车。现在,搜索的第一条终于是Julia的主站,并且也有了中文站,还有了较为不错的生态。

虽然它的性能不错,但大部分人都是面向 调用 编程,所以还是老老实实用我的R语言吧。








请到「今天看啥」查看全文