专栏名称: 分布式实验室
最专业的Docker文章,最权威的Docker新闻。关注容器生态圈的发展。
目录
相关文章推荐
51好读  ›  专栏  ›  分布式实验室

Apache OpenWhisk架构概述

分布式实验室  · 公众号  · 后端  · 2017-06-19 07:45

正文

Apache OpenWhisk(http://openwhisk.org/)是一个由IBM和Adobe驱动的开源项目,它是一个健壮的FaaS平台,可以部署在云或数据中心内。相比其他serverless项目,OpenWhisk是一个健壮的、可扩展的平台,支持数千并发触发器和调用。


你可以使用Bluemix托管版本的OpenWhisk或在自己的开发机器上部署基于Vagrant的OpenWhisk环境。在本文中,我们将探索OpenWhisk的设计和架构,识别各种组件及其作用。


要获得最佳的指南,建议在自己的机器上部署基于Vagrant的OpenWhisk环境。OpenWhisk的CLI,wsk应该配置本地的设置。


架构的快速回顾


Apache OpenWhisk旨在作为异步和松耦合的执行环境,可以基于外部触发器运行功能。开发人员编写独立的功能,作为操作上传,完全独立于事件源。事件源通过必不可少的正确的参数集调用操作。


一旦操作就位,开发人员就可以创建触发器。触发器是事件源显式调用端点,事件源如:数据库、流处理引擎、文件系统和业务应用程序等。一个操作独立于触发器,这意味着触发器可能或可能没有任何操作绑定。当事件源触发一个触发器时,可能不知道被调用的操作。绑定到触发器的操作集只在运行时被发现和执行。


但是,开发人员如何使用触发器绑定操作?这就出现了规则。规则作为触发器和操作之间的粘合,在触发器和操作之间创建松耦合的关联。该设计模式使得相同的操作可以被不同的触发器调用。



这种松耦合的架构使OpenWhisk成为可扩展、可靠和强大的无服务器平台。 执行的每个层都被设计成独立扩展。


操作、规则和触发器可以通过REST端点创建和管理。 事件源调用一个操作所需要做的就是调用触发器的REST API。


下面是演示的工作流程,突出了创建和调用代码的简单而强大的机制:


$ cat > hello.js <


OpenWhisk的构建模块


现在来看看OpenWhisk的核心组件。


下图描绘了OpenWhisk的架构。 从Nginx到Kafka到Docker,这个serverless平台使用多种技术。



通过访问Vagrant Box,使用SSH去检查运行的Docker容器和拉取的图像:


$ docker ps --format "{{.Names}} - {{.Image}}"

wsk0_425_warmJsContainer_20170202T014345371Z - whisk/nodejs6action:latest

wsk0_424_warmJsContainer_20170202T014153330Z - whisk/nodejs6action:latest

nginx - nginx:1.11

invoker0 - whisk/invoker:latest

controller - whisk/controller:latest

kafka - ches/kafka:0.10.0.1

zookeeper - zookeeper:3.4

registrator - gliderlabs/registrator

consul - consul:0.7.0

couchdb - couchdb:1.6


前两个容器代表最近被调用的操作,而其他容器则直接映射到核心组件。下面让我们了解每个组件的作用。


Nginx


这个开源Web服务器暴露HTTP(S)端点给客户端。它主要用做API的反向代理以及终止SSL连接。每个进入OpenWhisk基础架构的请求,包括那些源自wsk CLI的请求,都通过该层。由于它是完全无状态的,所以Nginx层可以轻松扩展。


控制器


在通过反向代理的请求之后,会触发控制器,该控制器充当系统的守门员。在Scala中,该组件负责OpenWhisk API的实际实现。在将控件交给下一个组件之前,它会执行每个请求的身份验证和授权。控制器被认为是系统的协调者,它将决定请求最终采取的路径。


CouchDB


系统的状态在CouchDB(一个开源JSON数据存储)中进行维护和管理。凭证、元数据、命名空间以及操作、触发器和规则的定义存储在CouchDB中。控制器根据存储在此数据库中的凭证识别凭证。


可以通过访问http://192.168.33.13:5984/_utils/(链接仅在开发者机器上使用)从浏览器访问数据库。



查看创建的初始的操作、触发器和规则集http://192.168.33.13:5984/_utils/database.html?vagrant_vagrant-ubuntu-trusty-64_whisks:



helloAction的源代码也保留在CouchDB中,包括操作的定义、默认参数和所分配的资源配额:



OpenWhisk中的每次调用都会导致一个激活,它包含Action的输出。 例如,以下命令异步调用helloAction导致新的激活ID:


$ wsk -i action invoke helloAction

ok: invoked /guest/helloAction with id 8004746e06f147b99c1e8b0be875ec64

The output of this invocation can be retrieved through the following command.

$ wsk -i activation get --summary 8004746e06f147b99c1e8b0be875ec64

activation result for /guest/helloAction (success at 2017-02-02 08:01:46 +0530 IST)

{

"msg": "Hello World"

} 


如下是存储在CouchDB中的输出。



Consul


OpenWhisk、Kubernetes和Swarm这样的现代分布式计算平台依靠分布式键/值存储进行状态管理。 OpenWhisk使用Consul作为系统每个组件可访问的单一数据源。 同时,consul还提供服务发现功能,使控制器发现调用操作的实体。 这些实体被称为调用者(Invokers),它们直接负责执行代码。 Consul拥有可用的调用者及其健康状况清单。


Consul支持注册者Registrator,注册者可以观看新的Docker容器,并检查他们,决定他们提供的服务。 当Docker引擎创建一个新的容器时,注册者会收到被推入Consul的事件。


当Controller需要将操作委派给调用者时,它会在Consul列表中查找合适的候选人。


Consul的UIhttp://192.168.33.13:8500/ui/#/dc1/services:



查看可用的调用者:http://192.168.33.13:8500/ui/#/dc1/kv/invokers/



Kafka


Apache Kafka通常用于构建实时数据管道和流应用程序。它支持需要可靠、高速数据摄取的生产工作负载。 OpenWhisk利用Kafka连接控制器和调用者。


kafka缓存由控制器发送的消息,然后再将它们传递给上节的Consul的调用者。当kafka确认消息被传递时,控制器立即用激活ID进行响应。这种无状态架构使OpenWhisk具有高度可扩展性。


Apache ZooKeeper维护和管理Kafka集群。 Zookeeper的主要工作是跟踪Kafka群集中存在的节点的状态,并跟踪主题、消息和配额。


调用者(Invoker)


调用者使用Scala实现,调用者是处理执行过程的最后阶段。基于运行时的要求和配额分配,会自动创建一个新的Docker容器,作为所选操作的执行单位。 调用者从CouchDB复制源代码,并将其注入Docker容器。一旦执行完成,它将激活的结果存储在CouchDB中,以便将来检索。 调用者决定重新使用现有的“热”容器,或启动一个暂停的“暖”容器,或启动一个新的“冷”容器进行新的调用。它会查询Conusl的容器状态以进行适合的调用。


可能有多个调用者取决于平台的负载和利用率。


根据元数据,调用者会选择要使用的容器图像。以下是调用helloAction的两个容器。







请到「今天看啥」查看全文