开源微服务编排框架:netflixconductor(代码片段)

阿里云云栖号 阿里云云栖号     2023-02-22     541

关键词:

简介:本文主要介绍netflix conductor的基本概念和主要运行机制。

作者 | 夜阳
来源 | 阿里技术公众号

本文主要介绍netflix conductor的基本概念和主要运行机制。

一 简介

netflix conductor是基于JAVA语言编写的开源流程引擎,用于架构基于微服务的流程。它具备如下特性:

  • 允许创建复杂的业务流程,流程中每个独立的任务都是由一个微服务所实现。
  • 基于JSON DSL 创建工作流,对任务的执行进行编排。
  • 工作流在执行的过程中可见、可追溯。
  • 提供暂停、恢复、重启等多种控制模型。
  • 提供一种简单的方式来最大限度重用微服务。
  • 拥有扩展到百万流程并发运行的服务能力。
  • 通过队列服务实现客户端与服务端的分离。
  • 支持 HTTP 或其他RPC协议进行数据传送

二 基本概念

1 Task

Task是最小执行单元,承载了一段执行逻辑,如发送HTTP请求等。

  • System Task:被conductor服务执行,这些任务的执行与引擎在同一个JVM中。
  • Worker Task:被worker服务执行,执行与引擎隔离开,worker通过队列获取任务后,执行并更新结果状态到引擎。Worker的实现是跨语言的,其使用Http协议与Server通信。

conductor提供了若干内置SystemTask:

  • 功能性Task:

    • HTTP:发送http请求
    • JSON_JQ_TRANSFORM:jq命令执行,一般用户json的转换,具体可见jq官方文档
    • KAFKA_PUBLISH: 发布kafka消息
  • 流程控制Task:

    • SWITCH(原Decision):条件判断分支,类似于代码中的switch case
    • FORK:启动并行分支,用于调度并行任务
    • JOIN:汇总并行分支,用于汇总并行任务
    • DO_WHILE:循环,类似于代码中的do while
    • WAIT:一直在运行中,直到外部时间触发更新节点状态,可用于等待外部操作
    • SUB_WORKFLOW:子流程,执行其他的流程
    • TERMINATE:结束流程,以指定输出提前结束流程,可以与SWITCH节点配合使用,类似代码中的提前return语句
  • 自定义Task:

    • 对于System Task,Conductor提供了WorkflowSystemTask 抽象类,可以自定义扩展实现。
    • 对于Worker Task,可以实现conductor的client Worker接口实现执行逻辑。

2 Workflow

  • Workflow由一系列需要执行的Task组成,conductor采用json来描述Task的流转关系。
  • 除基本的顺序流程外,借助内置的SWITCH、FORK、JOIN、DO_WIHLE、TERMINATE任务,还能实现分支、并行、循环、提前结束等流程控制。

3 Input&Output

Task的输入是一种映射,其作为工作流实例化的一部分或某些其他Task的输出。允许将来自工作流或其他Task的输入/输出作为随后执行的Task的输入。

  • Task有自己的输入和输出,输入输出都是jsonobject类型。
  • Task可以引用其他Task的输入输出,使用$taskxxx.output的方式引用。引用语法为json-path,除最基础的$taskxxx.output的值解析方式外,还支持其他复杂操作,如过滤等,具体见json-path语法。
  • 启动Workflow时可以传入流程的输入数据,Task可以通过$workflow.input的方式引用。

Task实现原子操作的处理以及流程控制操作,Workflow定义描述Task的流转关系,Task引用Workflow或者其它Task的输入输出。通过这些机制,conductor实现了JSON DSL对流程的描述。

三 整体架构

主要分为几个部分:

  • Orchestrator: 负责流程的流转调度工作;
  • Management/Execution Service: 提供流程、任务的管理更新等操作;
  • TaskQueues: 任务队列,Orchestrator解析出来的待执行Task会放到队列中;
  • Worker: 任务执行worker,从TaskQueues中获取任务,通过Execution Service更新任务状态与结果数据;
  • Database: 元数据&运行时数据库,用于保存运行时的Workflow、Task等状态信息,以及流程任务定义的等原信息;
  • Index: 索引数据库,用于存储执行历史;

四 运行模型

1 Task状态转移

  • SCHEDULED:待调度,task放到队列中还没有被poll出来执行时的状态
  • IN_PROGRESS:执行中,被poll出来执行但还没有完成时的状态
  • COMPLETED:执行完成
  • FAILED:执行失败
  • CANCELLED:被中止时为此状态,一般出现在两种情况:

    1. 手动中止流程时,正在运行中的task会被置为此状态;
    2. 多个fork分支,当某个分支的task失败时,其它分支中正在运行的task会被置为此状态;

2 任务队列

任务的执行(同步的系统任务除外)都会先添加到任务队列中,是典型的生产者消费者模式。

  • 任务队列,是一个带有延迟、优先级功能的队列;
  • 每种类型的Task是一个单独的队列,此外,如果配置了domain、isolationGroup,还会拆分成多个队列实现执行隔离;
  • decider service是生产者,其根据流程配置与当前执行情况,解析出可执行的task后,添加到队列;
  • 任务执行器(SystemTaskWorker、Worker)是消费者,其长轮询对应的队列,从队列中获取任务执行;

队列接口可插拔,conductor提供了Dynomite 、MySQL、PostgreSQL的实现。

3 核心功能实现机制

conductor调度的核心是decider service,其根据当前流程运行的状态,解析出将要执行的任务列表,将任务入队交给worker执行。

decide主要流程简化如下,详细代码见WorkflowExecutor.java的decide方法:

其中,调度任务处理流程简化如下,详细代码见WorkflowExecutor.java的scheduleTask方法:

decide的触发时机

最主要的触发时机:

  1. 新启动执行时,会触发decide操作
  2. 系统任务执行完成时,会触发decide操作
  3. Workder任务通过ExecutionService更新任务状态时,会触发decide操作

流程控制节点的实现机制

1)Task & TaskMapper

对于每一个Task来说,都有Task和TaskMapper两部分:

  1. Task:任务的执行逻辑代码,它的作用是Task的执行
  2. TaskMapper:任务的映射逻辑代码,它通过Task的定义配置、当前实例的执行状态等信息,返回实际需要执行的Task列表

对于一般的任务来说,TaskMapper返回的是就是Task本身,补充一些执行实例的状态信息。但是对于控制节点来说,会有不同的逻辑。

2)条件分支(SWITCH)的实现机制

SWITCH用于根据条件判断,执行不同的分支。

实际上,该节点的Task不做任何操作,TaskMapper根据分支条件,判断出要走的分之后,返回对应分支的第一个Task。

SwitchTaskMapper.java getMappedTasks方法关键代码:

// 待调度的Task list,最终返回结果
List<Task> tasksToBeScheduled = new LinkedList<>();
// evalResult是分支条件变量的值(case)
// decisionCases是一个Map结构,key为分支的case值,value为对应分支的任务定义list(分支内的任务定义会有多个)
// 根据分支变量的实际值,获取对应分支的任务定义list
List<WorkflowTask> selectedTasks = taskToSchedule.getDecisionCases().get(evalResult);
// default的逻辑:如果获取不到对应的分支或者分支为空,则用默认的分支
if (selectedTasks == null || selectedTasks.isEmpty()) 
  selectedTasks = taskToSchedule.getDefaultCase();

if (selectedTasks != null && !selectedTasks.isEmpty()) 
  // 获取分支的第一个(下标0)task,返回给decider service去做调度(decider会把任务添加到队列里,交给worker去执行)
  WorkflowTask selectedTask = selectedTasks.get(0);
  // 调用了deciderService的getTasksToBeScheduled方法,此方法里又获取到TaskMapper调用了getMappedTasks。这里采用了递归调用的方式,解析嵌套的Task
  List<Task> caseTasks = taskMapperContext.getDeciderService()
    .getTasksToBeScheduled(workflowInstance, selectedTask, retryCount, taskMapperContext.getRetryTaskId());
  tasksToBeScheduled.addAll(caseTasks);
  switchTask.getInputData().put("hasChildren", "true");

return tasksToBeScheduled;

3)并行(FORK)的实现机制

FORK用于开启多个并行分支。

实际上,该节点的Task不做任何操作,TaskMapper返回所有并行分支的第一个Task。
ForkJoinTaskMapper.java getMappedTasks关键代码:

// 待调度的Task list,最终返回结果
List<Task> tasksToBeScheduled = new LinkedList<>();
// 配置中的所有fork分支
List<List<WorkflowTask>> forkTasks = taskToSchedule.getForkTasks();
for (List<WorkflowTask> wfts : forkTasks) 
  // 每个分支取第一个Task
  WorkflowTask wft = wfts.get(0);
  // 调用了deciderService的getTasksToBeScheduled方法,此方法里又获取到TaskMapper调用了getMappedTasks。这里采用了递归调用的方式,解析嵌套的Task
  List<Task> tasks2 = taskMapperContext.getDeciderService()
    .getTasksToBeScheduled(workflowInstance, wft, retryCount);
  tasksToBeScheduled.addAll(tasks2);

return tasksToBeScheduled;

总的来说,分支(SWITCH)、并行(FORK)节点本身没有执行逻辑,其通过TaskMapper返回到实际要执行的Task,然后交给Decider Service处理。

重试的实现机制

重试和其延迟时间设置,都是借助任务队列的功能实现的。

重试:将任务重新添加到任务队列

重试的延迟时间:添加到任务队列时设置延迟时间,延迟时间过后,任务才能在队列中被poll出来执行

五 完整性保障机制

由于调度过程中可能会出现因机器重启、网络异常、JVM崩溃等偶发情况,这些会导致的decide过程意外终止,流程执行不完整,展现出如流程一直运行中(实际已经没有在调度),或者其它状态错误等异常现象。

1 WorkflowReconciler

针对这种情况,conductor有一个WorkflowReconciler,会定期尝试decide所有正在运行中的流程,修复流程执行的一致性。此外,它还有一个作用是校验流程超时时间。

2 decideQueue

那么WorkflowReconciler是如何获取到当前运行中的流程呢,答案是decideQueue。
decideQueue和任务队列相同,也是一个具有延迟功能的队列,其存放的是正在执行中的流程的实例id。在任务开始执行时(包括新启动执行、重试执行、恢复执行、重跑执行等),会将实例id push到decideQueue中;在执行结束(成功、失败)时,会从decideQueue中删除实例id。

3 ExecutionLockService

WorkflowReconciler会定期尝试decide所有正在运行中的流程用于超时判断、维护流程一致性。但是流程本身正常执行也会触发decide,如果同一个执行同时触发两个decide,可能会导致状态混乱,执行卡住等问题。

conductor采用了锁来解决这个问题,其提供了单机LocalOnlyLock(基于信号量实现)、redis分布式锁(基于redission实现)、zookeeper分布式锁三种实现。

decide方法中最开始会尝试获取锁,如果获取失败则直接返回。通过锁来保障不会对同一个流程实例并发执行decide。

if (!executionLockService.acquireLock(workflowId)) 
  return false;

由于锁是可配置的,可能会导致一个误区:单台机器的话不用配置锁。其实单机也是需要配置锁的,因为WorkflowReconciler和流程正常执行会产生冲突,可能会导致偶发的流程状态混乱问题。

原文链接
本文为阿里云原创内容,未经允许不得转载。 

springboot+nacos+kafka实现微服务流编排

...设为“星标”,和你一起掌握更多数据库知识前言微服务开发涉及了一些数据处理模块的开发,每个处理业务都会开发独立的微服务,便于后面拓展和流编排。学习了SpringCloudDataFlow等框架,感觉这个框架对于我们... 查看详情

微服务架构开源框架详情介绍

...概念,很多IT行业的人对这个概念并不陌生。微服务架构开源框架的兴起自然离不开大环境的需求,也是数字化转型时期的重要产物。流辰信息想行业之所需,潜心研发出的IBPS微服务架构得到了行业内的认可和赞许,是助阵企业... 查看详情

腾讯开源的云原生多运行时微服务框架

...子,每日更新,精彩不断。Femas是腾讯云微服务平台TSF的开源产品形态,聚焦微服务运行时,提供给多框架统一服务发现、南北及东西流量治理、服务可观测、配置管理等一站式微服务管控能力,解决企业微服务架构转型中异构... 查看详情

微服务架构中的编排与编排[关闭]

】微服务架构中的编排与编排[关闭]【英文标题】:orchestrationvschoreographyinMicroservicearchitecture[closed]【发布时间】:2018-11-2622:32:44【问题描述】:在微服务架构中,我阅读了编排和编排的概念。是否有任何关于选择编排和编排的指... 查看详情

微服务架构洁介绍及开源框架

微服务现在是一个很火的概念,尤其是搞IT的大多数都对其有所了解。到底火到什么程度呢?2016年有一个统计说,两千家企业里,30%在使用微服务,15%在实验开发和测试微服务架构,24%在学习微服务准备转型,只有剩下的30%的企... 查看详情

单独的微服务只是为了微服务编排?

】单独的微服务只是为了微服务编排?【英文标题】:Separatemicroservicejustformicroservicesorchestration?【发布时间】:2021-02-1622:25:18【问题描述】:我有一些微服务,其中每个微服务都有用于CRUD操作的REST端点。我必须创建一个工作流... 查看详情

spring boot 微服务如何实现编排? [关闭]

】springboot微服务如何实现编排?[关闭]【英文标题】:Howtoachieveorchestrationwithspringbootmicroservice?[closed]【发布时间】:2017-10-1905:17:06【问题描述】:在SpringBoot中编排微服务的最佳方式是什么。【问题讨论】:编排到底是什么意思... 查看详情

如何编排微服务

】如何编排微服务【英文标题】:howOrchestratemicroservices【发布时间】:2018-08-0508:41:41【问题描述】:我一直在尝试将我们的部分soa架构(MuleESB)迁移到微服务(SpringBoot堆栈),但我面临一个与我们有多个编排的大型流相关的问... 查看详情

开源推荐-c++开发的微服务框架tars

...入的研发。2020年3月10日,Linux基金会正式宣布旗下的TARS开源项目成立TARS子基金会。这是一个专注于微服务领域的开源基金会,致力于帮助企业拥抱微服务体系架构,解决在使用微服务方面可能出现的问题。这是首个起源于中国... 查看详情

腾讯正式对外开源高性能rpc开发框架与微服务平台tars

...构TAF(TotalApplicationFramework)多年的实践成果总结而成的开源项目,目前已于4月10日正式对外开源。 作为支持多语言的高性能RPC开发框架和配套一体化的服务治理平台,Tars可以帮助企业或者用户以微服务的方式快速构建稳定可靠... 查看详情

使用dockercompose编排微服务(代码片段)

使用DockerCompose编排微服务经过前文讲解,可使用Dockerfile(或Maven)构建镜像,然后使用docker命令操作容器,例如dockerrun、dockerkiil等。然而,使用微服务架构的应用系统一般包含若干个微服务,每个微服务一般都... 查看详情

开源微服务api网关,单核2万qps,今年最值得学习的开源项目

文章较长,从概念与场景,到原理与架构,到性能分析,最后是demo,希望大家有收获。第一部分:解决什么问题。什么是微服务API网关?API网关是上承前端用户,下接后端服务的咽喉之地,是所有客户端请求响应出入流量的必... 查看详情

容器生态系统(续)

...rm是Docker开发的容器编排引擎。kubernetes是Google领导开发的开源容器编排引擎,同时支持Docker和CoreOS容器。mesos是一个通用的集群资源调度平台,mesos与marathon一起提供容器编排引擎功能。 容器管理平台容器管理平台能够支持多... 查看详情

腾讯开源业界首个云原生标准的一站式微服务管理框架femas

...为云原生微服务架构,腾讯经过多年的探索与创新,正式开源业界首个云 查看详情

微服务架构和层

】微服务架构和层【英文标题】:Microservicearchitectursandlayers【发布时间】:2016-08-1112:58:02【问题描述】:让我们讨论一下微服务环境的架构。我们正在公司内部进行讨论,我想要一些反馈。我认真考虑的是编排层(代码重复,更... 查看详情

宜信开源微服务任务调度平台(sia-task)

 背景无论是互联网应用或者企业级应用,都充斥着大量的批处理任务。常常需要一些任务调度系统帮助开发者解决问题。随着微服务化架构的逐步演进,单体架构逐渐演变为分布式、微服务架构。在此的背景下,很多原先的... 查看详情

一个netflix开发的微服务编排引擎,支持可视化工作流定义(代码片段)

一个Netflix开发的微服务编排引擎,支持可视化工作流定义导读:相对于传统架构,微服务架构下更需要通过各微服务之间的协作来实现一个完整的业务流程,可以说服务编排是微服务架构下的必备功能。NetflixConductor作为服务编排... 查看详情

longhorn发布:基于微服务的开源分布式块存储

Longhorn项目现已正式发布!这是一个基于云和容器部署的分布式块存储新方式。Longhorn遵循微服务的原则,利用容器将小型独立组件构建为分布式块存储,并使用容器编排来协调这些组件,形成弹性分布式系统。WhyLonghorn?如今,... 查看详情