-
辰哥 管理员
发表于2019-6-26 11:37
楼主
数据整合
ABI支持对数据进行数据抽取、数据清洗、数据转换、数据调度、运行监控等,该模块采用了设计区和运行区隔离架构。
设计区是数据建模和ETL设计的环境,所有ETL的编制和更改通过设计区完成调试后,通过发布机制,到稳定的运行环境。
运行区是ETL作业调度执行的环境。在设计区编辑修改ETL时(未做重新发布),并不会影响运行区中ETL的调度执行。
ETL过程设计提供了可视化定义ETL作业信息,支持作业的试运行和断点调试等操作,丰富的组件能协助用户完成ETL数据加工边调试边预览数据的目的。
点击新建ETL设计跳入编辑页面,它包含多种组件,如:输入输出组件、转换组件、流程组件、数仓组件、脚本组件等。
ETL过程流编辑器是以图形化的方式完成ETL过程的前驱后继关系和调度顺序的定义。
点击新建ETL过程流,流程包含开始、文件监听任务、ETL过程、ETL过程流、分支任务、存储过程任务、SQL任务、Shell任务、参数赋值、结束节点。
调度设置主要用于配置作业的计划执行时间。调度设置支持cron表达式,调度设置能指定到月份、日期、小时、分钟的粒度,也支持按照星期的方式来进行计划任务的执行。同时能设置调度的时间窗口,重调时间间隔。