-
-
wuyingchun 数据达人Lv4
发表于2019-2-28 14:13
楼主
百家号上,关于商业智能分析和可视化,有两个网红工具:Tableau、PowerBI。在如今数据分析行业快速火热的今天,用它们来生成可视化dashboard,做数据探索分析,绝逼便捷。
小编也是数据分析爱好者,时常把弄一些工具。Tableau的可视化很人性,个人用就像是Excel的智能版。但如果针对业态多样,数据量大而庞杂的企业数据分析,尤其是面临数据建模、数据清洗等耗费很多人力的操作,其实有款国产工具能和Tableau扛上一扛——亿信BI。
可能是企业级应用的缘故,比较低调,推荐的不是很多,今天就来给他正个名。
(BI工程师、DBA、IT人可以关注下,职业利益相关)
在正式介绍它之前,先介绍一下什么是自助式BI。
自助式BI VS传统意识中的BI
Tableau和亿信BI都属于自助式BI,最大特点是用起来简单。
在自助式BI出现之前,BI通常只有具备IT技术背景的研发人员和数据科学家能用,他们多集中在企业技术部门,通常也称为企业级BI,典型工具如SAP的BO、IBM的cognos。它们最大的问题是使用门槛高,让懂业务却不懂技术的业务分析师望而却步,只能向IT提需求,并不能对数据做统筹。而且传统BI工具效率低,完成一个需求要经过数据建模、ETL架构设计、报表开发等一系列工作,通常3~15个人天,如果需求一改,这些工作又得重做。
同样的工作用自助式BI,数据没有大问题的话,1~2个人天。
为什么差距这么大?技术上主要:自助式BI是自动建模,传统BI是手动建模。
手动建模建出的模型是死的,使用聚合存储,建模之前必须把全部需求调查清楚,一旦需求有变,需要打回信息部重新沟通、建模、做模板,一前一后都有较高的沟通成本。自动建模是以表间关联为依据,多维数据库中存储明细数据,以深度优化的索引等技术保证即席运算性能。得到的模型灵活多变,需求变化的响应可以在OLAP层面,而非建模层面实现,免去了大量沟通和建模工作。这样的好处就是信息部可以授人以渔:信息部准备数据,教授业务部门做数据分析,立刻就知道问题出在哪里。
那么,作为自助式BI的亿信BI,其高效又体现在哪里?这里从工作效率、制作难度、需求应付率、可视化和数据处理性能上来介绍下。
如何让IT &业务配合更高效?
先来看一下亿信BI的产品结构图(如下图):用户接口层、分析引擎层、数据库层

用户接口层:亿信BI的客户端只需要一个浏览器即可,不需要安装其他额外的软件或者工具包,前台开发使用了最新的浏览器界面开发技术AJAX,AJAX技术可以给用户在浏览器上带来非常丰富的操作体验。
分析引擎层:多库JDBC连接池、OLAP引擎、报表引擎、线程池等部分,整个分析引擎层使用JAVA语言开发,是一个标准的WEB服务器,兼容JDK1.5及以后版本的JAVA运行环境,可以部署在几乎所有的操作系统平台上,兼容目前所有的商业的和开源的JAVA应用服务器。由于采用纯JAVA架构,所以亿信BI拥有良好的可扩展性和可移植性,如果当前运行的服务器性能无法满足海量数据或大量访问用户需求,则可以轻松迁移到小型机或其他操作系统环境。
数据库层:数据库层包括了用户已有的业务数据库和亿信BI的数据仓库。业务数据库中存放了大量的业务系统读写的数据,亿信BI可以直接分析其中的数据,这样做的好处是所有的分析都是即时的,没有延迟,但也会影响业务系统的性能;业务数据库中的数据也可以经过ETL(抽取、转换、加载)而存储到数据仓库中,经过ETL的数据是比较干净且利于分析的,在这样的数据上分析可以获得很好的性能。
亿信BI支持所有主流数据库如:Oracle、Ms SQL Server、DB2、Sybase、SybaseIQ、MySql、Greenplum、Teradata、Arterybase、达梦……
如何做一份让人眼前一亮的可视化分析?
比如下面这个大屏,通常应用在展厅、领导办公室、政务掌控中心。通常掌握上述的dashboard制作,30分钟就可以搞定。原理就是构建每一块图表,然后拼接在一起,美化一下背景,增加一些科技的元素。至于展示哪些数据,这个考量你的内功,需要根据你分析的思路来布局,最终能讲好一个故事。
具体教程:30分钟,教你零基础用BI搭建可视化大屏

除了分析,还能搞定复杂式中国报表!
之前有网友评价,诸如此类的BI工具无法制作复杂的中国式报表。这里喊一下冤,BI工具和报表工具还是不一样的,前者是为了数据分析,快速出报告;后者就是做报表的,就是数据展示。使用BI是对同一个问题从不同的角度进行分析、以多种形式展现分析结果、通过管理驾驶舱突出业务问题的本质。使用报表就是制作中国式复杂报表、固定格式报表、周报、月报等。
推荐配置
并发用户数小于10,在线用户数小于100,数据量小于10W行
适合项目:此配置适合用户量少,主要用于演示和软件试用,以及数据量比较小的生产环境。
响应时间:页面响应时间小于5秒、报表分析查询时间3-10秒内。
备注:此配置下系统可以支持超过预定并发用户数进行页面交互操作,但是限于CPU的并发能力,并发报表分析查询响应时间会下降。
并发用户数小于50,在线用户数小于500,数据量小于50万行
适合项目:此配置适合用户数在50左右,主要用于百万级数据量以下的综合分析项目。
响应时间:页面响应时间小于5秒、报表分析查询时间小于3-20秒内(报表复杂程度有关)。
备注:此配置下系统可以支持超过预定并发用户数进行页面交互操作,但是限于CPU的并发能力,并发报表分析查询响应时间会下降。
并发用户数小于100,在线用户数小于1000,数据量小于200万行
适合项目:此配置适合并发用户数在100左右,报表分析并发用户数小于50,主要用于百万级数据量左右的综合分析项目。
响应时间:页面响应时间小于5秒、报表分析查询时间小于3-20秒内(报表复杂程度有关)。
并发用户数小于200,在线用户数小于2000,数据量小于500万行
适合项目:此配置适合并发用户数在200左右,报表分析并发用户数小于100,主要用于百万级数据量左右的综合分析项目。
响应时间:页面响应时间小于5秒、报表分析查询时间小于3-40秒内(报表复杂程度有关)。
Ø 并发用户数大于200,在线用户数大于2000,数据量大于500万行
适合项目:主要用于千万级数据量左右的综合分析项目。
响应时间:页面响应时间小于5秒、报表分析查询时间小于3-60秒内(报表复杂程度有关)。
备注:此硬件配置可以保证并发能力下的响应,具体的报表分析时间受数据模型、SQL复杂程度影响。
亿信BI有类似办公协同软件OA的一套流程管理和权限控制,主要出于数据安全考虑。可以设置部门只能看部门内的数据,个人只能看个人权限范围内的数据,dashboard制作完分享给别人时,也可以指定分享给谁,被分享者收到通知后登录门户时,可以看到报表出现在桌面中,然后修改、批注。
我觉得这点比tableau好太多,尤其是出于数据安全的考虑,更能适应本土化的需求。
总结:
总得来说,业务部门更关注底层数据处理的可信度,是否真实反映业务状况,是否能高效便捷低成本的完成数据分析,指导业务经营。在底层数据处理上,亿信BI建立业务包这些操作,tableau要完善功能和易用性,让IT部门的人能互动,协同数据准备,高效而准确。
最后,关于这工具,个人免费,真的随便用,并没有阉割功能,只是有两个并发限制,毕竟是商业软件嘛。