数据分析不只有国外的Tableau,这款国产BI工具也不错!

2212
0

wuyingchun 数据达人Lv4

发表于2019-2-28 14:13

楼主
百家号上,关于商业智能分析和可视化,有两个网红工具:Tableau、PowerBI。在如今数据分析行业快速火热的今天,用它们来生成可视化dashboard,做数据探索分析,绝逼便捷。
小编也是数据分析爱好者,时常把弄一些工具。Tableau的可视化很人性,个人用就像是Excel的智能版。但如果针对业态多样,数据量大而庞杂的企业数据分析,尤其是面临数据建模、数据清洗等耗费很多人力的操作,其实有款国产工具能和Tableau扛上一扛——亿信BI。
可能是企业级应用的缘故,比较低调,推荐的不是很多,今天就来给他正个名。
(BI工程师、DBA、IT人可以关注下,职业利益相关)
在正式介绍它之前,先介绍一下什么是自助式BI。
自助式BI VS传统意识中的BI
Tableau和亿信BI都属于自助式BI,最大特点是用起来简单。
在自助式BI出现之前,BI通常只有具备IT技术背景的研发人员和数据科学家能用,他们多集中在企业技术部门,通常也称为企业级BI,典型工具如SAP的BO、IBM的cognos。它们最大的问题是使用门槛高,让懂业务却不懂技术的业务分析师望而却步,只能向IT提需求,并不能对数据做统筹。而且传统BI工具效率低,完成一个需求要经过数据建模、ETL架构设计、报表开发等一系列工作,通常3~15个人天,如果需求一改,这些工作又得重做。
同样的工作用自助式BI,数据没有大问题的话,1~2个人天。
为什么差距这么大?技术上主要:自助式BI是自动建模,传统BI是手动建模。
手动建模建出的模型是死的,使用聚合存储,建模之前必须把全部需求调查清楚,一旦需求有变,需要打回信息部重新沟通、建模、做模板,一前一后都有较高的沟通成本。自动建模是以表间关联为依据,多维数据库中存储明细数据,以深度优化的索引等技术保证即席运算性能。得到的模型灵活多变,需求变化的响应可以在OLAP层面,而非建模层面实现,免去了大量沟通和建模工作。这样的好处就是信息部可以授人以渔:信息部准备数据,教授业务部门做数据分析,立刻就知道问题出在哪里。
那么,作为自助式BI的亿信BI,其高效又体现在哪里?这里从工作效率、制作难度、需求应付率、可视化和数据处理性能上来介绍下。
如何让IT &业务配合更高效?
先来看一下亿信BI的产品结构图(如下图):用户接口层、分析引擎层、数据库层



用户接口层:亿信BI的客户端只需要一个浏览器即可,不需要安装其他额外的软件或者工具包,前台开发使用了最新的浏览器界面开发技术AJAX,AJAX技术可以给用户在浏览器上带来非常丰富的操作体验。
分析引擎层:多库JDBC连接池、OLAP引擎、报表引擎、线程池等部分,整个分析引擎层使用JAVA语言开发,是一个标准的WEB服务器,兼容JDK1.5及以后版本的JAVA运行环境,可以部署在几乎所有的操作系统平台上,兼容目前所有的商业的和开源的JAVA应用服务器。由于采用纯JAVA架构,所以亿信BI拥有良好的可扩展性和可移植性,如果当前运行的服务器性能无法满足海量数据或大量访问用户需求,则可以轻松迁移到小型机或其他操作系统环境。
数据库层:数据库层包括了用户已有的业务数据库和亿信BI的数据仓库。业务数据库中存放了大量的业务系统读写的数据,亿信BI可以直接分析其中的数据,这样做的好处是所有的分析都是即时的,没有延迟,但也会影响业务系统的性能;业务数据库中的数据也可以经过ETL(抽取、转换、加载)而存储到数据仓库中,经过ETL的数据是比较干净且利于分析的,在这样的数据上分析可以获得很好的性能。
亿信BI支持所有主流数据库如:Oracle、Ms SQL Server、DB2、Sybase、SybaseIQ、MySql、Greenplum、Teradata、Arterybase、达梦……
如何做一份让人眼前一亮的可视化分析?
比如下面这个大屏,通常应用在展厅、领导办公室、政务掌控中心。通常掌握上述的dashboard制作,30分钟就可以搞定。原理就是构建每一块图表,然后拼接在一起,美化一下背景,增加一些科技的元素。至于展示哪些数据,这个考量你的内功,需要根据你分析的思路来布局,最终能讲好一个故事。
具体教程:30分钟,教你零基础用BI搭建可视化大屏



除了分析,还能搞定复杂式中国报表!
之前有网友评价,诸如此类的BI工具无法制作复杂的中国式报表。这里喊一下冤,BI工具和报表工具还是不一样的,前者是为了数据分析,快速出报告;后者就是做报表的,就是数据展示。使用BI是对同一个问题从不同的角度进行分析、以多种形式展现分析结果、通过管理驾驶舱突出业务问题的本质。使用报表就是制作中国式复杂报表、固定格式报表、周报、月报等。
推荐配置
并发用户数小于10,在线用户数小于100,数据量小于10W行
适合项目:此配置适合用户量少,主要用于演示和软件试用,以及数据量比较小的生产环境。
响应时间:页面响应时间小于5秒、报表分析查询时间3-10秒内。
备注:此配置下系统可以支持超过预定并发用户数进行页面交互操作,但是限于CPU的并发能力,并发报表分析查询响应时间会下降。
并发用户数小于50,在线用户数小于500,数据量小于50万行
适合项目:此配置适合用户数在50左右,主要用于百万级数据量以下的综合分析项目。
响应时间:页面响应时间小于5秒、报表分析查询时间小于3-20秒内(报表复杂程度有关)。
备注:此配置下系统可以支持超过预定并发用户数进行页面交互操作,但是限于CPU的并发能力,并发报表分析查询响应时间会下降。
并发用户数小于100,在线用户数小于1000,数据量小于200万行
适合项目:此配置适合并发用户数在100左右,报表分析并发用户数小于50,主要用于百万级数据量左右的综合分析项目。
响应时间:页面响应时间小于5秒、报表分析查询时间小于3-20秒内(报表复杂程度有关)。
并发用户数小于200,在线用户数小于2000,数据量小于500万行
适合项目:此配置适合并发用户数在200左右,报表分析并发用户数小于100,主要用于百万级数据量左右的综合分析项目。
响应时间:页面响应时间小于5秒、报表分析查询时间小于3-40秒内(报表复杂程度有关)。
Ø 并发用户数大于200,在线用户数大于2000,数据量大于500万行
适合项目:主要用于千万级数据量左右的综合分析项目。
响应时间:页面响应时间小于5秒、报表分析查询时间小于3-60秒内(报表复杂程度有关)。
备注:此硬件配置可以保证并发能力下的响应,具体的报表分析时间受数据模型、SQL复杂程度影响。
亿信BI有类似办公协同软件OA的一套流程管理和权限控制,主要出于数据安全考虑。可以设置部门只能看部门内的数据,个人只能看个人权限范围内的数据,dashboard制作完分享给别人时,也可以指定分享给谁,被分享者收到通知后登录门户时,可以看到报表出现在桌面中,然后修改、批注。
我觉得这点比tableau好太多,尤其是出于数据安全的考虑,更能适应本土化的需求。
总结:
总得来说,业务部门更关注底层数据处理的可信度,是否真实反映业务状况,是否能高效便捷低成本的完成数据分析,指导业务经营。在底层数据处理上,亿信BI建立业务包这些操作,tableau要完善功能和易用性,让IT部门的人能互动,协同数据准备,高效而准确。
最后,关于这工具,个人免费,真的随便用,并没有阉割功能,只是有两个并发限制,毕竟是商业软件嘛。

最近看过此主题的会员

cuihr

pandabuxizao

佳佳123

陶雨萱

秋无名

annn123123

涼城

pcoye

ods888

lifr

阿橙

wxd88

QHD熊熊

小路123

万物盛华

老油条

0个回答

只看楼主

登录后可回答问题,请登录注册

快速回复 返回顶部 返回列表

小时

全天响应

分钟

快速处理问题

工程师强势助力

明星产品
解决方案
联系合作

400咨询:400-0011-866

技术支持QQ:400-0011-866(工作日9:00-18:00)

产品建议邮箱yixin@esensoft.com

关注我们

扫TA学习更多干货

一对一专家交流

版权所有© 2006-2024 北京亿信华辰软件有限责任公司 京ICP备07017321号 京公网安备11010802016281号