-
wuyingchun 数据达人Lv4
发表于2019-3-26 17:32
楼主
本帖最后由 wuyingchun 于 2019-3-26 17:34 编辑
Hadoop:
在Apache的Hadoop的软件库是一个大数据框架。它允许跨计算机集群分布式处理大型数据集。它旨在从单个服务器扩展到数千台计算机。
特征:
使用HTTP代理服务器时的身份验证改进
Hadoop兼容文件系统工作规范
支持POSIX样式的文件系统扩展属性
它提供了强大的生态系统,非常适合满足开发人员的分析需求
它带来了数据处理的灵活性
它允许更快的数据处理
亿信BI:
亿信BI是一种大数据分析工具。深耕大数据应用每个环节,专为中国式复杂报表量身打造。亿信BI内置数十种可视化元素和图形,还原事件场景掌握动态数据信息。能够快速发现问题,解决问题,找到原因,发现内在关系。真正释放企业数据力量,辅导领导决策,驱使企业不断进步
特征:
基于B/S架构、零安装,友好的WEB操作界面、零编程交互式分析,一键更换报表皮肤,异构数据库一键迁移。
广泛的数据源支持,轻松应对中国式复杂报表,纯WEB打印、多语言切换、报表订阅、计划任务。
智能分析引擎、多线程并行计算、路径自动规划、支持大数据、支持集群部署。
丰富的自定义拓展,开放的集成接口,二次开发平台,灵活兼容多种数据模型,轻松构建更多应用。
Cloudera:
Cloudera是最快,最简单,最安全的现代大数据平台。它允许任何人在单个可扩展平台内的任何环境中获取任何数据。
特征:
高性能分析
· 它提供多云服务
跨AWS,Microsoft Azure和Google Cloud Platform部署和管理Cloudera Enterprise
启动和终止集群,只需在需要时支付所需的费用
开发和培训数据模型
报告,探索和自助服务商业智能
提供监控和检测的实时洞察
进行准确的模型评分和服务
Rapidminer:
Rapidminer是一个开源的大数据工具。它用于数据准备,机器学习和模型部署。它提供了一套产品来构建新的数据挖掘流程和设置预测分析。
特征:
允许多种数据管理方法
GUI或批处理
与内部数据库集成
交互式,可共享的仪表板
大数据预测分析
远程分析处理
数据过滤,合并,加入和聚合
构建,培训和验证预测模型
将流数据存储到众多数据库中
报告和触发的通知
蜂巢:
Hive也是一个开源软件大数据。它允许程序员在Hadoop上分析大型数据集。它有助于快速查询和管理大型数据集。
特征:
它支持SQL,如用于交互和数据建模的查询语言
它使用两个主要任务map和reducer编译语言
它允许使用Java或Python定义这些任务
Hive专为管理和查询结构化数据而设计
Hive的SQL语言将用户与Map Reduce编程的复杂性区分开来
它提供Java数据库连接(JDBC)接口