数据可视化的数据从哪来?

886
0

小亿 管理员

发表于2022-3-30 11:03

楼主
大数据时代,数据驱动决策。处理不好庞大、复杂的数据,其价值将大打折扣。可以想象一本没有图片的教科书。没有图表、图形或是带有箭头和标签的插图或流程图,那么这门学科将变得更加难以理解。人类天生就是视觉动物,而视觉效果对于分析数据、传达实验结果甚至做出惊人的发现至关重要。
工作中我们可能会接触到很多业务数据,需要在总结汇报中展示呈现,俗话说“字不如表,表不如图”,想学好数据可视化分析就必须多做项目,多实战,只有这样才能把平时学的统计学,概率论知识、数据分析模型等真正用起来。
那么从哪找数据可视化的练习数据呢?小亿今天和大家聊聊这些。
图片1.png
一、数据可视化的数据类型
数据的作用不一,当我们有不同的需求时就需要不同的数据。如需要宏观经济相关的指标或者某个市场整体的数据,这些数据是有所不同的。
内部数据是在企业或者行业的业务运转中产生,比如常见的用户数据、产品数据、销售数据、内容数据等等。获取内部数据我们可以安装在线软件或者或者进行调查以收集数据。内部的数据相对来说更加完善、规整,作用也更加细腻。搭建起内部数据模型对于企业来说是有必要也是具有重大意义的,就像亿信ABI能够为企业搭建起一个从数据接入到数据分析的一体化数据工具,从而打通企业内部数据壁垒,整合好企业内部数据。
但也有很多时候我们需要利用的是外部数据。当进行市场调研,竞品分析,或者输出报告的时候,外部数据的分析是必不可少的。外部数据就多种多样了,有GDP、行业总值、行业发展状况等等,这些外部数据帮助我们了解一个行业,并对此进行分析。
一般来说,可视化数据分析中的数据包括以下几类:
1、交易数据(TRANSACTION DATA)、
大数据平台能够获取时间跨度更大、更海量的结构化交易数据,这样就可以对更广泛的交易数据类型进行分析,不仅仅包括POS或电子商务购物数据,还包括行为交易数据,例如Web服务器记录的互联网点击流数据日志。
2、人为数据(HUMAN-GENERATED DATA)
非结构数据广泛存在于电子邮件、文档、图片、音频、视频,以及通过博客、维基,尤其是社交媒体产生的数据流。这些数据为使用文本分析功能进行分析提供了丰富的数据源泉。
3、移动数据(MOBILE DATA)
能够上网的智能手机和平板越来越普遍。这些移动设备上的App都能够追踪和沟通无数事件,从App内的交易数据(如搜索产品的记录事件)到个人信息资料或状态报告事件(如地点变更即报告一个新的地理编码)。
4、机器和传感器数据(MACHINE AND SENSOR DATA)
这包括功能设备创建或生成的数据,例如智能电表、智能温度控制器、工厂机器和连接互联网的家用电器。这些设备可以配置为与互联网络中的其他节点通信,还可以自动向中央服务器传输数据,这样就可以对数据进行分析。机器和传感器数据是来自新兴的物联网(IoT)所产生的主要例子。来自物联网的数据可以用于构建分析模型,连续监测预测性行为(如当传感器值表示有问题时进行识别),提供规定的指令(如警示技术人员在真正出问题之前检查设备)。

二、数据可视化的数据来源
要做实战学习数据可视化,就要掌握数据来源的网站,小亿根据不同的数据类型给大家推荐一些网站。
1、金融财经数据源网站
(1)、世界银行
世界银行的公开数据库,免费并公开获取世界各国的发展数据。

(2)、国际货币基金组织(IMF):

(3)、CEIC:
CEIC拥有最完整的,超过128个国家的经济数据,能够精确查找GDP, CPI, 进口,出口,外资直接投资,零售,销售,以及国际利率等深度数据。

(4)、Wind(万得):
万得被誉为中国的Bloomberg,在金融业有着全面的数据覆盖,金融数据的类目更新极快,很受国内的商业分析者和投资人的亲睐,但是部分数据是收费的。

(5)、同花顺数据中心:
提供股票债券等金融数据

(6)、金融数据网:
提供每日的黄金、汇率、农产品、汽油价格的相关数据,友情链接中国人民银行、中国证监会、金牛理财网,中国蓝网等网站。

2、互联网趋势分析数据源网站
(7)、TalkingData移动观象台:
覆盖到七大模块的内容——应用排行、公众号排行、App Store排行、终端指数、数据报告、市场洞察、人迹地图。包含各种数据报告。

(8)、199IT:
容纳众多互联网数据报告,其导航网站收集了众多数据相关的网站链接,例如IBM商业研究院的2021年CIO调研报告;巨量算数的2021国民财富生活白皮书(附下载);中国信通院:2021年中国智慧农业发展研究报告(附下载);艾瑞咨询:2021年中国场景音乐用户洞察白皮书(附下载)等等。

(9)、艾瑞网:
艾瑞网能够查看较新的数据报告,主攻网络媒体、电子商务、网络游戏等新经济领域

3、汽车行业数据源网站
(10)、中国汽车工业协会:
主要是新车数据,包括产销和进出口情况,没有二手车数据。

(11)、中国汽车流通协会:
相比中国汽车工业协会网站包含了二手车数据。

(12)、易车指数:
主要面向购车者、汽车从业者,针对国内汽车销售市场,为购车者或汽车从业者提供参考的数据指数。

4、房产行业数据源网站
(13)、房天下产业网:
网站数据来源于中国指数研究院和CREIS中指数据,展示国内房地产数据情况

(14)、国信房地产信息网:
国家信息中心主办的网站,含有1400w+数据。

(15)、中指研究院:
主要研究房地产的各项数据,包括房地产行业、企业研究。

5、综合性数据源网站
(16)、镝数聚:
提供了12大类、50多万个数据和数据报告,基本上覆盖了市面上所有细分行业。可以点击分类查看也可以通过数据关键词查询。网站大部分数据都可以免费下载。

(17)、中国统计信息网:
国家统计局的官方网站,上面汇集了海量的全国各级政府各年度的国民经济和社会发展统计信息,可以在上面找到国家阶段发展数据、统计分析、主要统计指标排行等。

(18)、中国产业信息网:
包含了能源、电力、冶金、化工、机电、电子汽车、物流等各个行业相关的数据,所有的数据全部免费,做行业分析经常用到的。

三、数据可视化的注意事项
可视化的首要任务是准确地展示和传达数据所包含的信息。根据预期和需求,提供有效辅助手段以方便用户理解数据,从而完成有效的可视化。所以数据可视化也有一些注意事项:
1. 数据可视化系统的服务模型
当数据尺寸大、结构复杂时,有限的空间大大限制了静态可视化的效果,有限的可视化空间和数据过载之间的处理是非常复杂的。有时我们会通过物理环境的变化来改变服务模型,但更多的时候是通过交互设计来完成对复杂信息的处理。交互可提高可视化系统的效率,帮助用户处理更多的数据,完成更复杂的任务。
然而,实现交互本身也有额外成本。互动的系统可以使用户能探索更大的信息空间,但随之而来的成本是用户需要花费更多的时间与精力去浏览和探索数据。如果用户需要逐一试探每个数据点,那么可视化系统就成为了完全依靠人力的信息检索系统。因此,可视化系统应当采用数据挖掘算法自动发现用户可能会关心的数据或者模式;并通过可视化呈现给用户,用户在这个基础上通过互动进行更深入的挖掘。另一方面,如果一个任务完全可以通过自动算法得出用户需要的结论,交互也就不再需要了。
互动的可视化系统,特别是可视分析系统中的自动分析和用户交互分析是相互补充的两个部分,权衡两者的作用与成本,从而达到一个合理的平衡。设计师的设计决定了系统的可理解性,一旦掌握了这个逻辑,在复杂的页面也会变得有条不理。另外是我们自己对产品的一套理解力和技巧,可理解性和理解力是对可视化系统复杂问题处理上两个决定性要素。

2. 数据可视化系统的视觉设计
在信息可视化设计中,配色方案关系到可视化结果的信息表达和美观性。好的配色方案的可视化结果能带给用户愉悦的心情,有助于用户更有兴趣地探索可视化所包含的信息;反之,则会造成用户对可视化的抵触。另外,和谐的配色方案也能增加可视化结果的美观性。
在设计可视化的配色方案时,设计者需要考虑很多因素:可视化所面向的用户、群体、可视化结果是否需要被打印或复印(转为灰阶)、可视化本身的数据组成及其属性等,这里我想重点提出配色与服务模型的关联关系。目前市面大部分的运营监控系统采用的是深色背景色的配色方式。这种配色的优势是:深色背景与高亮度数据、表格产生高对比度,更容易凸显数据,使人更容易感知到数据。但如果生产方式是需要长时间使用系统观察数据分析时,会使人很容易产生视觉疲劳,所以应该结合场景考虑视觉设计风格。

四、小结
要做数据可视化必然离不开数据,也只有结合数据可视化用数据说话的目的才能达到,所以各种网站的数据对于数据可视化来说是很有用也很重要的。

最近看过此主题的会员

小由菜

0个回答

只看楼主

登录后可回答问题,请登录注册

快速回复 返回顶部 返回列表

小时

全天响应

分钟

快速处理问题

工程师强势助力

明星产品
解决方案
联系合作

渠道咨询电话:137-0120-6790

技术支持QQ:400-0011-866(工作日9:00-18:00)

产品建议邮箱yixin@esensoft.com

关注我们

扫TA学习更多干货

进群交流、一对一指导

©2021ESENSOFT北京亿信华辰软件有限责任公司版权所有:京ICP备07017321号京公网安备11010802016281号