作为催化剂,RAPIDS能让人工智能提速到多少?

1733
0

江湖人称潇洒哥 数据达人Lv4

发表于2018-10-29 07:49

楼主
本帖最后由 江湖人称潇洒哥 于 2018-10-29 07:50 编辑

时至今日,已经没有人会去怀疑人工智能最终会改变世界的最终结果了。只不过,从技术角度来看,人工智能的爆发点决定于某几项技术。也许,这几项技术的成熟之日,就会是人工智能催城拔寨之时。这也是RAPIDS和人工智能听起来相距甚远,实则却息息相关的原因。
数据科学家的甜蜜烦恼

尽管在中国,新手级别的数据科学家的年薪已经达到了20万人民币,但从全球范围来看,这个数字还是偏低,因为还不及美国同岗位年薪的三分之一,由此可知数据科学家的价值。但雇佣数据科学家的老板却相当烦恼,原因就在于数据科学完即使在工作期间,也有充足的时间去喝咖啡。以致于数据科学家有一个甜蜜的烦恼:被说成是不是去喝咖啡,就是在去喝咖啡的路上。

其实个中真实的原因,并非是因为数据科学家想要偷懒,而是计算系统处理海量的数据时间过长,以致于数据科学家将数据上传之后,有相当长的时间处于无事可做的状态。而这个时候,咖啡往往成为数据科学家们的最佳伴侣。

NVIDIA解决方案架构亚太区高级总监赵立威

但也许数据科学家们不曾想到,这份闲适的“甜蜜烦恼”正在走向终结,并且这份终结来源于一个看似和他们并不相关的RAPIDS平台。虽然NVIDIA在10月10日,才将RAPIDS平台公诸于众。因此由于时间太短,大数据行业还有人在怀疑它的能力,但在NVIDIA解决方案架构亚太区高级总监赵立威看来,这个结果是一定的。他毫不犹豫地给出了这样的结论:“RAPIDS平台可以为数据科学家提供在GPU上运行整个数据科学管线的工具,与仅用CPU的系统相比,计算速度将加快50倍。这意味着可以帮助数据科学家将模型训练时间从数天减少到数小时,或者从数小时减少到数分钟。”

细说RAPIDS平台

有人将硬件和软件比喻成容器和水的关系,硬件如容器,当容器变大之后,软件应用会如水一般,把容器盛满。但就算在后摩尔定律时代,硬件容器的增长也总是受限的,而云计算、大数据、人工智能等一浪高过一浪的技术浪潮,数据对传统企业而言,已如工业革命时代石油的重要性一样。所以在硬件算力增长有限的条件之下,如NVIDIA这样的厂商,就开始在硬件和软件应用息息相关的算法上做文章。

在硬件方面,与只应用CPU的系统不同,NVIDIA的GPU加速计算在应用CPU之外,还同时利用图形处理器,这样就可以加快科学、分析、工程、消费和企业应用程序的运行速度。但相应地,应用软件也需要做调整。为了让这种调整工作做到工作量最小化,同时工作效率最大化,RAPIDS平台登台亮相了。

考虑到讲解底层技术较为枯燥,赵立威给出了一张RAPIDS平台RAPIDS平台(如下图)。


赵立威介绍说:“在大数据应用市场上,Python语言的作用非常重要。由于大数据的应用,Python这种科学计算语言,已经变成了面向数据科学家的应用语言。而为了支持PYTHON语言开发在GPU下的应用,它就需要不同类型的数学函数库。这个数学函数库在经历了一系列的演化过程,最终形成了一个基本的框架,也就演化出了今天的RAPIDS平台。”

同样在这张架构图中,眼尖的人会一眼认出Apache arrow,它是 Apache 基金会全新孵化的一个顶级项目。它设计的目的在于作为一个跨平台的数据层,来加快大数据分析项目的运行速度。这样,RAPIDS平台一定是基于开源标准的。赵立威肯定了这一说法:“RAPIDS平台本身就是开源的,它基于开源标准,将使得数据转换更容易,目前它已为GPU加速分析和机器学习提供了一整套开源库。将RAPIDS平台、Python、Apache arrow配合起来应用,无论是数据准备、模式训练,还是最后的可视化,RAPIDS平台都有不同的模块给予支撑。”
360亿美金的大市场

分析师估算,面向数据科学和机器学习的服务器市场,每年价值约为200亿美元,加上科学分析和深度学习市场,高性能计算市场总价值大约为360亿美元。而此次通过RAPIDS平台,NVIDIA进入这一市场的步伐又深入了一步。

赵立威介绍说:“RAPIDS平台几年来进行的不只是技术上的积累,时至今日,我们已经通过和开源社区、IBM、惠普、Oracle、思科、联想、SAP的合作,形成了一个全球生态系统。而像沃尔玛这样勇于尝试的企业,也已经通过应用RAPIDS平台, 通过对历史数据的挖掘和预测,解决了生鲜类产品的库存问题,用数据去调整库存存,既保证了不同季节的备货,也解决了生鲜类产品的保质问题。”

回到我们的题目,作为催化剂,RAPIDS能让人工智能提速到多少呢?这其实是一个极难回答的问题,因为图灵奖获得者,计算机体系专家David Patterson早就指出,现在的IT技术面临新的挑战:摩尔定律也面临困难,晶体管的提升变慢。在架构上也有新的问题出现。这些问题突出体现在我们的应用对算力的需求,已经远远超过正常意义上的算力增长。这样应用需求算力与实际能增长的算力之间,已经构成了一对矛盾。而解开这对矛盾的关键,就是软硬件的结合,传统意义上的硬件工程师和软件工程师,将不得不进行一次大规模的跨界开发。RAPIDS平台不过是顺应这个大趋势的一次尝试。接下来,RAPIDS平台还会实现可视化操作,可以说,它未来的路还很长很长。与之下对应,人工智能应用的普及一定会提速,并且会随着RAPIDS平台这类技术的迭代,变得越来越快。

本文来源:中国软件网


最近看过此主题的会员

admin

haocx

洋洋

0个回答

只看楼主

登录后可回答问题,请登录注册

快速回复 返回顶部 返回列表

小时

全天响应

分钟

快速处理问题

工程师强势助力

明星产品
解决方案
联系合作

400咨询:400-0011-866

技术支持QQ:400-0011-866(工作日9:00-18:00)

产品建议邮箱yixin@esensoft.com

关注我们

扫TA学习更多干货

一对一专家交流

版权所有© 2006-2024 北京亿信华辰软件有限责任公司 京ICP备07017321号 京公网安备11010802016281号