-
江湖人称潇洒哥 数据达人Lv4
发表于2018-12-20 17:02
- 作者:Ben Lorica
自动化的实现会是分阶段的。虽然实现完全的自动化还有很长的路要走,但是有许多工作流程和任务是可以实现部分自动化的。事实上,麦肯锡估计“虽然基于现有的技术只有不到5%的工作可以实现完全自动化。 但是,大约60%的职业里的30%或更多的工作是可以实现自动化的。”
我们已经看到了一些基于计算机视觉和语音技术的产品和服务,在2019年会出现更多类似的产品。而语言模型和机器人技术方面的进一步改进将会带来针对文本和物理世界任务的解决方案。与其等待一个完整的自动化模型,组织机构将会被竞争推动着采用部分自动化的解决方案。而这些部分自动化项目的成功将会进一步推动全自动化的发展。
在过去几年里,很多公司都在构建流程和基础架构来解锁异构的数据源,以便提升主要的关键分析任务的表现。这些任务包括了商业分析、推荐器和个性化服务、预测、异常检测和监控任务等。
除了使用计算机视觉和语音技术的新系统,我们预见深度学习和强化学习在企业里的早期尝试将出现在那些已经使用数据和机器学习的地方。例如,一些企业正在通过深度学习将时间和地理空间数据引入其系统中,从而形成可扩展和更准确的混合系统(即将深度学习与其他机器学习方法结合起来的系统)。
当前许多的人工智能解决方案需要和消费者、人类工人和专家携手工作。这些系统提升了用户的工作效率,在许多情况下使他们能够以难以置信的规模和准确度完成任务。恰当的用户体验和用户界面设计不仅能够简化这些任务,而且长期来看,这能让用户信任人工智能的解决方案,并使用它们。
凭借创造了记录的语音和计算机视觉的模型,深度学习在2011年复兴。今天已经有足够大的规模来证明需要专用的硬件。Facebook在一天里就做出数万亿次预测。谷歌也有足够的规模来证明自己制造专用硬件的合理性——从去年开始,谷歌一直在其云环境中使用自己的张量处理单元(TPU)。2019年将出现更多的专用硬件。在中国和美国,许多公司和创业企业一直致力于制造面向模型构建和推理的硬件来用于数据中心和边缘设备。
虽然深度学习将继续引领许多有趣的研究,但大多数端到端的解决方案依然是混合系统。2019年,我们将开始更多地了解其他组件和方法的基本作用——包括基于模型的方法,如贝叶斯推理、树搜索、进化、知识图谱、仿真平台等。我们可能会开始看到令人兴奋的不基于神经网络的机器学习方法的发展。
我们处在一个高度经验主义的机器学习时代。机器学习开发的工具需要认识到数据、实验和模型搜索、模型部署和监控的重要性。只看这个过程中的一个步骤:模型构建,企业就已经开始研究用于数据血缘、元数据管理和分析、计算资源高效利用、高效模型搜索和超参数调优的工具。在2019年,我们预计将会出现许多新工具,它们能够让开发和实际部署人工智能和机器学习产品和服务更加容易。
尽管已经存在了大量的“人造”新闻,我们仍然处于机器生成内容(人造图像、视频、语音和文本)的早期阶段。至少到目前为止,刑侦和取证技术已经能够找出伪造的视频和图像。但生成虚假内容的工具正在迅速发展,因此美国和其他地方的研究资助机构已经启动了一些项目,以确保侦测技术能够跟上它们的发展。
机器欺骗不仅局限于机器欺骗人类,机器欺骗机器(机器人)和人欺骗机器(水军和点击农场)可能同样难以处理。信息散布和点击农场将继续被用于欺骗内容和电商平台上的排名系统,而检测和对抗方法将不得不随着新形式的机器欺骗的出现而迅速发展。
令人振奋的是,研究人员和实践人员对隐私、公平和道德问题产生了浓厚的兴趣,并积极参与其中。但随着人工智能系统被部署到关键任务应用中(甚至包括涉及生死的场景,比如自动驾驶汽车或医疗保健等),自动化带来的效率提升必须伴随着对安全性和可靠性的测量以及确保。在线平台上机器欺骗的兴起,以及最近涉及自动驾驶汽车的事故,已经彻底让这个问题公开化。预计到2019年,安全问题将会得到更深入的讨论。
趋势九:大量训练数据的民主化将带来比较公平的竞争环境
因为我们所依赖的许多模型(包括深度学习和强化学习)都需要大量的数据,所以人工智能领域可预见的赢家一直是能够获得大量数据的大公司或国家。但是,用于生成标注数据集的服务商(特别是那些依赖于人类标注的公司)正在开始使用机器学习工具来帮助他们的人类员工实现规模化和提高准确性。在某些领域,生成对抗网络(GAN)和仿真平台等新工具能够提供真实的合成数据用于训练机器学习模型。最后,一系列安全和隐私保护技术促进了各组织之间的数据共享,这有助于公司利用不是他们自己生成的数据。总之,这些发展将帮助小型机构利用机器学习和人工智能进行竞争。
本文来源:人工智能实验室