-
骨子里的代码 初学数据Lv2
发表于2019-2-26 15:48
楼主
强化学习对于解决问题非常强大且复杂。
有监督学习我们知道,机器学习以数据为输入,我们称这个数据为训练数据。
训练数据包括输入和标签(目标)。
什么是输入和标签(目标)?例如,两个数字相加a=5,b=6结果=11,输入为5,6,目标为11。
然后利用新数据和我们之间获得的逻辑来预测输出。
(注:我们不能得到准确的6作为答案,我们可以得到接近6的值,基于训练数据和算法)这个过程被称为监督学习,它非常快速和准确。
一些示例
- 一个城市的房价是多少?
- 股票的价值是多少?
- 一场板球比赛可以有多少分?
分类:这是一类我们预测类别响应值的问题,数据可以被分成特定的“类”(例如:我们预测一组值中的一个值)。
一些例子是:
- 这封邮件是不是垃圾邮件?
- 今天会下雨吗?
- 这张照片到底是不是一只猫?
其他例子包括:
- 这封邮件是垃圾邮件、重要邮件还是促销邮件?
- 这幅画是猫、狗还是老虎?
这是最后一张图片。
无监督学习训练数据不包括目标,所以我们不告诉系统去哪里,系统必须从我们给出的数据中了解自己。
例如:来自不同页面的随机文章
有点类似于多类分类,但这里我们不提供标签,系统从数据本身理解和聚类数据。
一些例子是:
- 给定新闻文章,将其聚合成不同类型的新闻
- 给定一组tweets,根据tweets的内容进行聚类
- 给定一组图像,将它们聚成不同的对象
我想在另一篇文章中介绍强化学习,因为它很激烈。 所以
这就是这个文章的全部内容,希望你能有所了解。
版权声明:作者保留权利。文章为作者独立观点,不代表数据人网立场。严禁修改,转载请注明原文链接:http://shujuren.org/article/788.html
数据人网:数据人学习,交流和分享的平台,诚邀您创造和分享数据知识,共建和共享数据智库。
本文出处:数据人