小镇的夕阳|CCF-GAIR 2020,周志华:“数据、算法、算力”人工智能三要素,在未来要加上“知识”|( 六 )
反绎学习的讨论与案例
有几点内容我们来讨论一下 。 首先我们看这个数据部分 。 在反绎学习中 , 这个数据只需要有instance , 不需要有label 。 那么我们靠什么来做监督学习呢?主要就是靠初始分类器以及知识库中的知识 。 可以认为这个监督信息是来自于数据之外的地方 , 所以从这个角度上说 , 反绎学习可以看成是一个很广义的弱监督学习 。 但另一方面 , 如果初始数据中确实是有label的 , 那这个学习过程 , label信息完全可以用上去 。 比方说 , 我们把真的label和反绎出来的label一起用来对分类器做更新等等 。
第二个方面 , 初始的分类器从哪来?这可以有很多的办法 , 比方说类似于深度学习的预训练或者迁移学习 , 做一个任务时可以用另外一个任务的结果做初步模型 。 甚至把数据聚类的结果作为粗糙的起点 , 有时也可以 。 这里的关键是 , 初始分类器未必要准确可靠 , 只不过用它把过程启动起来 。 当初始模型非常粗糙时 , 如果知识库的知识靠谱 , 那就能通过知识库的信息来修正分类器 , 能进行下去 。 如果知识不太精准 , 而初始模型比较好 , 也能往下学 。 如果两者都好 , 当然可以做得更好 。 也就是说 , 至少有一个好就能往下做 。 当然 , 如果数据没有label、初始分类器不靠谱、知识也不靠谱 , 那这样的任务本身就没法做 。
那接下来 , 这个知识库从哪来?这个目前还是需要人类专家来提供 。 最近一些关于知识图谱的工作能提供很多帮助 。 另外 , 有可能初始的知识并不是完美的 , 那么这个过程中 , 也可以通过对数据的学习来对知识做精化 , 所以反绎学习本身也可以认为是一个对知识精化的过程 。
接下来这个过程中涉及到怎么样具体地去做学习 , 去做推理等等 , 这些具体算法机制的设计 。 反绎学习本身是一个框架 , 对里面这些机制细节做不同的设计 , 可以产生出不同特点的反绎学习模型和算法 。
下面就介绍一个简单的例子 , 面对的这个任务是破译长代码 。
推荐阅读
- 小镇的夕阳|VISION D主机搭建,设计师主机就不能没有颜值:技嘉
- 小镇的夕阳|为什么快递的服务质量越来越差?
- 小镇的夕阳|成本低至白菜价,全球首款蚕丝硬盘问世!可以轻松植入人体
- 小镇的夕阳|能让工作事半功倍的工程类软件
- 小镇的夕阳|20W快充+大电池,屏幕指纹手机跌至989元,华为彻底清仓
- 小镇的夕阳|华为位列第五,但也是中国唯一一个入围。,全球研发投入50强
- 小镇的夕阳|新零售只适用于年轻群体?自助收银机和刷脸支付打破印象
- 模范爸爸|| CCF-GAIR 2020,中国科学技术大学副教授凌震华:基于表征解耦的非平行语料话者转换
- 竞技体育大爆发|2020,英特尔夏磊:“智能X效应”促进行业应用融合及迅速创新|CCF-GAIR
- 小镇的夕阳|Web渗透测试——密码学基础
