小镇的夕阳|CCF-GAIR 2020,周志华:“数据、算法、算力”人工智能三要素,在未来要加上“知识”|( 四 )


所以我们现在就想 , 能不能有一个新的机制帮助我们把这两大类技术的威力都充分地发挥起来呢?我们最近提出了一个新的方案 , 叫做AbductiveLearning 。
什么是“反绎”?要去理解Abductivelearning之前 , 我们先来理解这个abductive是什么含义 。
一种是演绎 , 我们从一个一般性的原理出发 , 然后把一些特定的结果能够得出来 , 而且这个得出的过程是有保障的 。 比方说我们做定理证明 , 首先拿到一些数学公理 , 然后基于这些数学公理 , 把与它们一致的所有别的定理都证明出来 。 这就是一个“从一般到特殊”的过程 , 这是演绎 。
另一种做法是归纳 , 就是说我们先看到一些特定的事实 , 然后我们从特定的事实中总结出一般的规律 。 其实机器学习做的就是这么一件事 。 我们看到很多很多的数据 , 然后希望学习出反映一般规律的模型 , 这就是“从特殊到一般” 。
定理证明可以说是演绎的典型代表 , 而机器学习是归纳的典型代表 。 我们今天讲到的这个反绎 , 不太一样 。 Abductive这个词在逻辑里有时候翻译成诱导 。 但是在我们这个框架下 , 再把它翻译成诱导就不是特别合适 , 所以我们另译为反绎 。 反绎学习就大致是把演绎反向嵌入到机器学习归纳过程中去 。
反绎是什么意思呢?它是首先从一个不完备的观察出发 , 然后希望得到一个关于某一个我们特别关心的集合的最可能的解释 。 直接从这句话来理解可能有困难 。 那么下面我就先给大家看一个例子 , 是关于怎么去破译玛雅历法这么一个故事 。
大家知道中美洲有一个古老的玛雅文明 。 他们建立起了非常复杂、精致的历法系统 , 具体是有三套历法 。
接下来 , 蓝色框出来这两位 , 对应于玛雅的神历 。 左边这个图像是什么含义还不知道 , 打了问号;右边这个符号已经知道代表一个东西叫做Ahau 。 这两位结合起来也代表了一天 。 其实这两位一个是指月 , 一个是指日 , 有点像我们中国天干、地支的搭配 , 类似于在说“庚月子日” 。 但仅靠它肯定是不精确的 , 即便知道“庚月子日”也不知道具体是哪一天 , 因为历史上有很多的庚月子日 , 还需要要和别的信息结合起来 。
最后这两位是13Mac , 对应玛雅的太阳历 , 是说这一年第13个月第14天 。 但是 , 这是哪一年?仅凭它还不知道 。
但是如果这三个历法里的问号都清楚了 , 那么这一天的定位就非常精确了 。 现在需要把这三个问号破译出来 。 我们有一个重要的知识:这三个历法系统 , 由于它们指的是同一天 , 那么揭示出来的这三个问号的值一定会使这三个计数达到一致 。
那我们看看考古学家会怎么做这个事 。 拿到这个图像之后 , 他们首先根据以往破译图像的经验去“猜“这些数字是什么 。 但这很难 , 考古学家现在只知道这两个红色的应该是同一个数 , 蓝色的应该是另外一个数 , 但这个红色的既有可能是1 , 也有可能是8 , 也有可能是9 。 因为玛雅人刻石柱是手工而不是机器做的 , 每次都有变化 。 比方说大家看到最上面这个红色的图像 , 它好像和这个1最左边这个很像 , 和8的第二个也很像 , 跟9最右边的这个也比较像 。


推荐阅读