深度学习并未走进死胡同( 五 )

第三 , 深网对图像中的变化过度敏感 。 这种过度敏感不仅反映在对图像中难以察觉变化的标准上 , 还反映在对上下文的变化上 , 由于数据集大小的局限 , 过度敏感会导致系统做出错误判断 , 但这种因过度敏感而导致的图像变化却难以欺骗人类观察者 。

例如 , 在一张丛林里有只猴子的照片中 , PS上一把吉他 。 这会导致AI将猴子误认为人类 , 同时将吉他误认为鸟 。 大概是因为它认为人类比猴子更可能携带吉他 , 而鸟类比吉他更可能出现在附近的丛林中 。

尤尔认为 , 瓶颈背后的原因是一个叫做“组合爆炸”的概念:就视觉领域而言 , 从组合学观点来看 , 真实世界的图像量太大了 。 任何一个数据集 , 不管多大 , 都很难表达出现实的复杂程度 。 更何况每个人选择物体、摆放物体的方式不一样 , 搭出的场景数量可以呈指数增长 。 而这需要无限大的数据集 , 无疑对训练和测试数据集提出巨大挑战 。


推荐阅读