硅谷封面|控制AI之战:揭秘谷歌与DeepMind的爱恨情仇( 八 )

哈萨比斯并没有假装科学已经完全理解了人类的思想 , AGI的蓝图不能简单地从数百项神经科学研究中得出 。 但他自信地认为 , 已经拥有足够多知识的他应该可以开始AGI的构建工作 。 然而 , 他的信心再次受到现实的打击 。 我们仍然对大脑的实际功能知之甚少 。 2018年 , 澳大利亚研究人员对哈萨比斯的研究结果提出了质疑 , 认为其文章的统计数据很糟糕 。 这表明 , DeepMind还有很长的路要走 。

苏莱曼(Suleyman)和肖恩·勒格(ShaneLegg)都是痴迷AGI的人 , 哈萨比斯在加州大学洛杉矶分校(UCL)认识了后者 , 他们三人是DeepMind的联合创始人 。 这家公司的声誉迅速提高 , 哈萨比斯才华横溢 。 DeepMind的前运营经理本·福克纳(BenFaulkner)表示:“哈萨比斯有点儿像磁铁 , 能将其他人才吸附在其周围 。 ”

许多新员工来自欧洲 , 这远远超出了谷歌和Facebook等硅谷巨头聚焦的目光 , 也许DeepMind最大的成就是早早地雇佣并留住了这些最聪明、最优秀的人才 。 这家公司在布卢姆斯伯里(Bloomsbury)罗素广场(RussellSquare)的露台房屋阁楼上开设了门店 , 与伦敦大学学院隔街相望 。

DeepMind关注的一种机器学习技术源于哈萨比斯对游戏和神经科学的双重痴迷 , 即强化学习 。 这样的程序可以收集有关其环境的信息 , 然后通过反复重播它的经验来从中学习 , 就像哈萨比斯在奇点峰会演讲中对睡眠中人类大脑活动的描述一样 。

强化学习在计算机领域还处于起步阶段 。 这种程序显示的是虚拟环境 , 它只知道规则 , 例如模拟国际象棋或视频游戏 。 该程序包含至少一个被称为神经网络的组件 , 后者是由层层的计算结构组成的 , 这些结构通过筛选信息来识别特定的特征或策略 。 每一层都在不同的抽象级别上检查环境 。

起初 , 这些网络的成功率很低 , 但重要的是 , 它们会不断从失败中积累经验 。 它们变得越来越老练 , 因为它们会尝试不同的策略 , 并在成功时得到奖励 。 如果程序移动了某个棋子 , 结果输掉了比赛 , 它就不会再犯同样的错误 。 AI的魅力很大程度上在于它执行重复任务的速度 。


推荐阅读