AI科技大本营|他是什么来头?,阿里云科学家入选计算机顶会HPCA名人堂( 三 )


同时 , 蒋晓维团队还针对阿里业务定义benchmark , 让定制CPU和自研服务器从系统层面、微架构层面确保性能符合业务需求 。
值得一体的是 , 在阿里 , 蒋晓维与同被入选HPCA名人堂的谢源一起工作 , 两人不仅在工作上交集颇多 , 也保持着不错的私人关系 。 在蒋晓维看来 , 谢源是华人中的旗帜性人物 , 由于在计算结构领域的前沿方向性贡献 , 谢源是目前唯一一个“集齐”ISCA、MICRO、HPCA三大顶会名人堂荣誉的华人 。 虽然不在同一个部门 , 但工作上的共性让两人之间有了一些合作 , 比如合作发表关于图计算与高性能计算集群EFLOPS论文 。
除去这些荣誉上的光环 , 蒋晓维眼中的谢源是个平易近人 , 球技不错的足球爱好者 。 在专业上 , 谢源是个对技术方向性具有前瞻和预判的科学家 , 此前在AMD建立中国团队的经历 , 也让他在学术和工业两方面具备了良好的判断力和执行力 。
在笔者看来 , 同被选入顶会名人堂 , 可能与蒋晓维和谢源两人身上普通人不具备的共同特质分不开 , 比如对技术创新促进技术发展 , 通过技术手段应用于实践 , 给上层业务带来红利 , 反过来业务也可以驱动底层创新这一点坚信不疑 , 换句话说 , 他们都是believer 。
高性能计算的未来:新内存介质将涌现 , 图计算是方向性领域
在学术上 , 今年2月份 , 蒋晓维系统性介绍了阿里云的高性能AI集群的节点架构、网络架构、和通信算法的一篇论文被HPCA收录 , 该论文名为《EFLOPS:AlgorithmandSystemCo-designforaHighPerformanceDistributedTrainingPlatform》 , 展示了他对于高性能计算的思考和EFLOPS集群为阿里巴巴业务带来的价值 。
AI科技大本营|他是什么来头?,阿里云科学家入选计算机顶会HPCA名人堂
文章图片
图源:视觉中国
这个由来自多个部门的阿里技术专家参与打造的集群可将大模型的训练速度提升4倍 , 并支持千万分类模型的训练;在提升翻译模型精度的同时 , 能将训练时间从100小时降低至12小时 。
关于高性能计算的未来 , 蒋晓维也给出了一些自己的看法和预测 。
他说到 , 高性能计算 , 包括CPU所擅长的通用型计算未来都会出现一些新的技术与趋势 。
首先 , 是新的内存介质和计算架构会源源不断地涌现 , 比如就在过去几年 , 非易失内存ApachePass的出现使得内存能力得到巨大提升 , 同时也改变和计算架构 , 很快会有其他介质的内存出现 , inmemorycomputing技术也会不断产品化 。
此外 , 未来软硬一体化的设计思路将会更多 , 结合业务上层的软件特质 , 对底层架构设计产生打的影响 。
最后一点是图计算将是未来计算领域的方向之一 , 包括稀疏性计算在图计算和一些AI场景下都会体现出重要性 。 无论是CPU , GPU还是计算体系 , 这方面都有很大的提升空间 , 在不久的将来可能会出现相应的解决方案 。
除了大的方向性趋势 , 蒋晓维还从实处聊了聊当前的处理器现状 。 进入智能计算时代 , IoT已成为未来应用的新趋势已成为业界的共识 , 因此针对IoT的底层计算设备至关重要 。
MCU处理器就是非常适合IoT场景的底层硬件 。 在微控制器架构层面上 , 现状是x86和Arm等架构并存 , 的从专业视角来看 , 哪种架构形式将成为主导呢?MCU架构又会向什么方向和趋势发展?
首先 , 蒋晓维说到 , MCU处理器其实更多地是针对IoT场景 , 之前这一领域是Arm的强项 , 但最近几年RISC-V崛起 , 不断地吞噬这一部分市场 。 就MCU来说 , 从软件生态上来看 , Arm和RISC-V一定会是主导 , 但除了这两个架构之外 , 可能也会有其他在这个生态之外的单个点的架构的存在 。
而对于数据中心的服务器 , 不管是公有云还是私有云 , 因为x86上层的软件生态构建相对完善 , x86的服务器可能在未来一段时间都是主导 , 但是Arm也是一股不容小觑的崛起的势力 , 在中国 , Arm已经在服务器侧推出了一些产品 。


推荐阅读