2022年12月16日至17日,由安徽省发改委联合主办的2022全球智能汽车产业峰会在安徽省合肥举行。本次论坛围绕全球新变汽车发展新战略主题,本次论坛共设立5个主题论坛和2次闭门会议,与行业机构、高校、领先企业代表共同探索我国智能汽车发展新路径。
后摩智能创始人兼 CEO 吴强发表了精彩的演讲。现场演讲记录如下:
早上好!我很高兴代表后摩智能参加这次峰会。我今天分享的主题是如何创建一个更独立和可控的智能驾驶芯片。
汽车电气化和智能化给国产汽车带来了难得的历史机遇,PPT左图显示,中国电气化的普及已经走在世界前列,右图显示我们在智能驾驶L2及以上的普及率和渗透率也走在世界前列。L以上智能驾驶给计算芯片带来了新的需求,如传统的车载芯片MCU与以往的云芯片或超级计算芯片相比,智能驾驶芯片的复杂性和大计算能力更接近;与传统相比,设计、包装等MCU都不一样。智能驾驶芯片的计算能力要求接近传统的超计算芯片,很多人说智能驾驶芯片是移动的超计算中心。
此外,功耗低。在传统的超级计算中心,我对功耗不太敏感。我在数据中心用电、空调和冷却,但在汽车上,用电有很多问题。每个人都是汽车专家。汽车由电池驱动。此外,汽车散热系统实际上相对紧张,环境温度要求相对较高。
第三,低成本。在超成本方面,芯片非常昂贵,基于A100台服务器可以卖几十万,一个企业需要几台。但就汽车而言,正如沈先生刚才所说,我们希望每辆车都能负担得起、负担得起和安装这样的芯片。我们的大部分车都在10-30万元之间,这部分车是主流,高端车是另一个故事。对于10万-30万元的汽车来说,成本非常敏感。如何做出高性价比,让每辆车都能装芯片,也是一种新的需求。
近年来,我们遇到了一个新的话题,将原来的超级计算中心大计算力芯片和传统的汽车芯片集成在一起。这是近年来才出现的一个有趣的现象。
对于L对于芯片的发展趋势,计算能力要求适中L2 或者L2 芯片或更先进的芯片,最近也有很多发展趋势。它的传感器越来越多,因为需要不断支持L1、L2,要支持L2 甚至L2 。传感器越来越多,对计算能力的需求也越来越高。第二,对于L2 ,一些智能驾驶算法变得越来越复杂,需要不断迭代,BEV要出来,Transformer要出来,芯片的开放性也很高。这是目前高级智能驾驶能驾驶带来了一些新的需求。
目前的解决方案有几个问题,一是依靠先进的制造技术,传统MCU 40nm即使很好,最多28nm,现在智能驾驶是16、14、7甚至5或3nm走。先进技术带来两个问题:1。成本极高,7nm芯片研发成本超过1亿美元,7美元nm要几亿美元,分摊,装在车里,很贵;2.很容易卡在脖子上。在这种情况下,很容易卡在脖子上。这是个问题。
此外,牺牲通用性和解决效率问题需要计算能力和功耗。我如何解决这些问题?假如我做得很专用,专用又不符合整个算法的发展趋势。这是高级智能驾驶芯片面临的矛盾。计算能力越大,功耗越大,解决这个问题,如何部署芯片,是否都需要液冷?高端汽车必须是液冷的。对于低端汽车,如果使用液冷,整个系统的复杂性将增加,成本将再次上升,并回到如何使每辆车都能负担得起和安装的问题。
我们需要的不能依靠继续走向先进工艺的做法。我们能从更底层的架构创新或技术创新中解决这样的问题吗?更底层的创新方法也可以解决计算能力、功耗和成本问题。这可能是我们国内芯片制造商需要探索的问题。在所有的技术创新方向中,有一个很有希望的方向,那就是存算一体化,意思是整合存储和计算,重构智能驾驶芯片。冯诺伊曼在教科书中的传统计算架构,计算和存储是分开的,每次通过总线load这是冯诺伊曼的结构。这种计算架构适合传统CPU,有60年的历史。CPU非常适合智能驾驶芯片AI计算是基于数据的计算,这是近年来才发生的。其实这种事情不太合适,数据总线成了瓶颈。另外,算力上不去,或者算力上不去,但是要花很多钱。我的数据不断地处理,做了很多无效的处理,造成了大量的功耗,这是存算的集成。希望从根本上解决这样的问题,从底层架构创新或计算方法创新。
随着计算能力的扩大,计算能力可以在没有这种非常先进和昂贵的先进技术的情况下进行。此外,它避免了大部分数据处理。90%的数据可以节省功耗和成本。这是我们在许多行业同事中探索的新技术方向。比如存算一体本身的能效还是有数量级提升的,这是技术优势。反映在产品上,能做什么?例如,许多人都是汽车专家。他们知道汽车需要散热。散热的方式有几种:自然风冷、风扇和液体冷却。对于大多数汽车制造商来说,最希望的方法是自然风冷、自然冷或被动散热。成本较低,系统复杂度较低,但只需要一种,功耗在15瓦或20瓦以内。假如想要大计算能力,本身和低功耗是天生的矛盾,如何解决这个问题?我觉得自然散热或者低功耗,我的计算能力肯定不高,只能做十几T到20。T,按照目前的工艺达到极限。除非5更贵nm、3nm,这个数字可以再往上走,如果只能用正常的工艺来做。如果整合存算,可能会突破这个极限,在自然散热的情况下可以达到60T或者80T甚至100T,这实际上是我们想要探索或实现的目标,这是存算整合带来的产品水平的真正好处。
此外,存算一体化还有另一个好处。它可以使用相对成熟的技术来制定与先进技术相当的计算能力和能效比。在当前的国际环境下,它具有一定的特殊意义。即使有极端情况,也不能卡在脖子上,可以实现国内的独立控制。这仍然可以创建一个高能效比和高性能的芯片,可以帮助国内汽车智能化,这是当前国际形势下的另一个特殊意义。
让我们来介绍一下后摩智能。它成立于2020年底。公司有两组人,一组是会计专家,一组是学术背景下的技术专家,另一组人是我在工业界工作了20年的大型芯片和高计算能力芯片。我以前做云芯片,后来做车芯片。我们认为这可能是解决高计算能力或高性能智能驾驶芯片的根本解决方案。我们成立这家公司大约两年了。去年8月,第一个流片是一个技术样片,在今年年初运行了智能驾驶算法和demo,今年第一个芯片投影顺利,希望明年上半年春节后能给客户试用。
基于存算架构集成芯片的设计,我们的第一个芯片没有具体的时间关系,总的来说,PPT从右到左,橙色部分基于计算盒,后面是分布式计算单元,由不同的计算单元组成AI Core,最后变成一个HOC,呈现给汽车或Tier或者车上的客户。
去年第一个芯片流片成功点亮了常规智能驾驶算法。这里PPT上面有一个简单的demo,常规智能驾驶场景基于第一个大算力芯片运行20秒。传统的11种检测、分割、识别等算法都在存算芯片上运行。可以看出,框架是检测,地面是各种分割,其效果和传统GPU我们也可以达到类似或更好的效果。
从软件的角度来看,我们是一家智能驾驶芯片公司。我在这个行业工作了很多年。我知道客户是怎么想的。客户仍然希望软件能尽可能接近巨人英伟达的编程模式。客户迁移最方便。我们采用了类别CUDA降低客户开发成本的编程方法。
整个算法和软件的发展趋势是软硬解耦。我们希望基于软硬解耦的概念,尽可能开放我们的芯片和工具链,以便有更多的第三方算法公司或Tier1或者主机制造商以相对较快的速度开发自己的软件,这也是我们自己的想法。整个芯片和软件都是基于这个概念设计的,我们也是Mobileye不同的黑盒模式。
在过去的两年里,从第一代芯片流片到与一些客户的合作,主要是在无人驾驶肖像物流、零售和乘用车方面Tier一级与主机厂合作。总的来说,后摩智能的愿景是后摩尔时代的智能计算平台,公司的名称也来自这个愿景。目前,我们实际上专注于无人驾驶汽车、智能驾驶和乘用车,这是我们目前关注的主要场景。我们希望在这两个领域站稳脚跟,与更多的合作伙伴合作。在未来万物智能时代,我希望我们能有更多的仿生机器人AR/VR这些场景提供高效的智能计算平台,为万物智能的美好愿景目标做出贡献。
以上是我的分享,谢谢!
(注:本文根据现场速记整理,未经演讲者审核)
原创文章,作者:盖世直播,如若转载,请注明出处:https://www.car-metaverse.com/202212/211229826.html