时间:2022-12-19 04:25:02
文|李科龙
编辑|张广凯

也许只有他能打败黄大仙。
“今天,我们宣布Atlan不再是第一名……”皮衣教父黄仁勋在9月20日晚的GTC 2022上平静地宣布了这个消息,他还有NVIDIA创始人兼首席执行官的身份。
黄仁勋的下一句是“Thor代替Atlan”,表示其性能是Atlan的两倍。
NVIDIASOC计算能力示意图
Atlan是NVIDIA去年发售的5nm工艺1000TFLOPS计算力自动驾驶SOC芯片,原定于2024年发售,但随着Thor的发售,Atlan还没诞生就成为了历史。
1TFLOPS表示处理器每秒执行1万亿次浮点运算,这意味着Thor每秒执行2000万亿次运算。 要知道,目前特斯拉的FSD (完全自动驾驶)自研芯片的计算力为144 TOPS,Thor的计算力约为前者的1.4倍。
GPU霸主NVIDIA,携程优势进军汽车芯片市场,正在冲击整个行业。
对于NVIDIA发起的计算能力军备竞赛,其他芯片制造商还有还手之力吗?
作为中国芯片产业与世界差距比较小的领域,地平线、华为、黑芝麻等国产汽车芯片在大变局下将何去何从?
汽车的计算力革命正在进行
NVIDIA的计算能力竞争的背后,是汽车芯片领域的巨大变革。
在传统的汽车中,需要计算机自动控制的功能并不多。 但随着新能源时代的开始,对汽车电子化的要求突飞猛进,从自动驾驶和辅助驾驶到智能座舱,都需要强大的芯片控制。
但是芯片多了,需要的代码也多了,车子就像我们的电脑桌,乱七八糟的电源线让人看着恶心。
车辆线束的复杂度增加,不仅带来了不良的心理问题,还直接导致了更高的成本和更复杂的设计。 特别是在车辆智能化时代,各功能的增加直接导致电子控制单元( ECU )数量的急剧增加。
根据《自动驾驶车辆工程》杂志的统计,豪车和全尺寸卡车可能使用40种不同的线束,装有700多个连接器和3000根电线。 把汽车上的电线全部连接起来,长度会超过4公斤,重量会达到60公斤。
简化复杂化,降低整车线束的复杂度成为新的需求。 减少线束的最有效方法是减少芯片数量。
在此背景下,第1层企业博世在2016年率先提出了领域控制器的概念,将整车ECU整合到驾驶辅助、安全、车辆运动、娱乐信息、车身电子5个领域中,分别用一个领域控制器替代过去大量的独立ECU
特斯拉的做法更为激进,按车身区域直接分为前车身区域、左车身区域、右车身区域3个区域,实现整车控制。
中信证券最新拆解特斯拉model3的消息显示,前车身控制器包括ESP车身稳压系统等安全相关、冷却液泵热管理相关、大灯和雨刮等其他功能; 包括左车身灯具和电机在内的左车身区域控制核心芯片控制和配电右车身区域负责空调、雷达、高位刹车灯、后油泵等的控制。
特斯拉域控制器示意图
在汽车行业,域控制器被认为是汽车电子行业未来竞争门槛最高、利润最高的部分。 想要用一个域控制器实现多个ECU的功能,最大的障碍当然是计算能力的提高。
说起计算能力,NVIDIA并不困。
博世和特斯拉的领域控制器模式也给汽车产业带来了创新,黄仁勋希望接过接力棒。 对于自动驾驶来说,2000TFLOPS浮点计算能力已经溢出,他的野心是重新集成域控制器。
黄仁勋在演讲中表示,Thor这一SoC芯片专为汽车中央计算架构而生,用该芯片组成一个控制器,可以同时计算自动泊车、智能驾驶、汽车、仪表盘、驾驶员监控等多个系统“Thor支持计算域的分离开发。 可以将2000TOPS全部用于自动驾驶工作流程,也可以分配使用。 一部分用于智能客舱、AI娱乐,一部分用于辅助驾驶。 ”
也就是说,Thor不仅可以代替Orin X自动驾驶芯片的升级版,还可以代替高通骁龙8155、8295等客舱芯片的工作。 除了扰乱智能驾驶芯片的市场,黄仁勋还与竞争对手高通抢占客舱、娱乐芯片的份额。
汽车产业有一个共识,传统燃油车时代的低计算力MCU不能适应车辆的智能化发展,汽车结构已经从传统的分布式结构转向域控制器,更少数量的大计算力ECU取代了庞杂的MCU,下一步来自域控制器NVIDIA引领着汽车芯片的第二次革命。
据悉,Thor芯片最先在氪车上量产交付,将在第一站选择中国市场。
除了黄仁勋,还有不少厂商想引领第二次芯片革命。 德国安波福零部件今年9月宣布,推出了世界上首个整车中央计算平台CVC。 首次在中国市场投入使用,集成了ADAS、车身功能、网关及VCU功能,能够处理汽车中数百个零部件的通信信号。 新势力小鹏表示,新旗舰G9将采用“中央超计算区域控制”的融合硬件架构。
计算能力很好,但不是全部
NVIDIA的计算力霸权毫不动摇。 其他芯片制造商的出口在哪里?
首先,中央电子电气架构对所有人来说都是理想的,但目前的多个域控制器方案并不是不能接受。 通过堆叠多个低计算能力芯片,获得与高计算能力相同的效果,是下车企业通行的做法。
目前,许多主机厂已经通过多芯片堆栈,将计算能力积累到1000TOPS水平。 例如,今年陆续上市的新车尼奥ET7、ES7、威玛M7均搭载了4颗7nm工艺的NVIDIAOrin芯片,计算能力达到1016TOPS。 魏牌摩卡是基于高通Snapdragon Ride自动驾驶平台推出的5纳米工艺SA8540P SA9000P芯片组合,计算能力达到1440TOPS。
更重要的是,绝对计算力并不等同于最终的实车应用效果,许多低计算力芯片的实际表现,并不总是输给高计算力。
换言之,高计算能力确实是面对更复杂的场景时的响应速度。 例如,在汽车系统领域,避免黑屏、停机的困境。 但是,NVIDIA、高通和Mobileye提供了通用智能驾驶平台。 主机厂或自动驾驶公司能100%发挥芯片的计算能力吗?
美国驾驶辅助巨头Mobileye的首席执行官Amnon Shashua指出,TOPS是效率比计算能力更重要的非常不充分的计算能力指标。
国产芯片制造商地平线CEO余凯在反驳NVIDIACEO的“TOPS是新马力”时表示,“100公里的加速比马力更能真实地反映动力性能,准确识别每秒帧频MAPS比计算力更能反映芯片的AI性能”
对于NVIDIA上出现的Thor系统芯片,地平线相关人士告诉观察者网:“要落地量产应用水平,还是要关注车企的实际需求,车企的成本和消费者的购买成本。 我们更加强调效率,强调软硬结合。 ”
之所以这样是因为,硬件以及对软件和软件的特定需要的匹配将决定芯片的性能。 汽车芯片并不是完全标准化的行业,不同的主机厂、不同的功能设计对芯片提出不同的个性化需求。
其实,这很像手机市场。 苹果没有购买高通芯片,而是坚持自我钻研芯片,适应IOS系统,实现软硬件匹配。
在芯片和整车匹配方面,现在的优等生是特斯拉。
特斯拉并不仅仅强调计算能力。 FSD自研芯片的计算能力为144TPOS,但在点对点的驾驶辅助方面,强大的竞争对手反而优于计算能力。
余凯还表示,在第十四届汽车蓝蓝论坛上,在国际权威的深度学习图像数据集MS CoCo上的物体检测跑者中,地平线的航程5芯片达到每秒1283FPS,NVIDIAOrin达到1001FPS
正确认识每秒帧频的比较
在典型的Backbone1080P模型中,征兵5的AI性能与Orin-X不相当,但能效仅为Orin-X的330%; 在高效模型中,软硬组合后,征兵5的性能最好超过Orin-X,有orin-x 870 %的能效。
“我们只有orin芯片售价的一半。 ”余凯这样说。
国产芯片的独特优势
不是竞争性能,国产芯片企业还有一个独特的优势。 那就是计算能力不够,服务聚集在一起。
NVIDIAthor的计算能力确实很强,但从目前的表现来看,它打算打造一个开放的通用平台,允许主机厂自行在平台上开发适配,不会自行提供定制服务。
国产芯片企业的一贯优势在于对主机厂的服务更细致。 主机厂不擅长软硬件开发,芯片企业可以直接为它们提供个性化的开发服务。
理想的汽车CEO李先生说:“我想感谢地平线。 中国有这样的芯片企业,未来充满希望。”
比起理想的迄今为止的合作制造商Mobileye,地平线明显打动了李先生的想法。 李先生表示,地平线将直接派团队在理想的配合下优化智能辅助驾驶功能,经常一起加班解决智能驾驶问题直到12点。
与地平线开放型工具链算法不同,Mobileye的上一代芯片EyeQ4不支持汽车企业的本地优化。 由于Mobileye的封闭性,理想情况是在面对中国的道路问题时,只能自己在Mobileye的前置摄像头旁边增设摄像头,用于道路数据采集、驾驶辅助系统的算法训练。
通过性价比、本地化服务,地平线、黑芝麻、华为获得了主机厂的订单。 比亚迪、一汽红旗征程5前装车将于明年上市。 华为推出车规级智能驾驶计算平台MDC,阿维塔11、阿尔法s搭载MDC810智能驾驶计算平台,长城沙龙机甲龙、广汽Aion LX Plus、哪款枪s等搭载的MDC610平台
但是,国际芯片巨头不想失去中国市场。 Mobileye推出的EyeQ5开发了支持第三方代码的软件堆栈算法。 同时在中国成立技术团队,协助主机厂解决自动驾驶方案。 另外,Amnon Shashua在今年的CES2022中登场的第7代车规级芯片EyeQ Ultra将支持2023年量产的L4级自动驾驶。
中国作为世界上最大的新能源汽车市场,已经是兵家必争之地。 国内制造商正在加速新一代芯片的开发,地平线方面表示,基于新的BPU纳什架构构建的征兵6芯片正在开发中,AI计算能力将提高数倍。 国际芯片制造商开始加大力度弥补服务方面的缺陷,国内芯片制造商能应对吗?
苦战是不可避免的,但中国芯片并没有失去希望。