盖世汽车讯 据外媒报道,英伟达发布专为物理AI打造的开放世界基础模型NVIDIA Cosmos? 3。该模型基于突破性的“混合Transformer”架构构建,将视觉推理、世界生成与动作预测整合于单一系统中。
Cosmos 3是全球首个完全开放的“全能模型”,能够以领先的物理精度原生理解并生成文本、图像、视频、环境音效及动作,从而将物理AI的训练与评估周期从数月缩短至数日。
NVIDIA还推出了“NVIDIA Cosmos 联盟”,这是一个汇聚了世界模型构建者与AI开发者的全球协作平台——成员包括Agile Robots、Black Forest Labs、Generalist、LTX、Runway和Skild AI——旨在携手推动下一代世界模型的发展。
NVIDIA创始人兼首席执行官黄仁勋表示:“得益于多模态推理、语言、视觉以及世界模型领域的突破性进展,物理AI的‘大爆炸’时刻已近在咫尺。Cosmos 3系列开放式前沿全能模型,将赋予开发者跨越代际的能力提升,助其打造出能够在物理世界中进行感知、推理、规划与行动的机器人、自动驾驶车辆以及视觉AI系统。”
   免责声明:该文章系本站转载,旨在为读者提供更多信息资讯。所涉内容不构成投资、消费建议,仅供读者参考。




