除了电力和算力,训练数据荒也是制约 AI 长远发展的重要因素。
尤其在机器人和自动驾驶等物理 AI 应用中,数据的价值不仅体现在其规模,更在于多样性、精准性和真实性。
然而,获取这类高质量数据往往成本高昂,难以满足实际开发需求。
正是在这样的背景下,英伟达于 CES 2025 发布会上推出了 Cosmos 平台。老黄称其为“技术与行业痛点的双重突破”。
那么,Cosmos 平台究竟有哪些“硬核”能力?它会如何塑造 AI 未来?
物理 AI 的“省字诀” -
物理 AI 不同于生成式 AI,它更侧重于与现实世界的交互,比如机器人需要理解空间结构,自动驾驶需要应对多变的交通场景。
然而,传统数据采集方式存在诸多痛点:
1. 成本高昂:需要大量传感器、车队或硬件设备。
2. 覆盖不全:难以获取极端或稀有场景的数据。
3. 耗时耗力:数据采集与标注周期冗长。
Cosmos 平台则提供了全新的解决方案:通过生成逼真的虚拟环境与合成数据,部分取代真实世界的数据采集,大幅降低时间和成本。
同时,Cosmos Tokenizer 能对视频数据进行智能压缩,进一步加速模型训练并降低成本。
值得一提的是,这与行业先行者,李飞飞团队的“空间智能”大模型有着本质上的不同。
李飞飞的团队通过真实场景的捕获与重建,打造了如 Matterport3D 和 SUNCG 等数据集,强调对真实世界的精准还原。
而英伟达的 Cosmos 平台,则以合成仿真数据为核心,可谓将“省字诀”贯彻到了极致。
-重新定义物理 AI 开发-
Cosmos 平台的核心是,基于 Omniverse 构建的 WFMs(World Frame Models),它能高效模拟多样化的 3D 场景,从家庭环境到复杂交通路况,均能高度还原。这种虚拟环境为物理 AI 提供了全新的训练方式,大幅减少对真实数据采集的依赖。
同时,Cosmos 平台集成了以下两大工具,进一步提升效率:
NeMo Curator:两周内处理并标注高达 2000 万小时的视频数据,效率提升数十倍。
- Cosmos Tokenizer:对视频数据进行智能压缩,加速模型训练,降低硬件成本。
通过这些工具,开发者可以快速完成从概念验证到规模化部署的转变,极大降低了时间和资金成本。
以自动驾驶为例,传统数据采集需要动用大量车队和传感器,并面对天气变化和复杂交通的多重挑战。
Cosmos 利用虚拟环境和自动标注工具,大幅减少对真实数据采集的依赖,从而降低开发成本。
Cosmos 平台的工具链让开发者无需花费数月搭建环境或标注数据,而是能快速迭代模型。
这让企业可以更快从概念验证阶段过渡到规模化部署,大幅提升市场竞争力。
-生态战略:英伟达的野心 -
综上所述,小编认为,Cosmos 平台不仅是一项技术创新这么简单,更是英伟达生态战略的重要组成部分。
通过与 NeMo Curator 和 Tokenizer 等工具的深度集成,英伟达正在构建一个从数据生成,到模型训练的完整生态链。
这一生态覆盖了上游的数据处理,到下游的应用开发,无论是机器人研发公司还是自动驾驶初创企业,都很难绕开英伟达的技术体系。这也让英伟达在物理 AI 领域的竞争力进一步提升。
643.png