
[CNMO科技音问]5月26日,小米汽车精良发布XiaomiAutoWorldModel全新框架,为业界扶助驾驶天下模子提供了新的框架旅途,鼓励行业从“场景感知”向“领略推演、场景进化”的高阶阵势跃迁。

小米汽车
该框架是小米初次将三维重建与视频生成深度耦合的一体化架构,以“重建锚定几何、生成填补念念象”的新范式,冲突行业永久摄取的重建与生要素离的时间道路。在Waymo、nuScenes等主流基准测试中全面获得SOTA,并已在小米汽车合成数据、仿真测试、智能座舱三大中枢场景完成业务落地。

CNMO科技精通到,该框架将重建模块(WorldRec)与生成模块(WorldGen)深度耦合。WorldRec通过衰败三维锚点表征,高效构建精准的3D场景几何;WorldGen则在重建不断下补全未不雅测区域和翌日帧,复古最长1分钟的视频生成。两者彼此增益,终明晰高安适性、高一致性、高真确性的协同恶果。
在重建边界,WorldRec在公开的Waymo数据集上全面伊始此前SOTA顺序DGGT,PSNR达到28.48,超出约1个点;在nuScenes零样本泛化测试中仍是保抓伊始,九游体育世界杯中国官网首页对新场景稳妥技艺强。在生成边界,WorldGen在H20GPU上单视角生成速率达0.19秒/帧,三视角为0.46秒/帧,比同为自总结顺序的Epona(1.06秒/帧)快5.6倍。复古高达81帧聚拢生成(10Hz/30Hz,最长1分钟),而大大批公开基线仅能生成8-16帧。在nuScenes数据集上,WorldGen获得FVD64.97和FID7.04的得益,FVD主见高出了统共对比的同类模子。


值得一提的是,XiaomiAutoWorldModel已在小米汽车三大履行场景中落地:
合成数据生成:已请托向上10万clips高质地合成数据,径直用于感知模子磨砺,擢升车辆在危急场景下的识别技艺。
仿真测试:构建闭环仿真环境,优化测试效能,可在仿真中复现真确事故进行定向优化。
扶助驾驶学堂:哄骗天下模子动态生成第一东说念主称驾驶教养视频九游体育世界杯中国官网首页,现在已上线小米全车型的扶助驾驶学堂-实景模拟场景。

备案号: