首页 > 汽车测评 > 汽车测评 > 理想汽车启动端到端+视觉语言模型早鸟计划:车辆具备思考能力

理想汽车启动端到端+视觉语言模型早鸟计划:车辆具备思考能力

发布时间:2024-07-06 21:19:20来源: 15210273549

7 月 5 日消息,在今晚的理想智能驾驶夏季发布会期间,理想汽车宣布,端到端 + 视觉语言模型早鸟计划正式启动,号称可让车更智能、更像人。

IT之家汇总主要信息如下:

理想汽车称端到端模型的优势在于“高效传递”和“高效计算”两方面:端到端是一体化的模型,信息都在模型内部传递,具有更高上限,用户所能感受到的整套系统的动作、决策都“更加拟人”;一体化模型可在 GPU 里一次完成推理,且端到端延迟更低,用户可感知到“眼”“手”协调一致,车辆动作响应及时。

一体化模型可实现端到端的可训,完全数据驱动。官方表示,对于用户来说最大的感受就是 OTA 的速度越来越快

视觉语言模型方面,其整体算法架构由统一的 Transformer 模型组成,将 Prompt(提示词)文本进行 Tokenizer(分词器)编码,然后将前视 120 度和 30 度相机的图像以及导航地图信息进行视觉信息编码,通过图文对齐模块进行模态对齐,统一交给 VLM 模型进行自回归推理;VLM 输出的信息包括对环境的理解、驾驶决策和驾驶轨迹,并传递给系统 1 控制车辆。

官方表示,该系统整体设计存在三个亮点:设计了流式视频编码器,能缓存更长时序视觉信息;增加了记忆模块,缓存了多帧历史信息,可解决超长上下文推理时延问题;设计了智能驾驶 Prompt 问题库,系统 2 可以“思考”当前驾驶环境并给系统 1 合理驾驶建议,系统 1 也可在不同场景下调用不同 Prompt 问题,主动向系统 2 进行“求助”。

汽车测评更多>>

配零重力座椅,华为乾崑智驾,续航1400km,这台新能源车值得一看 座椅2+2+2布局,配冰箱,优惠后18.86万起,家用看这款中大型SUV 座椅2+2+2布局,车长超5米,配冰箱,东风奕派eπ008带劲不? 座椅2+2+3座椅,2.5L油混+四驱,惠后32.78万,这款中大型MPV香? 配L2级辅助驾驶,爆243马力,惠后16.39万,家用可以看这款中型车 前排双零重力座椅,3.9秒破百+魔毯悬架,家用看这款豪华中型SUV 座椅2+2+2布局,252马力+9AT,降幅3万,家用看这款合资中大型SUV 朋友8.5万买卡罗拉,总觉得哪里不对,你们说呢? 五菱惊世K-Car!侧滑门神车仅6万?国产车王再战江湖? 中法汽车新秀会师巴黎:零跑B10与雪铁龙C5 Aircross的同场竞技 新车外观调整/两种动力/最高续航415公里,新款雪铁龙-C4发布 比亚迪打响“清仓价格战”!从20多万降到10万,车长近5米 零百加速4.3秒,六七座可选,比亚迪唐dmp现在还能买吗? 丰田终于妥协了!从17万降至11万,油耗5L使用92号汽油 中年用户成消费主力,吉利该到“去年轻化”的时候了 奥迪5米巨兽PK保时捷!百万豪车市场暗战,谁主沉浮? 苹果iOS18.1 Beta7初体验:信号、续航与流畅度全面评测 2024年巴黎车展:零跑B10跨界车登陆欧洲市场 小鹏P7+巴黎车展开启预售,订单突破3万台 新势力最快!理想第100万辆车下线,雷军、李斌都来庆祝... 广汽集团“开荒”欧洲,冯兴亚:一点又一点,小鸟筑成巢 特斯拉Optimus机器人被曝在发布会受远程操控,有场外员工监督帮助其与来宾互动 用高德也能打无人驾驶的士了,就在广州!价格低过出租车 深圳楼市延续“十一”行情,332套房3个半小时“日光” 天猫3C数码火爆开局:42个品牌双11预售首小时成交同比翻倍 淘宝天猫宠物双11预售金额90分钟超去年首日 苹果出货量创历史同期新高 消费电子景气度延续可期 苹果:新果上市价格或稳中偏弱 6400-7000元/吨 vivo X200系列发布,4299元起售,一篇文章看完这三款产品 vivo X200系列正式发布:全球首发公里级无网通信