1月9日,商湯絕影宣布其與國內車企合作伙伴聯手打造的原生流式多模態座艙產品已經量產上車,并向用戶進行OTA推送。
在去年11月的2024絕影實力AI DAY上,商湯絕影發布了“A New Member For U”產品,原生流式多模態大模型是打造該產品的關鍵之一。

隨著商湯絕影的多模態艙外識別功能量產上車,它已經能夠實現“前車識別”、“交通標志識別”和“沿途風光識別”等功能,以及能和車內駕乘人員進行交流與互動。
目前,小米、小鵬、比亞迪等企業紛紛上車多模態識別功能,多模態大模型上車已成為行業趨勢。這一趨勢的背后,是技術進步和市場需求的雙重推動。
從技術角度看,多模態識別技術通過整合來自不同傳感器的數據(如圖像、聲音、文本等),能夠實現對環境或用戶行為的更全面、更準確的感知和理解,以提高車輛的智能化水平和車輛的安全性和用戶體驗。
從市場需求角度看,隨著消費者對汽車智能化、網聯化需求的不斷增加,多模態識別功能已成為吸引消費者的重要賣點。企業紛紛上車多模態識別功能,也是為了滿足市場需求,提升產品競爭力。
商湯絕影方面表示,多模態能力是AI向AGI進化的核心推動力。其指出,大模型的發展從單一模態到多模態是不可阻擋的趨勢,AI想要提升全面理解世界和理解“人”的能力,向AGI演進,從而真正在工作和生活中幫助人類,AI就必須能夠支持并實現多種模態的感知、理解和交互。
商湯絕影原生流式多模態大模型是基于商湯“日日新5o”打造,其能讓文字、語音、視頻等模態一同輸入,經由模型統一處理后輸出相應模態的信息。
該多模態大模型量產上車,也成為大模型加速深度融入智能汽車的一個例證。