2024Q1,全球智能音箱出貨量為18.9M,同比下降14.3%。曾在2019年火爆異常的智能音箱如今境況不佳,一方面是受整體消費降級影響,另一方面也是由于產品迭代緩慢、智能化體驗不盡人意、音效不如專業音箱、痛點癢點繁多。但長期來看,多模態大模型將成為驅動力,配合Matter標準逐漸成熟、智能家居滲透加速,智能音箱或將迎來新一輪的產品升級和市場機會。
圖表1:2023Q1-2024Q1 全球智能音箱出貨量
數據來源:DISCIEN整理
一、大模型是新時代的“電力”
回顧歷史,我們可以發現科技的發展是波浪式的,一種新生的通用技術在發明之后,會刺激產品形態的革新,而更完善的產品可以承載更多更好的技術應用,由此形成正向循環,比如電力和電燈、互聯網和個人計算機、移動互聯網和智能手機等。
著眼當下,最引人注目的通用技術便是AI人工智能,而AI各個分支技術中的弄潮兒非“大模型”莫屬。OpenAI、Google等巨頭之間的你追我趕,帶來的是大模型技術的突飛猛進。技術的發展也刺激了商業化的探索,眾多科技廠商致力于尋找承載大模型的產品形態,AI手機、AI PC等概念及新品此起彼伏,其中也包括很早就被寄予厚望的智能音箱。
二、智能音箱是大模型的最佳載體之一
AI之所以被科學家定義為通用技術,是因為其能應用在很多產品上,比如電視、手機、電腦等。那為什么智能音箱可能是大模型技術的最佳載體之一?
第一,智能音箱的核心功能和大模型的主要技術突破都集中在感知與交互領域,產品和技術的匹配度高。
第二,智能音箱已經擁有了一定的用戶規模,其在家庭中的角色也是生活助手,智能音箱可以更快速地將大模型落地到生活場景。
第三,對于電視、手機這些產品,大模型是錦上添花的“輔助”,而對于以智能交互為主要特征的智能音箱,大模型是最重要的“主菜”。
三、多模態大模型給智能音箱帶來轉機
轉機1:多模態大模型提升智能音箱產品力
如果能夠將GPT-4o展示出來的能力嫁接到智能音箱上,智能音箱的感知、交互、決策、反饋將更加順暢。設想一下,智能音箱能夠和你實時語音對話、能夠讀懂你的潛臺詞、能夠看懂你的動作,比如看到老人摔倒然后自主報警、識別到情緒不佳會主動開導,這種功能才能夠實現真正的價值。
轉機2:頭部廠商將多模態交互作為升級方向
天貓精靈在上個月進行品牌煥新,更換了logo并發布了X6智能音箱,其產品更新主要是提升音質和智能化。音質通過升學架構設計和驅動單元進行提升,智能化則是引入大模型和內容理解算法,提供更有溫度的交互體驗。
天貓精靈認為未來智能音箱顯然不能再是一問一答的呆板機器,要給用戶更有想象力的應用體驗:在語音交互上借助大模型能力做語音鏈路優化,并且能夠進行多模態交互,主動判斷當前場景和狀態,不僅僅是被動接受。
轉機3:成本下降是大模型商業化落地的關鍵
更值得關注的是,GPT-4o在價格上實現了50%的下降,按照OpenAI的預期,其大模型的價格將會以每年50-75%的幅度繼續降低。部分國內大模型的使用成本也在持續下降。
圖表2:部分國內大模型降價匯總
數據來源:DISCIEN整理
綜上所述,多模態大模型能夠有效提升智能音箱的產品價值,頭部廠商已開始著手利用多模態大模型做新一輪的智能音箱產品更新,而大模型的使用成本越來越友好,疊加智能音箱十年探索期積累的用戶基礎,我們相信智能音箱將迎來新一輪的產品升級,同時也將給市場注入新動能。