3月22日,阿里巴巴人工智能實驗室推出了第二代中文人機交流系統AliGenie2.0。新一代系統在此前“聽”和“說”的基礎上引入了視覺能力,能夠進行視覺認知、多模態交互、情景感知。
阿里巴巴人工智能實驗室負責人淺雪表示,AliGenie 2.0的視覺能力將首先落地在天貓精靈X1上。據了解,天貓精靈只需要裝載一個XHolder硬件,然后通過手機APP中的“精靈火眼”功能,就可以實現視覺識別能力。
目前,“精靈火眼”功能主要聚焦在兒童和老人場景。對于兒童,精靈火眼可以通過圖像識別,結合智能語音互動、聲音朗讀,幫助兒童讀書、識字;對于老人,精靈火眼具備識別藥盒的功能,只要掃一掃藥盒,就能用語音播報藥名、功效、過期日等信息。
據悉,精靈火眼目前已能識別117套圖書、4萬個藥盒。此外,精靈火眼還具備一個3D虛擬形象,可提供自然交互的表情擬態動畫。目前,這個虛擬形象可實現20多種擬態動畫,用戶觸摸其不同部位,它能夠產生不同的反饋和互動。
淺雪表示,天貓精靈的本質是一個家庭智能終端,將具備認知能力、理解力,執行力。未來,它不僅是一個智能音箱,還可以連接其他家電、家居產品進行智能控制。
所以在淺雪看來,智能音箱是否帶屏幕并不重要,重要的是視覺認知的能力。淺雪表示,智能音箱終極形態是家庭機器人,從“聽”“說”,到“視覺交互”,再到“行動力”,阿里巴巴希望通過引入視覺能力加速這種進化。
阿里巴巴人工智能實驗室作為阿里巴巴智聯網戰略的一部分,未來的主要研究方向便是將語音交互、視覺交互、機器行動力等結合在一起,推動家庭智聯網的落地。
截至目前,天貓精靈的銷量已經達到200萬臺,連接的家用電器數量超4500萬臺,并累計為用戶執行了9億次任務。
|