未來的汽車,不僅僅是一個出行設備,還將是一個移動終端,不僅有物理按鍵,還有智能語音、手勢識別或生物識別,顛覆使用者體驗。然而,要想真正實現智能語音交互,識別準確、響應快速并不簡單。僅僅從我們發出語音指令,到最后汽車做出動作,短短一兩秒內,智能語音控制系統便要經過語音識別、語義理解、聯動執行及反饋用戶這幾個步驟。
為搶占智能網聯汽車制高點,廣汽在智能語音控制領域進行了前瞻性的技術規劃和布局。依托科大訊飛在語音領域的優勢,廣汽把語音控制引入到汽車,用戶只需要說說話,就能啟閉發動機、開閉燈光、控制雨刮、調節座椅等——語音就像一張無形的網深入汽車控制領域,為用戶帶來愉悅的用車體驗。
語音超智能,云計算做后盾
相信大家都有類似的用車經歷,在嘈雜環境中,坐在駕駛座會聽不清旁邊同伴說的話。當然,如果人聽不清楚可以再說一遍,但人機溝通的智能語音控制系統又是如何解決這一難題呢?
事實上,智能語音控制系統在車上使用有其特殊性。在嘈雜環境中,語音控制源可能被噪音包圍,這就要求系統具有聲源識別、噪聲抑制、回聲消除等能力,讓用戶的指令被系統最大化識別。
為此,廣汽使用專用降噪模塊,根據用戶說話和環境噪音的頻率,剔除不需要的聲音,大大提升系統語義識別率,且遠高于同行業水準。
不過,準確識別語音指令,還只是智能語音控制的第一步。如果你要通過“請導航到××”、“撥打電話××”這種標準格式和系統對話,那這只能叫“語音輸入法”,這種“指令式語音”遠遠算不上人工智能。
智能語音控制的另一個難點,是語義理解,其背后考驗的是人工智能程度。
如果你說“我餓了”,導航立刻為你推薦附近餐館,這可以算是初級人工智能。而傳祺智能語音控制系統,已經可以做到這些,甚至連“好熱啊”都能理解,會主動為用戶打開空調。用戶完全可以用日常語言和系統對話,就像聊天一樣自然。
這套系統的語義理解技術和“云”離不開關系,“云”可以簡單理解為計算機集群的海量數據,人工智能系統按照一套邏輯程序,在“云”海中尋找最準確的答案,還要迅速推送出來和用戶溝通,這是“聊天式語音”的核心技術。尤其是,當被使用的人工智能系統覆蓋的領域越廣,對數據和運算能力越饑渴。
基于此,廣汽聯合科大訊飛在場景數據積累、場景模型訓練、深度學習技術、優化算法等方面做了極大的努力,最終在汽車應用領域的大數據有了豐富儲備。
所以,當用戶說出“好熱啊”,系統便能迅速進行語義分析,并擴展到汽車應用領域,執行相應動作。這背后,正是云平臺級別的計算力。
讓機器學會思考,說話做事一起抓
當智能語音控制系統聽懂了你說什么、想干什么之后,接下來就輪到了聯動執行。
語音的語義識別和聯動執行,其實是兩個不同的研究領域。前者專注于語音理解和資訊篩選,比如用戶說“我要聽流行音樂電臺”,系統會給出滿意的答案,傳祺智能語音控制系統也具備這類型的功能,比如查詢天氣、播報新聞等。
聯動執行又是另一個領域,比如用戶要調整座椅位置,需要座椅控制模塊和語音控制系統打通融合,這又是另一番智能,二者之間的融合聯動也很復雜。
所以,不要小看用戶一句“好熱啊”,傳祺智能語音控制系統不但要分析語義,還要做出打開空調通風的動作。為此,廣汽在車身控制領域的開放和邏輯做了很多軟件優化。
值得一提的是,傳祺智能語音控制系統還率先實現了業界“連續對話”的語音技術。
比如,用戶可以對雨刮、空調、座椅等常用功能進行連續調節,當用戶連續說出“我很熱,風大一些”時,傳祺智能語音控制系統將通過聯動執行技術,連續做出開啟空調、調大風量的兩個動作,而不必每次重新喚醒語音控制系統。
這樣的連續對話,可以說是人工智能的又一進階,這意味著機器不僅能聽懂、會思考、快行動,還能用多核腦思考問題。
在即將上市的傳祺新車型上,用戶將體驗到傳祺智能語音控制系統帶來的便利。超前的技術儲備和布局,是廣汽作為行業領先品牌的強大支撐,除了傳統技術領域,在智能控制領域,廣汽同樣走在前列。