自從理想ONE通過OTA升級到2.1版本之後,全新自研的理想同學語音系統正式上線,升級後的版本增加了四音區鎖定、喚醒打斷、對駕駛模式的語音操控等新功能,可以說將理想ONE的語音能力整體抬上了一個台階。現在,理想同學又進入了第二個階段,2.2版本系統在2.1版本的基礎上增加了自由連續對話、可見即可說、情感化語音合成等高階能力,語音交互能力堪稱史上最強。
這次的2.2版本主要是為了解決一個「自由」的問題,語音輸入的不自由、指令的不自由、一人說話其他人得閉嘴的不自由、重複命令的不自由。總之,理想這次要達到一個「服務全家人的自由對話」的目的。
而提到語音系統,很多人都會想到去年就開始發力的小鵬汽車,P7上的「小P」也算目前中文語音交互的最強之一。更重要的是,像連續對話、可見即可說這些功能在小鵬的語音系統中也存在,甚至比理想發布的時間還更早,雙方都擁有目前為數不多語音能力這麼先進的產品。那麼我們倒要看看,理想同學和小P到底誰更勝一籌,於是我們讓理想ONE和小鵬P7來了一次短兵相接。

自由連續對話下,聊天絕對更自在
在這次大幅更新語音系統之後,理想同學的底層架構引入了思必馳+微軟的技術,上層核心功能自研,這一路線與小鵬非常類似,小鵬的底層也使用了思必馳平台的技術。有了新技術的加持,理想同學的喚醒速度、識別準確度、語義理解能力都得到了大幅度的提升,這些基礎能力已經非常成熟了,甚至我們可以從屏幕上清楚地看到系統以及可以極高地識別出我們所說的話。

在這一點上,理想和小鵬都表現的都已經足夠優秀,不過依靠四個座椅的獨立高靈敏度麥克風,可以更加精準地直接實現四音區定位,理想ONE在喚醒和識別準確率上比小鵬P7還要略勝一籌,在幾天的測試下幾乎每次喚醒都能即使響應,識別也幾乎沒有錯誤。而且在這基礎之上,理想同學在2.2版本中新加入了自由對話能力,可以一次喚醒、連續對話,讓整個語音交互上了一個大台階。

現在,我們跟理想同學的對話不再拘泥於「喚醒-命令-執行」這個單一過程,理想同學在一次喚醒之後會持續聆聽,你可以一直對它發出各種指令、查詢各種信息,直至你不說話20秒後再退出。這就大大提高了語音交互的便利和效率,不用一次次地喚醒,而且可以在過程中任意打斷進行下一個指令,比如在理想同學正播報天氣時直接調整空調、播報股票時放一首歌,做到真正的「對話」。
而如果你注意到,我們所說的話都會在屏幕上識別出來,但這並不會導致誤觸發,理想同學在對話的過程中加入了對話抑制。當我們車上在跟理想同學對話時,即使同時在跟其他人說話或車上仍有其他人聊天,都不會影響正常的人車交流,理想同學只會提取真正的有效信息,也就是我們所說的無效文本拒識。甚至,我們可以直接說「不要聽左後音區的」來單獨關閉左後麥克風,不讓後排小朋友們搗亂。

因此在車上,我們現在只需一句「理想同學」,就可以一直跟車輛進行各種對話,還不怕別人打擾。從前,我們最早是在小鵬P7上看到的類似功能,不過在多音區上,小鵬P7只支持雙音區語義識別,後排採用的是按鍵喚醒鎖定的方式,也是另一種解決方案。但現在理想ONE一舉追上,從實際體驗上來看,理想ONE的獨立麥克風四音區鎖定相比按鍵還是更加直接一些,頗有點後來者居上的意思。
如何讓語音充當車機的滑鼠?
我們經常會在使用語音的時候遇到這樣一種情況,不知道具體指令的名稱、想通過菜單瀏覽的時候,往往不知道如何下嘴,還是要手動划動屏幕。這就要提到理想同學這次的另外一項重要的功能——可見即可說,看見什麼就說什麼,通過語音也能起到像滑鼠一樣點擊屏幕的效果。
比如,直接通過「動力運動」來更改動力模式、「車門車鎖設置」來切換到車門車鎖設置頁面、「往下翻」來將頁面向下滑,目前都可以通過語音系統操作選取一/二級菜單頁面,也包括主頁面的左右划動。但更重要的是,我們即使在QQ音樂、喜馬拉雅這樣的APP當中也可以一樣使用。比如,我們直接說「喜馬拉雅」、「發現」、「往下翻」、「郭德綱」就可以直接在現有的音頻中選擇一段相聲,而且支持直接通過幾個「關鍵詞」就能選取。這樣,尤其在我們只是想瀏覽一下,看看有什麼感興趣的內容的時候就更好用了。
小鵬P7上同樣支持可見即可說功能,而且或許由於理想同學的新版本剛上線不就,小鵬的小P在這一方面的表現其實要更加穩定一些。不過小鵬P7目前只支持系統層級的菜單,並不支持其它的第三方APP,像音樂、有聲內容也僅支持對小鵬音樂的操作。從這個角度來說,理想同學雖然也只是支持QQ音樂和喜馬拉雅,不過畢竟大大增加了內容生態,而且在未來將會做到支持全系統APP的支持。

這麼一看,在這項功能上,兩款車型的表現各有千秋,小鵬在功能支持的範圍內表現穩定優秀,不過對第三方APP的支持目前還不夠完善。而理想同學則覆蓋了更多的功能,尤其是在支持QQ音樂和喜馬拉雅的情況上,大大增加了這項功能的實用效果。
自然、舒服,才是正確的交互方式
其實,我們在體驗兩款車的過程中,另外一個非常直觀的感受就是,理想同學的聲音非常接近人聲,語音語調也很很有親和力,幾乎完全擺脫了機械化的發音。原因在於理想同學基於深度神經網路的雲端語音合成技術,通過動態網路融合方案保證合成效果及穩定性,字裡行間的連接也絲毫不生硬,讓人聽了覺得很自然,從感官上就更加願意與它進行語音互動。而相比之下,小鵬P7的人聲就會略顯生硬,更新後的理想同學在這一點上明顯佔據了上風。

同時,這次的理想同學也更懂你了,可以實現跨音區的上下文語義理解。比如像空調、座椅、車窗這種車控甚至是歌曲進度條,除了可以通過百分比精確調整之外,一次不到位的話只需要說「再大點/小點/冷點/熱點」就可以在其基礎上再調整。更方便的是,我們自己調好之後,一句「副駕也是/後排也是」就可以讓其它乘客一次同步到位,直接省去了把這些設置再說一遍的重複指令。

另外,兩款車都在安全上進行了一定的貼心設計。在自動駕駛輔助的相關功能上,理想同學可以通過語音對駕駛模式、路面模式等進行操作。對有關駕駛的功能,如果是副駕下指令,理想同學會說「抱歉,這個操作我只能聽從駕駛員的」;而對它認為需要謹慎的項目,比如車道保持輔助、自動緊急制動等,在語音關閉時會回答「為了駕駛安全,請手動操作一下吧」。這一點在小鵬P7上也類似,在相關功能上會再多問一句「仍然關閉嗎?」。

可以看出,在擬人化和情感交流上,目前看來理想同學還是下了不少功夫,在可以回應執行基本的指令之外,讓我們感到自然、舒服。根據理想的數據,多人用車場景下的語音使用率已經達到了62%,也說明更多人願意使用理想同學。最後還有一個彩蛋,我們分別問了理想同學和小P怎麼評價對手的產品,還挺有意思:
車雲小結
通過對理想ONE和小鵬P7這兩台車的對比,我們認為它們幾乎可以代表目前市場上語音能力最強的產品了,雙方在功能覆蓋和交互體驗上都給了我們很深刻的印象。不過理想ONE憑藉後發制人的優勢,整體給了我們更多的驚喜,不僅在功能覆蓋上幾乎不遜於小鵬,而且擁有更自然更流暢的交互體驗。如果說小鵬是此前最強語音之一的話,那麼理想ONE現在已經絕對有挑戰甚至是超過它的實力。
其實面對理想或小鵬這樣在語音能力上都已經很強大的產品時,一些常用的指令類、查詢類的常規語音交互已經滿足不了我們的胃口,它們的交鋒更多存在於更深層次的能力和擬人的交互體驗。換句話說,它們給我們提供的已經不是一個單純通過語音完成任務的語音助手,而是在追求能真正像朋友一樣跟我們交流互動的方式。我們期待理想同學下一次版本給我們更多的驚喜。
原創文章,作者:投稿專員,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/226677.html
微信掃一掃
支付寶掃一掃