最好用的語音輸入法:語音輸入法哪個好用

你試過15分鐘寫3000字嗎?

除了知識儲備和靈感之外,碼字速度同樣是一個作者重要的必殺技。作為一位作者,劍飛最常用的碼字神器就是訊飛輸入法的語音輸入功能,他還曾經嘗試過用訊飛輸入法日更15萬字。

輸入法雖然是人們使用手機、電腦等智能設備的必備工具,但大家在平常被問到最常使用的App是哪個的時候,很少有人會想起它。

不過隨著越來越多AI技術應用到輸入法中,輸入法逐漸從工具性產品發展成服務性產品,變得更貼心了,像訊飛輸入法中的中英文混合輸入功能、AI助手提供的AI校對、AI斗圖等等,為用戶提供了更個性化和場景化的服務。

今年是訊飛輸入法推出的第11年,每年都會升級一個大版本的訊飛輸入法,在11月3日發布了今年全新升級後的輸入法:訊飛輸入法V11.0。第11代訊飛輸入法有五大亮點變化:AI語音升級、AI助手升級、AI鍵盤輸入升級、AI表情升級和輸入法App UI、App內社區改版。

AI時代需要怎樣的輸入法?解構訊飛第11代輸入法五大亮點

具體新升級的訊飛輸入法能給用戶帶來怎樣不同的輸入體驗,這些升級背後訊飛輸入法又融入了哪些獨有的AI能力?

為此,智東西對話科大訊飛輸入法業務部總經理程坤,在解構訊飛輸入法五大新亮點的同時,進一步解開訊飛在AI賦能輸入法方面的邏輯和思考。

一、語音輸入進化,應對中英文夾雜、嘈雜街頭考驗

近幾年隨著語音識別等相關的技術的發展,越來越多用戶開始使用、習慣語音輸入的方式。不過,相對於拼音輸入和手寫輸入來說,語音輸入還有比較大的局限性,其中最大的一個局限性就是容易受到周圍環境的影響,比如說高雜訊、多人說話的嘈雜場合等,如何保證一個比較好的識別效果是需要重點去突破的技術難點。

程坤談到訊飛從啟動深度學習語音識別研究以來,一直在優化迭代其語音識別模型框架,從DNN到RNN到DFCNN再到Encode-decode,不斷提升語音識別的效果,進而保證訊飛輸入法語音輸入等訊飛語音相關產品的功能持續優化。

受到人耳具備的聽覺選擇性注意能力的啟發,訊飛提出複雜場景下的前後端一體化語音識別框架TFMA(Temporal feedback end-end multi-channel ASR)框架,將原有的語音識別過程進行重構。

AI時代需要怎樣的輸入法?解構訊飛第11代輸入法五大亮點

傳統語音識別系統

傳統的語音識別是首先通過聲學模型將聲音進行過濾,得到特徵信號,通過第一道識別引擎把這些特徵轉化成如發音信息等音素,然後結合語言模型將語音轉化為文字。

在這個語音轉文字的過程中,如果背景聲音是有多個人在同時說話,使用傳統語音識別系統是沒有辦法將這麼多聲音過濾掉的,進而影響了輸入法語音識別的準確性。

目前,訊飛做了一些創新,高效利用多通道語音輸入,比如新發布的這個TFMA語音識別框架可以解決複雜場景下的語音識別問題。該方案的技術創新點在於採用前後端聯合建模、優化的方案,形成一套自下而上與自上而下互相結合的流程,同時還引入大量的專家知識,結合神經網路網路與傳統信號處理的優勢,保證了系統的魯棒性。

AI時代需要怎樣的輸入法?解構訊飛第11代輸入法五大亮點

TFMA語音識別框架

通過運用TFMA語音識別框架,包括訊飛輸入法在內訊飛的軟硬體產品大大受益,這些產品在高雜訊、多人說話、輕聲說話等複雜場景下的語音識別能力再次提升,特別是-10分貝至-15分貝等惡劣場景下的識別由不可用變為可用甚至好用。

程坤介紹說,第11代訊飛輸入法除了複雜場景下識別率提升之外,另一項語音方面的提升在於可識別的語種更多了,這一最新版的訊飛輸入法現支持包括阿拉伯語、俄語、義大利語、英語等12種外國語言的語音輸入和隨聲譯。

程坤補充道,包括這次的多語種和之前的方言語音輸入方式的實現都依賴於訊飛的統一建模的技術,將各種語種、方言的語料統一放到一個模型中訓練,訓練過程中各種語料並不拆開,訓練完成後直接輸出,這樣即使用戶的普通話沒那麼標準的情況下,訊飛輸入法也能保證一個很好的識別效果。

AI時代需要怎樣的輸入法?解構訊飛第11代輸入法五大亮點

訊飛輸入法隨聲譯功能,例如用中文說話輸入法自動轉化為德語文字輸入

在交流中,程坤說,從輸入法發展的整個過程來看,可以把輸入法分為兩個階段,首先是追求效率的一個階段,可以定義為「1.0版本」,這個階段輸入法廠商解決的是怎樣讓文字輸入又快又準的一個問題。

因為受疫情影響,很多工作、交流都轉到了線上,其實,輸入法的語音轉文字特別是多語種輸入功能很好地滿足了人們線上交流時的這種快和準的轉錄式輸入需求。

二、讓輸入法怎樣更懂人:既是百寶箱也是情感寫手

程坤補充道,隨著互聯網發展和智能設備用戶的個性化需求的增多,輸入法也隨之變化,解決這種個性化需求的輸入法可以被定義為「2.0版本」,對應了三類需求。

第一類需求是用戶的個性化輸入需求,訊飛上線了AI助手功能去承載這一需求,比如說有些人喜歡用圖像去表達一些內容,訊飛輸入法有文字直接轉圖片的斗圖功能。

AI時代需要怎樣的輸入法?解構訊飛第11代輸入法五大亮點

訊飛輸入法AI斗圖功能,輸入文字自動推薦圖片

第二類個性化的需求是很多人的輸入是為了解決某一類問題,訊飛也根據用戶的這類需求在輸入法里內置了搜索,縮短了用戶的需求實現路徑。

程坤說,這一功能的實現其實是依靠訊飛最新的本地化意圖識別引擎去解析用戶的意圖,然後提供給用戶針對性的服務。

AI時代需要怎樣的輸入法?解構訊飛第11代輸入法五大亮點

訊飛輸入法內置的搜索功能

第三類是情感化的需求,訊飛想讓輸入法的AI助手像一個真正的助手一樣,能主動提供給用戶一些推薦和服務,比如說在用戶在社區論壇發帖過程中給用戶推薦文案,當用戶聊天的時候提供給用戶一些更豐富的表達、幫忙校對錯別字,用戶想一鍵好評的時候幫忙助寫等等。

這個過程中會用到一些自然語言處理(NLP)的技術,在本地直接進行分詞分析,感知到用戶想要表達什麼。另外,本地化NLP技術對用戶來說體驗會更好,也更安全。

AI時代需要怎樣的輸入法?解構訊飛第11代輸入法五大亮點

訊飛輸入法AI發帖助手、AI聊天助手、AI好評助手功能

程坤還分享了訊飛輸入法在AI助手方面未來的一些目標,他說對於現在的訊飛輸入法版本,可以定義為從追求效率的「1.0版本」向追求情感感知的「2.0版本」的一個過渡,所以在場景覆蓋上面還沒有那麼全,訊飛先選擇用戶社交、論壇、電商等一些用戶使用頻次高的場景進行適配,未來會逐步的擴展,比如說直播場景、用戶寫作場景等等。

並且,訊飛輸入法未來想提供的不僅僅是輸入工具的功能,還會加入後續的服務鏈接,像目前,在訊飛輸入法界面就可以直接搜索不用跳出輸入界面,未來可能在買東西的時候,輸入商品名稱,輸入法就會串聯到一個比價的功能等等。

「其實訊飛輸入法是整個訊飛產品里用到人工智慧技術比較多的這樣的一個產品。」程坤談到,除了語音技術和AI助手之外,訊飛輸入法的圖像識別功能和隨意手寫輸入的功能也是融入了很多訊飛自研的AI技術,可以識別手寫和印刷體、表格,還可以進行學生作業的批改等多種功能。

AI時代需要怎樣的輸入法?解構訊飛第11代輸入法五大亮點

訊飛輸入法的圖像識別功能

三、輸入法的未來在元宇宙里?

除了提升輸入法的AI能力,訊飛對輸入法的界面也進行了改版,第11代訊飛輸入法鍵盤整體變得更加圓潤。

程坤提到訊飛針對某些頁面,基於使用人群本身的特點進行了一些定向的優化。

AI時代需要怎樣的輸入法?解構訊飛第11代輸入法五大亮點

訊飛輸入法App頁面和鍵盤頁面

輸入法是人機交互的重要工具,除了常用的手機、電腦之外,汽車、可穿戴設備等等都會需要輸入法來完成操作。

例如,汽車的車機內置輸入法,用戶對這類輸入法的需求跟使用手機時對輸入法的需求不同,使用車機輸入法的目的更多是進行搜索,搜地名來導航、搜歌曲來提神等等;而像智能手錶對輸入法的需求也相對於其他設備有差異,訊飛的語音輸入功能對於智能手錶這種屏幕較小的智能設備來說,會有更好的輸入體驗。

AI時代需要怎樣的輸入法?解構訊飛第11代輸入法五大亮點

智能手錶輸入界面

談到輸入法的交互能力,程坤還分享了對於輸入法未來發展的一些見解,輸入法的文字錄入的功能可能只是它的部分功能,未來輸入法更多可能會像一個助手一樣存在。

像最近業內熱議的元宇宙,用戶如何和虛擬世界進行交互,可能不僅僅是使用現在常用的鍵盤,或者文字輸入這種形式,更多的可能是類似現實中人和人語音對話的這種形式進行一些交互。

除了語音交互之外,在元宇宙這種虛擬世界中,人們還會需要用圖像來進行交互、識別交互的另一方;再有就是訊飛正在布局的虛擬形象,通過一個虛擬形象代表用戶自己在虛擬世界的一個身份,進而結合語音技術、圖像技術來達成更好的交互。

AI時代需要怎樣的輸入法?解構訊飛第11代輸入法五大亮點

科大訊飛推出的虛擬人交互平台

結語:AI時代輸入法從快和准到個性化

隨著輸入法的準確性和快速輸入能力的提升,用戶對輸入的需求也不斷增多,訊飛考慮到各種用戶不同場景下的需求,給出有針對性的輸入解決方案,包括語音輸入、圖片輸入、AI校對、AI助手等等。

談到訊飛輸入法,程坤說現在訊飛輸入法的大部分用戶都是主動從手機應用市場上下載安裝訊飛輸入法的,就是因為訊飛充分考慮到了用戶個性化的需求。

如何利用AI去更精準地匹配用戶的個性化需求,或許是未來輸入法領域重要的競爭點。

原創文章,作者:投稿專員,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/226350.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
投稿專員的頭像投稿專員
上一篇 2024-12-09 14:49
下一篇 2024-12-09 14:49

相關推薦

發表回復

登錄後才能評論