語音交互和文本搜索的本質區別「智能語音交互是什麼意思」

智能語音深度報告,七大場景全面開花,千億規模市場爆發 | 智東西內參

智能語音即聲音信息在人機間的交互模擬,為人工智能的核心技術之一,也是人工智能落地最早的技術之一。1980s至今智能語音經歷三個階段發展,2016年開始進入落地期,智能語音助手、智能音箱相繼落地。

現在,智能語音的相關應用正向消費級和企業級兩大方向爆發。其中消費級包括 智慧生活場景、 智能家居場景和智能駕駛場景,近期總的發展空間將達到3000億元。

企業級應用包括智慧教育場景、智慧醫療場景和應用於電信/金融/電商等場景的智能呼叫/客服場景,值得一提的是,企業級場景近一年來收到疫情的加速催化,空間也即將達到千億規模。

本期的智能內參,我們推薦華西證券的報告《智能語音賽道:風口已至,全面開花》, 從消費級、企業級兩大分支還原智能語音的發展格局。

原標題:

《智能語音賽道:風口已至,全面開花》

作者:劉澤晶

一、智能語音:AI核心賽道

智能語音是AI的重要入口,是AI三大核心基礎技術之一( 機器視覺、智能語音和機器學習)。

智能語音在AI技術中佔據重要地位,就市場份額而言,2019年智能語音佔據我國AI22%的份額,僅次於已經實現大規模商用的機器視覺。智能語音深度報告,七大場景全面開花,千億規模市場爆發 | 智東西內參

智能語音是人工智能行業重要細分市場

所以,什麼是智能語音? 簡單點說,智能語音即聲音信息在人機間的交互。

人類大腦皮層每天處理的信息中,聲音信息佔20%,是溝通最重要的紐帶。智能語音將聲音轉為文字供機器處理、在機器生成語言之後,用語音合成技術將文本語言轉化為聲波。智能語音深度報告,七大場景全面開花,千億規模市場爆發 | 智東西內參

智能語音的實現流程 & 各環節模擬機制

智能語音的發展始於上世紀八十年代,迄今已經歷了三個階段:

1980s-2010為起步期:語音識別開始從孤立詞識別系統向大量詞彙連續語音識別系統發展;

2011-2015為變革期:微軟DNN(深度神經網絡)的出現使識別錯誤率第一次大幅降低,降幅約90%,技術與產品開始大發展;

2016至今為落地期:機器語音識別準確率第一次達到人類水平,約95%,智能語音技術進入落地期,智能語音助手、智能音箱相繼落地。

但是,相比於機器視覺,智能語音的落地進程相對落後。機器視覺企業在全球AI企業中佔比40%、在國內佔比46%;是國內外AI企業最集中的領域。

主要有兩方面原因,一方面其數據的體量、密度相對有限,另一方面其涉及的聲學研究、模式識別研究、通用NLP研究及垂直場景的深度語義理解等還未完全成熟(尤其2016年以前),因此在交互體驗、使用效果、場景優化等方面都仍有較大空間。智能語音深度報告,七大場景全面開花,千億規模市場爆發 | 智東西內參

全球AI企業應用技術方向分布智能語音深度報告,七大場景全面開花,千億規模市場爆發 | 智東西內參

中國AI企業應用技術方向分布

但隨着智能語音技術逐漸成熟,未來幾年市場將維持高速增長。

根據Gartner發布的2018年AI技術成熟度曲線,當前語音識別已經進入‚實質生產高峰期,意味着語音識別技術已被廣泛接受,規模化落地即將開始。此外,像自然語言處理、虛擬助理等相關智能語音技術歷經淘洗之後即將落入,泡沫化低谷期,商業模式越來越成熟,也將進一步推動智能語音的落地。

根據ReportLinker的預測:到2024年全球智能語音市場規模將達到215億美元,其中智慧醫療健康、智慧金融以及各類智能終端智能語音技術需求將成為主要的驅動因素。

智能語音市場按客戶類型可分為消費級市場( 2C 或 2B2C )和企業級市場(2B)。

消費級應用, 立足於個人日常生活,主要包括了智慧生活、智能家居、智慧辦公、智能駕駛等場景,本質上是智能語音技術(以語音助手為代表)對於各類終端的賦能,是AIoT大生態的重要構成。

具體產品包括了:智能手機、智能可穿戴、智能音箱、智能家電、翻譯機、錄音筆、轉寫TWS耳機、智能車載等。

專業級應用:服務於特定場景,如智慧醫療、智慧教育、智慧電信/金融/電商等。相較而言,專業級應用具有更高的垂直屬性和know-how壁壘。

具體產品包括了智慧課堂、自動審閱、學習機(2C屬性)、智慧客戶/呼叫等。智能語音深度報告,七大場景全面開花,千億規模市場爆發 | 智東西內參

智能語音領域的各類細分賽道

二、2C消費級市場

智能手機開創語音助手先河,引領消費級市場。消費級智能語音交互是大眾接觸智能語音最普遍的渠道,核心邏輯仍是消費級AIoT:,消費級AIoT市場規模就已達到1753億元,在總AIoT市場中佔比68%,空間極其廣闊。

眾多人工智能公司(硬件設備廠商 & 互聯網廠商)均瞄準消費級智能交互終端,第一款典型的落地產品就是智能手機語音助手。

語音助手落地開啟智能語音應用元年:2011年第一款手機語音助手Siri伴隨iPhone 4S亮相,各大廠商紛紛入局。從2017年下半年開始通過開放語音生態系統進行產業內合作,語音助可穿戴、家居、車載等領域延伸。

智能手機中配置智能語音助手比例提升,預計2023年佔比將達90%。根據Strategy Analytics數據,2018年全球銷售的智能手機中就已經有47.7%配置了人工智能語音助手,佔比將近一半。

當前,智能手機配置AI語音助手已成為整體性趨勢,從已有用戶的情況來看,智能語音助手用戶使用助手頻率佔比最大的為每周3-4次,表明人們正日益傾向於使用智能語音助手。

基於這一趨勢,Strategy Analytics預計,到2023年前,90%的智能手機都將會配置AI語音助手。智能語音深度報告,七大場景全面開花,千億規模市場爆發 | 智東西內參

智能手機配置語音助手的比例智能語音深度報告,七大場景全面開花,千億規模市場爆發 | 智東西內參

智能手機語音助手使用頻率

智能可穿戴設備市場空間廣闊,智能語音為其天然入口。智能可穿戴設備趨於小屏化、無屏化的特點決定了智能語音將成為其天然入口。伴隨中國智能可穿戴設備行業在各垂直領域應用程度的加深,中國智能可穿戴設備行業將持續擴容。沙利文預測,2023年中國智能可穿戴設備行業的市場規模將達到913.7億元。

中國智能可穿戴設備行業由上游的軟硬件供應商、中游的智能可穿戴設備廠商及下游各應用領域構成。

預計2020年全球可穿戴設備出貨量將達到3.96億台,與2019年出貨量3.459億台相比增長14.5%。

展望未來,IDC預測,2024年全球可穿戴設備出貨量將達到6.371億台,五年內複合年增長率(CAGR)為12.4%。

據IDC發布的《中國可穿戴設備市場季度跟蹤報告》顯示,2020年中國可穿戴設備市場出貨量第一季度、第二季度分別為1762萬台(同比下降11.3%)和2658萬台(同比增長4.1%),扭虧趨勢明確,預期全年數據增速可觀,不低於全球增速。智能語音深度報告,七大場景全面開花,千億規模市場爆發 | 智東西內參

IDC:全球智能可穿戴產品出貨量及預測值智能語音深度報告,七大場景全面開花,千億規模市場爆發 | 智東西內參

IDC:中國智能可穿戴產品出貨量

現階段,搭載語音助手的設備產品主要為智能手機和智能可穿戴設備,同時也包括小部分智能家居產品、智能車載產品。就規模來看,2020年智能語音助手的市場規模已經達到241.1億元;2021年規模將達到337.5億元。

由於中國居民消費水平提升,消費主力群體代際變遷等因素,搭載語音助手的智能設備的消費量將會有所增長,推動中國語音助手市場規模進一步擴大。預計到2023年,中國語音助手市場規模將增長至570.3億元。智能語音深度報告,七大場景全面開花,千億規模市場爆發 | 智東西內參

中國智能語音助手市場規模(億元)

另外一個智能語音落地場景是智能家居,智能家居的最終形態是實現全屋產品的智能化,為AIoT的關鍵場景,在燈光、空調、電視、窗帘、門窗、背景音樂、安防、監控控制以及可編程定時控制等方面均有應用。

2020年中國智能家居市場規模突破2400億,2020年全球智能家居市場平均滲透率將超過60%。 未來三年將是智能家居行業快速發展的時期,行業併購及市場規模增長將誕生一批年銷售額超過百億的企業。智能語音深度報告,七大場景全面開花,千億規模市場爆發 | 智東西內參

智能家居市場規模(億元)智能語音深度報告,七大場景全面開花,千億規模市場爆發 | 智東西內參

2020 智能家電平均滲透率超過60%

智能音箱為語音交互藍圖鋪路,是智能家居入口。 早在2019年底,中國智能音箱累計出貨量就已經超過7000萬台,在我國城鎮住房中滲透率達到20%,接近2012年智能手機的滲透程度。智能語音深度報告,七大場景全面開花,千億規模市場爆發 | 智東西內參

2012-2019年智能手機/音箱出貨情況智能語音深度報告,七大場景全面開花,千億規模市場爆發 | 智東西內參

2012-2019年智能手機/音箱滲透情況

智能音箱當前市場規模已超百億元, 未來三年中國智能音箱行業市場規模將保持穩定增長,2023年有望達到8712萬台,即174.2億元。智能語音深度報告,七大場景全面開花,千億規模市場爆發 | 智東西內參

智能音箱行業市場規模及出貨量

第三個落地場景是智慧辦公,核心是翻譯機。 根據華經情報網數據,我國翻譯機價格主要分布在250-800元和2560-3310元兩個區間,其佔比均為38%。

出境旅遊、教育剛需和經濟全球化等因素持續驅動產業規模增長,自動語音識別、機器翻譯、語音合成、圖像識別等AI技術大幅提升翻譯機性能加速產業發展。

2020年我國翻譯機市場規模將有望達到27.7億,並在2030年進一步擴張至56.2億元。智能語音深度報告,七大場景全面開花,千億規模市場爆發 | 智東西內參

翻譯機價格分布智能語音深度報告,七大場景全面開花,千億規模市場爆發 | 智東西內參

翻譯機市場空間(億元)

另一個潛在爆發場景是語音輸入法。 輸入法是智能語音技術在C端的重要落地場景,語音輸入、智能糾錯、語音翻譯等功能開始成為標配;語音變聲、語音斗圖等針對年輕群體的創新功能也相繼推出。

第四種智能語音落地場景是智能駕駛。 目前,特斯拉、造車新勢力&傳統整車廠、初創公司、科技巨頭採用不同的方法和路徑更新迭代自動駕駛的能力,體現出技術路徑的分化,行業競爭格局正在發生新的變革。

未來伴隨着科技的進一步發展,AI、人機&語音交互、5G C-V2X 車聯網等技術的成熟,智能汽車的功能將進一步豐富,使得智能駕駛的滲透率逐步提高,進而帶動整個產業鏈市場規模的快速增加。

在當前智能汽車的發展中,最為激烈的競爭集中在自動駕駛和智能車載系統兩個領域。

隨着信息技術、網絡技術和人工智能的發展,智能車載系統將通過融合數字顯示、多屏作者互動、手勢操作、智能語音等多項技術,為汽車的駕乘人員提供全新的、直接的、多元的人車交互服務。

在汽車產業領域,搭載基於智能語音的車載交互系統已經成為主流。 車載語音交互或將成為標配,打造車內交互新體驗。

根據高工智能汽車研究院的數據,2020年一季度中國市場銷售新車前裝搭載4G聯網功能滲透率為46.05%,同比上年提高近20個百分點。預計,搭載率到2025年期間將呈現較快的增長態勢。

同時到2025年主流的車企將基本實現新車的聯網標配,車載語音巨頭面臨更大的產業機遇。智能車載潛力巨大,智能語音有望成為車載系統標配。

不同於手機以觸屏為主的交互方式,車機和人的交互更多將採用語音,而未來伴隨着智能汽車滲透率的逐步提高,智能汽車中的語音交互將更加豐富,進而帶動市場規模不斷增加。

AI 車庫數據顯示:我國車載語音市場規模在2022年將接近30%。

競爭格局來看,國內巨頭科大訊飛佔據半壁江山,老牌海外廠商Nuance的國內份額正在被不斷蠶食,身後BAT、思必馳等也在快速追趕。智能語音深度報告,七大場景全面開花,千億規模市場爆發 | 智東西內參

中國智能車載市場規模預測(億元)智能語音深度報告,七大場景全面開花,千億規模市場爆發 | 智東西內參

中國智能車載語音市場規模(億元)智能語音深度報告,七大場景全面開花,千億規模市場爆發 | 智東西內參

我國車載語音市場佔比(截至2019H1)

三、 2B企業級市場

智能語音消費者業務主要通過硬件出售及相關互聯網增值服務獲利,而企業級和公共級業務則主要有兩類合作模式:

一是技術平台輸出模式,將通用技術能力封裝為SDK或API,下遊客戶或生態中的開發者使用時向技術提供方支付一定費用,當然為了促進生態的快速發展,一些平台如華為HiAI 、百度語音技術採取面向開發者免費的策略;

二是切入傳統行業,提供解決方案(含核心設備),這種情形下涉及智能語音企業與傳統行業集成商或最終客戶進行定製化、深度合作。智能語音深度報告,七大場景全面開花,千億規模市場爆發 | 智東西內參

人工智能技術平台輸出和解決方案業務規模

智能教育,AI 課堂的建設進入快車道。教育部發布的《教育信息化十年發展規劃(2011-2020年)》中提到,我國要建立教育經費投入保障體系,並重點提出各級政府在教育經費中按不低於8%的比例列出教育信息化經費。

2021年為十四五開局之年,判斷教育信息化仍將迎來加碼新政,智慧教育將正在政策助推下持續加速發展。

政策直接相關的應用主要有智能語音訓練與評測、互動教學等,其中語音評測市場受益於新高考方案和國家英語能力考試改革,潛力巨大。

智慧教育空間寬廣,應用邊界不斷拓寬。自2012年以來,語音識別、圖像識別、深度學習等人工智能技術發展迅速,不斷實現突破,人工智能在線教育在人工智能技術的發展推動下逐漸興起,基於語音識別技術的語音測評、基於圖像識別的智能情緒分析等人工智能在線教育產品湧現在市場中,人工智能在線教育行業發展步伐逐步加快。

中國人工智能在線教育市場規模從2014年的54.9億元增長至2020年368.3億元,呈現快速增長趨勢。隨着人工智能技術日趨成熟,人工智能在線教育產品性能將進一步提升,用戶規模將不斷擴張,人工智能在線教育市場規模有望迎來新一輪快速增長。

預測至2023年,中國人工智能在線教育規模將達680.5億元,複合增長率仍將維持在20%以上。智能語音深度報告,七大場景全面開花,千億規模市場爆發 | 智東西內參

人工智能在線教育市場規模(億元)

第二個2B場景是智慧醫療。 智慧醫療領域,語音電子病歷系統需求正在釋放。通過語音輸入的方式生成結構化病例、執行病例檢索,節約醫師輸入病歷的時間,解決方案一般包括 ASR/NLU 技術和專用醫療麥克風。

此外,需求正在嚮導診機器人、問診小程序、診後隨訪系統、住院病房管理系統、臨床決策支持系統(CDSS)等多應用領域擴散。

中國的智慧醫療建設行業有着廣闊的發展空間和投資市場,當前市場空間整體超千億元。

根據中商情報網數據,2019年我國智慧醫療建設行業規模為880億元,而2020年這一數字已經達到1040億元。

按照現狀估計,預計到2022年,我國電子病歷語音輸入累計覆蓋近1600家三級與二級醫院付費數,滲透率分別為36%和4.5%,180萬醫生受益。

四、智能語音格局及核心玩家

智能語音語音技術和自然語言理解技術快速進步,目前已在2C消費級的智慧生活、智能家居、智慧辦公、智能駕駛;2B企業級的智慧醫療、智慧醫療、智能客服等多個領域實現場景應用。

根據沙利文諮詢的統計預測,2019年我國智能語音行業市場規模約為218.4億元,預計2024年將達到489.8億元。智能語音深度報告,七大場景全面開花,千億規模市場爆發 | 智東西內參

中國智能語音行業市場規模(億元)

智能語音2C消費級 & 2B企業級市場各細分賽道均有廣闊空間,後疫情時代有望全面開花,梳理如下圖。智能語音深度報告,七大場景全面開花,千億規模市場爆發 | 智東西內參

智能語音領域細分賽道市場空間

國內外智能語音市場均已相對集中,龍頭佔據主要份額。根據中商產業研究院的數據,智能語音全球市場CR5達到88%,中國市場CR5達到84.6%,均已呈現相對集中市場格局。

差異:全球巨頭玩家如Nuance、谷歌等在中國份額有限,取而代之的是國內龍頭科大訊飛。一是由於中英文語義理解差異(疊加方言影響);二是受益於國內互聯網生態高速發展,智能語音在國內具有更加豐富的落地場景。

在這一背景下,可梳理兩類玩家:1、通用平台商如科大訊飛百度致力於打造開放語音生態;2、專業應用商如雲知聲思必馳致力於搶佔家居、車載等細分賽道。智能語音深度報告,七大場景全面開花,千億規模市場爆發 | 智東西內參

全球智能語音市場格局智能語音深度報告,七大場景全面開花,千億規模市場爆發 | 智東西內參

全球智能語音市場格局

智東西認為,自2011年iPhone 4S首次搭載Siri以來,智能語音助手這個聊勝於無但又頗具想象力的功能就一步步成為手機中的基礎功能,並旋即在智能音箱領域大顯身手。雖然語音助手一直的覆蓋面一直在提升,但使用率確一直不高。但是,以智慧家居為例,智能語音設備其實只是一個入口,隨着Iot、自動駕駛等技術的不斷拓展,與智能語音設備相互配合一定會大放異彩。智能語音深度報告,七大場景全面開花,千億規模市場爆發 | 智東西內參

原創文章,作者:投稿專員,如若轉載,請註明出處:https://www.506064.com/zh-hant/n/255699.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
投稿專員的頭像投稿專員
上一篇 2024-12-15 12:28
下一篇 2024-12-15 12:30

相關推薦

發表回復

登錄後才能評論