你該開始python語音識別啦的簡單介紹

本文目錄一覽：

1、如何優雅的用Python玩轉語音聊天機器人
2、Python語音識別,調用的是哪個客戶端接口函數
3、如何用python調用百度語音識別

如何優雅的用Python玩轉語音聊天機器人

所需硬件：

樹莓派B+

人體紅外線感應模塊

內置麥克風攝像頭(實測樹莓派免驅淘寶鏈接）

申請API：

百度語音api

圖靈api

語音聊天機器人實現原理：當有人來到跟前時–》觸發聊天功能，開始以每2s檢測錄製語音–》通過百度語音api合成文字–》傳遞給圖靈api返回回答信息–》通過百度語音合成播放

【人體感應識別部分Python代碼renti.py】

123456789101112131415161718192021222324252627282930313233

#/usr/bin/python#coding:utf-8import RPi.GPIO as GPIOimport timeimport osimport signalimport atexitGPIO.setmode(GPIO.BCM) GPIO_PIR = 14 GPIO.setup(GPIO_PIR,GPIO.IN) # Echojing = 0dong = 0 sum = 0sum1 = 0oldren = 0sleep = 0def ganying(): i = 0 ok = 0 error = 0 while i 10: if GPIO.input(GPIO_PIR) == 1 : ok = ok + 1 if GPIO.input(GPIO_PIR) == 0 : error = error + 1 time.sleep(0.01) i = i + 1 ren = ok/(error+1) return ren

GPIO_PIR = 14

為紅外線檢測模塊與樹莓派的針腳，腳本函數返回0表示無人，0 為有人

【Python語音識別聊天部分robot.py】

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112

#/usr/bin/python# -*- coding:utf-8 -*-import sysreload(sys)sys.setdefaultencoding( “utf-8″ )import urllibimport urllib2import jsonimport uuidimport base64import osimport timefrom renti import * #獲取百度tokenappid=7647466apikey=”百度API”secretkey=”百度API” baidu_url=”h.com/oauth/2.0/token?grant_type=client_credentialsclient_id=” + apikey + “client_secret=” + secretkey; y_post=urllib2.urlopen(baidu_url)y_read=y_post.read()y_token=json.loads(y_read)[‘access_token’]#print y_read#print y_token #——————function————- def luyin(): os.system(‘arecord -D plughw:1,0 -c 1 -d 2 1.wav -r 8000 -f S16_LE 2/dev/null’) def fanyi():

#—————語音識別部分 mac_address=”haogeoyes” with open(“1.wav”,’rb’) as f: s_file = f.read() speech_base64=base64.b64encode(s_file).decode(‘utf-8’) speech_length=len(s_file) data_dict = {‘format’:’wav’, ‘rate’:8000, ‘channel’:1, ‘cuid’:mac_address, ‘token’:y_token, ‘lan’:’zh’, ‘speech’:speech_base64, ‘len’:speech_length} json_data = json.dumps(data_dict).encode(‘utf-8’) json_length = len(json_data) asr_server = ‘m/server_api’ request = urllib2.Request(url=asr_server) request.add_header(“Content-Type”, “application/json”) request.add_header(“Content-Length”, json_length) fs = urllib2.urlopen(url=request, data=json_data) result_str = fs.read().decode(‘utf-8’) json_resp = json.loads(result_str) if json_resp.has_key(‘result’): out_txt=json_resp[‘result’][0] else: out_txt=”Null” return out_txt def tuling(b): f=urllib.urlopen(“23.com/openapi/api?key=”此處為圖靈API”info=%s” % b) f=json.loads(f.read())[‘text’] return f def hecheng(text,y_token): #text=”你好我是機器人牛牛很高興能夠認識你” geturl=”u.com/text2audio?tex=”+text+”lan=zhper=1pit=9spd=6cuid=CCyo6UGf16ggKZGwGpQYL9Gxctp=1tok=”+y_token return os.system(‘omxplayer “%s” /dev/null 21 ‘%(geturl)) #return os.system(‘omxplayer “%s” /dev/null 21 ‘%(geturl)) def nowtime(): return time.strftime(‘%Y-%m-%d %H:%M:%S ‘) #—————main—————–num=0 #num用來判斷是第一次說話，還是在對話過程中first=1 #判斷是不是第一說話當1000次沒有人動認為是第一次while True: if ganying()!=0: run=open(‘run.log’,’a’) if first==0: hecheng(“你好,我是牛牛機器人,你可以和我聊天,不過說話的時候你必須靠近話筒近一點,”,y_token) hecheng(“說點什麼吧,2秒鐘內說完哦.”,y_token) first=1 #為1一段時間就不執行 num=0 #從新計數 #print ganying() run.write(nowtime()+”說點神馬吧………..”+’\n’) print nowtime()+”說點神馬吧……….” luyin() #開始錄音 out=fanyi().encode(“utf-8”) #翻譯文字 run.write(nowtime()+”我說:”+out+’\n’) print nowtime()+”我說:”+out if out == “Null”: text=”沒有聽清楚你說什麼” os.system(‘omxplayer “shenme.wav” /dev/null 21 ‘) else: text=tuling(out) hecheng(text,y_token) print nowtime()+”牛牛:”+text run.write(nowtime()+”牛牛:”+text+’\n’) run.close() else: #print ganying() #調試查看是否為0有人沒人 #print num num=num+1 #num長時間增大說明沒有人在旁邊 if num 1000: first=0 #0表示第一次說話

萬事俱備運行nohup python robot.py 哈哈就可以脫離屏幕開始愉快的語音聊天啦

下面看看聊天的日誌記錄吧

後續更新。。。。。。Python如何用語音優雅的控制小車

Python語音識別,調用的是哪個客戶端接口函數

調用騰訊雲的語音識別(一句話識別)接口-Python版。

安裝語音識別，語音識別器編碼，處理Ubuntu服務器，處理WSL。

要運行我們代碼的語音識別庫，我們首先需要安裝語音識別，然後還必須安裝PyAudio。首先，我們從主包開始：sudo pip3 install SpeechRecognition安裝應該遵循完全相同的格式，但我似乎缺少了讓它正常工作的軟件包，試圖安裝PyAudio會出錯。這些軟件包應該刪除該錯誤。那時我不需要更新apt，但先更新它並不壞處。sudo apt-get install libasound-dev portaudio19-dev libportaudio2libportaudiocpp0有了它，您應該可以安裝PyAudio：sudo pip3 install PyAudio語音識別器編碼。

運行WSL（Linux版Windows子系統）的Windows機器。它也使用了Ubuntu 16.04，所以安裝過程是一樣的。不過說到使用麥克風，WSL並不那麼簡單。為了通過Ubuntu終端應用程序控制麥克風，需要安裝PulseAudio。

如何用python調用百度語音識別

1、首先需要打開百度AI語音系統，開始編寫代碼，如圖所示，編寫好回車。

2、然後接下來再試一下16k.pcm的音頻，開始編寫成功回車，如圖所示的編寫。

3、最後，查看音頻c的屬性，可以看到音頻持續28秒，這樣就是用python調用百度語音識別成功解決問題。

原創文章，作者：UYNW，如若轉載，請註明出處：https://www.506064.com/zh-hant/n/135659.html

你該開始python語音識別啦的簡單介紹

本文目錄一覽：

如何優雅的用Python玩轉語音聊天機器人

Python語音識別,調用的是哪個客戶端接口函數

如何用python調用百度語音識別

相關推薦

發表回復