智能語(yǔ)音控制器
一、 簡(jiǎn)述
智能語(yǔ)音控制器是一個(gè)配合中控使用的離線語(yǔ)音終端,基于MIPS芯片,運(yùn)行Linux系統(tǒng),支持單麥/雙麥遠(yuǎn)講識(shí)別。運(yùn)行算法有:基于深度神經(jīng)網(wǎng)絡(luò)算法的本地語(yǔ)音識(shí)別、語(yǔ)音增強(qiáng)、語(yǔ)音降噪、聲源定位、波束成型、本地語(yǔ)音合成。在單麥版本的基礎(chǔ)上,增加了雙麥聲源定位(180度)、波束成型,利用麥克風(fēng)的空域?yàn)V波特性,通過對(duì)喚醒人的角度定位,形成定向拾音波束,并對(duì)波束以外的噪聲進(jìn)行抑制,以保證較高的錄音質(zhì)量,再將錄音數(shù)據(jù)做本地識(shí)別,真實(shí)復(fù)雜場(chǎng)景下的語(yǔ)音控制;在語(yǔ)音交互方面,智能語(yǔ)音控制器支持10M范圍內(nèi)遠(yuǎn)場(chǎng)語(yǔ)音喚醒+識(shí)別,在常見的各種噪音環(huán)境中,平均喚醒率超過95%,平均識(shí)別率超過95%,喚醒識(shí)別效果處于行業(yè)地位!
二、 語(yǔ)音識(shí)別軟件操作
支持串口或網(wǎng)絡(luò)通訊來動(dòng)態(tài)更新識(shí)別詞表,上位機(jī)編輯好的識(shí)別詞條可通過串口或者網(wǎng)絡(luò)傳輸給智能語(yǔ)音控制器,智能語(yǔ)音控制器存儲(chǔ)并更新到識(shí)別詞表中,重啟后就可以支持新編輯的指令識(shí)別和播放。通過《語(yǔ)音識(shí)別》軟件建立語(yǔ)音識(shí)別詞條文件,可以把要控制的識(shí)別命令詞保存到電腦上,還可以直接打印表格中的識(shí)別命令詞條,也可以把識(shí)別命令詞條導(dǎo)出為xls文件。開始運(yùn)行《語(yǔ)音識(shí)別》軟件時(shí),會(huì)默認(rèn)建立一個(gè)新的識(shí)別詞條文件,你可使用“新建”菜單,針對(duì)不同的項(xiàng)目建立多個(gè)識(shí)別詞條文件。
1) 在windows電腦上運(yùn)行《語(yǔ)音識(shí)別》軟件運(yùn)行時(shí)的初始界面如下圖:
2) 添加識(shí)別詞條:請(qǐng)按快捷鍵F1,或點(diǎn)擊工具欄 時(shí),下圖表格會(huì)新添一行,識(shí)別的內(nèi)容為你要說的語(yǔ)音命令;播放的內(nèi)容為識(shí)別后的播放聲音;命令編號(hào)為識(shí)別后的要控制中控的命令編號(hào),每添加一條后會(huì)自動(dòng)根據(jù)工具欄中的文件框添加一個(gè)編號(hào);識(shí)別閥值為空時(shí)使用的默認(rèn)的50閥值,降低識(shí)別閾值,可以提高識(shí)別率,但是誤報(bào)率會(huì)提高,一般使用默認(rèn)的就可以啦。如下圖:
|
|
|
|
|
3) 刪除識(shí)別詞條:按快捷鍵F2,或點(diǎn)擊工具欄 時(shí),會(huì)把你選中的那一行記錄刪掉,如果要全部清空命令識(shí)別詞列表可點(diǎn)菜單欄中【調(diào)試->刪除所有數(shù)據(jù)】,即可。
4) 語(yǔ)音識(shí)別設(shè)置:新建一個(gè)識(shí)別詞條文件時(shí),系統(tǒng)會(huì)有一個(gè)默認(rèn)的參數(shù),用戶可以根據(jù)自己的需求來重新更改。
5) 更新命令識(shí)別詞:點(diǎn)擊工具欄 時(shí),可以將識(shí)別命令詞和識(shí)別參數(shù)一起更新到語(yǔ)音控制器,更新后重新啟動(dòng)后才生效。
6) 設(shè)備設(shè)置:遠(yuǎn)端IP,為中控的IP;設(shè)備波特率是語(yǔ)音控制器的波特率。參數(shù)為單獨(dú)設(shè)置。
7) WIFI配置:語(yǔ)音控制器的WIFI要連接的WIFI名稱和密碼,參數(shù)為單獨(dú)設(shè)置且只能通過串口設(shè)置。
8) 更新命令識(shí)別詞或者設(shè)置時(shí),都要連機(jī),也就是連續(xù)按語(yǔ)音控制器上【SET】按鍵,連接成功后如圖:。
9) 通訊方式:可以選擇為網(wǎng)絡(luò)或者串口,可點(diǎn)菜單欄中【調(diào)試->通訊設(shè)置】,會(huì)彈出一個(gè)窗口如下圖:
注意,網(wǎng)絡(luò)方式,要先配置WIFI名稱和密碼;可以串口配置或者通過手機(jī)或者平板APP配置。
三、 語(yǔ)音控制器設(shè)備操作
1) 產(chǎn)品特點(diǎn)
Ø 采用高靈敏度數(shù)字麥克風(fēng)錄音,雙麥克風(fēng)陣列180°聲源定位,定向拾音波束,抑制環(huán)境噪音;
Ø 基于的 DNN 深度神經(jīng)網(wǎng)絡(luò)識(shí)別算法,在離線的狀態(tài)下支持本地普通話識(shí)別,識(shí)別指令可達(dá)萬(wàn)條;
Ø 本地語(yǔ)音合成;
Ø 消除設(shè)備播放的聲音,實(shí)現(xiàn)播放時(shí)可語(yǔ)音識(shí)別全雙工交互;
Ø 遠(yuǎn)場(chǎng)識(shí)別,遠(yuǎn)距離拾音,識(shí)別距離可達(dá)10米;
Ø 識(shí)別率高達(dá)95% ;
Ø 內(nèi)置系統(tǒng)識(shí)別詞條,例如:調(diào)大音量、調(diào)小音量、打開播放、關(guān)閉播放;切換到家庭模式、切換到會(huì)議模式、切換到近距離模式;
2) 前面板指示燈
Ø 1、電源指示燈;
Ø 2、網(wǎng)絡(luò)WIFI連接指示燈,連接路由器成功時(shí)才會(huì)亮,長(zhǎng)按【SET】按鍵時(shí)進(jìn)入配網(wǎng)狀態(tài),會(huì)一直閃爍;
Ø 3、連接中控指示燈,成功連接中控時(shí)燈才會(huì)亮;
Ø 4、喚醒指示燈,語(yǔ)音識(shí)別到喚醒詞燈會(huì)閃爍,喚醒時(shí)間到后,會(huì)熄滅;
Ø 5、聲音指示燈,只要檢測(cè)到有聲音時(shí)才會(huì)亮;
3) 后板接口說明
Ø 1、電源線接口,采用的是常用的USB -Type-C;
Ø 2、電源開關(guān),拔向ON時(shí)打開設(shè)備,拔向OFF時(shí)關(guān)閉設(shè)備;
Ø 3、RS232接口,采用的是3.81mm的3P鳳凰座;
Ø 4、聲音輸出接口,采用的是3.5mm的耳機(jī)座,可直接連接音響設(shè)備;
Ø 5、設(shè)置按鍵,長(zhǎng)按時(shí)進(jìn)入配網(wǎng)狀態(tài),連按3次以上與上位機(jī)通訊;