WTK6900F-B04模塊是用于物聯(lián)網(wǎng)交互及控制領(lǐng)域的智能MCU模塊。該智能模塊基于深度神經(jīng)網(wǎng)絡(luò)(DNN-HMM)語音識別技術(shù),實現(xiàn)了高識別率、高實時性、本地和云端結(jié)合、高度一體化的語音識別及處理功能;可以實現(xiàn)語義識別等特定智能語音交互效果。同時該模塊具備常規(guī)MCU的控制及計算處理能力,可以實現(xiàn)各類需要通信及控制的應(yīng)用。
該模塊從語音輸入開始,語音檢測,語音特征提取及DNN運算采用硬件架構(gòu)設(shè)計,軟件主要進(jìn)行語音解碼和語音播報。該模塊具有較高的運算性能及低成本、低功耗、小尺寸等優(yōu)勢。在應(yīng)用方面,該模塊可以支持本地語音檢測、喚醒,以及三百條離線命令詞條的識別,模塊支持回音消除功能,支持雙麥功能。模塊可通過UART將命令推送到設(shè)備原有的上位機(jī),實現(xiàn)簡單的語音交互接口。
離線命令詞自學(xué)習(xí)是指在非聯(lián)網(wǎng)狀態(tài),用戶通過語音對話的方式,更改默認(rèn)的命令詞;后續(xù)用戶可以通過改設(shè)定的特定命令詞進(jìn)行語音識別。該種更改方式滿足終端用戶的個性化自定義的需求,可以給客戶帶來更好的用戶體驗。離線命令詞自學(xué)習(xí)可存儲模板數(shù)量,最多為15個。
◆ ARM Cortex-M4F,運行頻率200MHz;
◆ 內(nèi)置 512KB SRAM;
◆ 內(nèi)置 ASR 硬件加速引擎;
◆ 語音特征提取引擎(FE);
◆ 支持本地語音識別解碼;
◆ 支持低功耗語音喚醒;
◆ 支持回音消除功能;
◆ 內(nèi)置1路UART接口;
◆ 內(nèi)置2通道16bit SAR ADC;
◆ 支持外接晶體和有源晶振;
◆ 內(nèi)置 PLL;
◆ 內(nèi)置上電及欠壓復(fù)位電路;
◆ IO 供電:3V,內(nèi)核供電:1.2V;
◆ 支持睡眠待機(jī)模式;
◆ 內(nèi)置獨立看門狗和窗口看門狗;
◆ 支持超時產(chǎn)生中斷或復(fù)位;
◆ 語音活動檢測引擎(VAD),支持 VAD 參數(shù)可調(diào);
