【
智慧城市網 品牌專欄】近日,深圳地鐵12號線正式開通!此次項目中,科大訊飛攜手達實智能與深圳地鐵深度合作,打造了一系列智慧化的應用場景。
多模語音增強技術
率先用于深圳地鐵語音購票
該項目智慧客服中心采用AI數字客服為乘客提供語音交互服務,可讓乘客通過語音交互自助完成信息查詢、車票購買。在過去因為地鐵站點太多,乘客在售票機買票時很難快速找到要去的站點,而這對于不太會操作設備的老年人來說更是難上加難,一堆站點看花了眼。這些問題在加上語音購票的功能后迎刃而解,乘客只要說出想去哪里即可買票,大幅提升了乘客的購票體驗。
深圳12號線智慧客服終端
在地鐵站人聲嘈雜的場景下,使用語音進行購票理論上交互體驗并不好。以往常規方案受周邊雜聲影響較大,語音識別準確率相對較低,經常出現“答非所問”的情況。而在深圳地鐵12號線智能售票機及智慧客服終端上,率先采用了科大訊飛最新發布的多模語音增強技術,該技術通過人臉唇形等多模信息的使用,能有效地抑制地鐵環境噪音和后排說話人聲,讓嘈雜環境下機器的語音識別準確率大大提高,避免了語音交互時被旁邊人說話帶“跑偏”的尷尬,有效提升了嘈雜環境下的語音交互體驗。在科大訊飛多模態語音識別技術的加持下,12號線地鐵購票的體驗提升顯著,受到了很多乘客的好評。
從單模態到多模態
科大訊飛持續向新
人類通過眼、耳、鼻、舌等多個器官同時感知世界,而機器若想更自然地與人類交流,當然也需要通過多模態感知。多模語音增強技術,作為科大訊飛新推出的解決公共場景下語音交互難題的最新技術,打破以往純聲學降噪的方式,將機器視覺也融合到環境降噪技術中,使其能夠在多人同時說話的嘈雜場景中,將其他人聲和環境噪聲進行過濾,準確地把目標說話人的聲音分離出來進行識別。通過這種單模到多模的技術創新,使得在同方向有人說話干擾的場景下,多模語音增強技術的識別準確率對比傳統語音識別技術相對提升70%以上。它不僅讓設備能聽見,還能看見你說話,就像武俠小說中的“讀唇術”一樣,知道你在說什么。
訊飛AIUI開放平臺
致力AI技術落地更多場景
事實上,地鐵智能售票機及智慧客服終端僅是科大訊飛AIUI開放平臺支持合作伙伴打造的項目之一,平臺開放的多模語音增強技術在醫療自助機、銀行柜員機、取款機以及商用服務機器人等項目上也有相似的應用場景。在人聲嘈雜的公共場所,通過多模態語音技術均可有效降低環境噪音的干擾,提高語音識別準確率,保障用戶的對話交互體驗。
截至目前,訊飛開放平臺已經開放542項AI能力和解決方案,聚集375萬開發者團隊,總應用數達158萬,是首批國家新一代人工智能開放創新平臺。未來AIUI作為訊飛人機交互的開放平臺,將通過更多AI技術賦能合作伙伴,在更多的場景落地多模態語音增強技術,為客戶創造價值,也為用戶帶來更多新的體驗。
我要評論
所有評論僅代表網友意見,與本站立場無關。