科大訊飛攜手達實智能，多模語音增強技術助力深圳12號線升級智慧交通體驗

2022-12-30 08:57:04 科大訊飛 點擊量：35454

　　【智慧城市網品牌專欄】近日，深圳地鐵12號線正式開通！此次項目中，科大訊飛攜手達實智能與深圳地鐵深度合作，打造了一系列智慧化的應用場景。

　　多模語音增強技術

　　率先用于深圳地鐵語音購票

　　該項目智慧客服中心采用AI數字客服為乘客提供語音交互服務，可讓乘客通過語音交互自助完成信息查詢、車票購買。在過去因為地鐵站點太多，乘客在售票機買票時很難快速找到要去的站點，而這對于不太會操作設備的老年人來說更是難上加難，一堆站點看花了眼。這些問題在加上語音購票的功能后迎刃而解，乘客只要說出想去哪里即可買票，大幅提升了乘客的購票體驗。

深圳12號線智慧客服終端

　　在地鐵站人聲嘈雜的場景下，使用語音進行購票理論上交互體驗并不好。以往常規方案受周邊雜聲影響較大，語音識別準確率相對較低，經常出現“答非所問”的情況。而在深圳地鐵12號線智能售票機及智慧客服終端上，率先采用了科大訊飛最新發布的多模語音增強技術，該技術通過人臉唇形等多模信息的使用，能有效地抑制地鐵環境噪音和后排說話人聲，讓嘈雜環境下機器的語音識別準確率大大提高，避免了語音交互時被旁邊人說話帶“跑偏”的尷尬，有效提升了嘈雜環境下的語音交互體驗。在科大訊飛多模態語音識別技術的加持下，12號線地鐵購票的體驗提升顯著，受到了很多乘客的好評。

　　從單模態到多模態

　　科大訊飛持續向新

　　人類通過眼、耳、鼻、舌等多個器官同時感知世界，而機器若想更自然地與人類交流，當然也需要通過多模態感知。多模語音增強技術，作為科大訊飛新推出的解決公共場景下語音交互難題的最新技術，打破以往純聲學降噪的方式，將機器視覺也融合到環境降噪技術中，使其能夠在多人同時說話的嘈雜場景中，將其他人聲和環境噪聲進行過濾，準確地把目標說話人的聲音分離出來進行識別。通過這種單模到多模的技術創新，使得在同方向有人說話干擾的場景下，多模語音增強技術的識別準確率對比傳統語音識別技術相對提升70%以上。它不僅讓設備能聽見，還能看見你說話，就像武俠小說中的“讀唇術”一樣，知道你在說什么。

　　訊飛AIUI開放平臺

　　致力AI技術落地更多場景

　　事實上，地鐵智能售票機及智慧客服終端僅是科大訊飛AIUI開放平臺支持合作伙伴打造的項目之一，平臺開放的多模語音增強技術在醫療自助機、銀行柜員機、取款機以及商用服務機器人等項目上也有相似的應用場景。在人聲嘈雜的公共場所，通過多模態語音技術均可有效降低環境噪音的干擾，提高語音識別準確率，保障用戶的對話交互體驗。

　　截至目前，訊飛開放平臺已經開放542項AI能力和解決方案，聚集375萬開發者團隊，總應用數達158萬，是首批國家新一代人工智能開放創新平臺。未來AIUI作為訊飛人機交互的開放平臺，將通過更多AI技術賦能合作伙伴，在更多的場景落地多模態語音增強技術，為客戶創造價值，也為用戶帶來更多新的體驗。

聲明：凡來源標明“智慧城市網”的文章版權均為本站所有，如需轉載請務必注明出處，違者本網將追究相關法律責任；所有未標明來源為“智慧城市網”的轉載文章目的在于傳遞更多信息，均不代表本網立場及觀點，“智慧城市網”不對這些第三方內容或鏈接做任何保證或承擔任何責任；如涉及版權等問題，請在內容發表之日起一周內與本網聯系，否則視為放棄相關權利。

上一篇：超圖：構筑數字孿生城市底座精準引領酒泉智慧城市建設

下一篇：賦能東數西算，安恒信息助力國家信息中心編制《“數盾”技術架構研究》