智能語音識別系統

智能語音識別技術作為現代會議系統的發展新方向,賦予了會議產品更智能的人機交互體驗。傳統會議的發言交流通常僅通過瞬時的視頻與聲音進行傳達,與會者的注意力需要時刻保持高度集中,尤其是在信息量較多的各種重要會議中,與會者難以同時做到一邊聽,一邊記錄,一邊分析整理發言內容,需要對多語種發言進行現場翻譯的會議更是難以高效進行。同時,用戶會后的文件處理、會議紀要及特定用戶的法定程序也要求必須以文字的形式呈現。

GONSIN公信智能語音識別系統可將每個座席的發言語音實時轉寫成對應的有序的文字內容;系統具備角色分離功能,確保轉寫后的文字與各座席的語音一一對應。

選用在線語音識別及翻譯方案,可對不同語種(有指定的支持語種范圍)的發言進行實時在線翻譯,譯文可設置為指定的語種。語音識別轉寫的文字及在線翻譯生成的譯文能實時同步顯示在會場內的大屏顯示系統和GONSIN公信無紙化會議系統屏幕上,同時系統將記錄發言語音,自動生成會議紀要。

該系統適用于多種應用場景,實現包括會議紀要、實時演講字幕、訪談錄音轉寫、跨語種商務洽談、法庭庭審實時記錄等。



 


公信智能會議管理軟件-語音識別模塊 V7.1.0
基本功能
? 支持公有云、專有云語音服務器選擇對接。可滿足不同的服務器部署方式,靈活適用于多種應用場景
? 支持ASR服務器關機管理功能,支持ASR服務器、討論系統連接、搜索,以及話筒角色自定義功能,并支持公信各系列討論系統無縫對接,實現會議管理、角色分離、與自動識別
? 支持人員設備管理,包括設備搜索、顯示單元號信息、IP地址信息、人員姓名設置;支持會議信息編輯,包括新建會議名稱、定義會議時間、地點、及會議內容編輯等
? 支持對多個話筒角色同時識別,支持防串音功能,可以有效避免多個話筒同時識別時的相互串音;支持話筒狀態提示,可實時顯示話筒開啟與關閉狀態
? 支持語言模型學習功能。支持人名、地名等常用詞導入,對語言模型進行學習
? 支持自動識別與會人員的角色,自動識別與會人員的語音并轉寫成文字。軟件支持翻譯成其他所需要的語音(軟件功能根據引擎能力有所區別)
? 支持智能化語義理解,可自動理解與會人員的語義,并根據語義進行自動斷句與分段。支持對連續數字阿拉伯格式自動轉換,支持自動識別手機號碼、身份證等連續數字轉換成阿拉伯格式
? 支持會議文字編輯與矯正功能。對不同角色語音生成生成單獨的錄音文件,或合并各角色的文字記錄及錄音錄音。語音與文字記錄可同步回放并對照顯示,實現文檔校正
■ 支持會議記錄輸出功能。支持文字合并,生成會議紀要,并導出文本
■ 支持內容檢索功能,支持文字內容搜索。可對關鍵字進行搜索,快速定位相應內容的位置,大大提高了內容檢索的效率
? 支持文字分屏輸出功能。轉寫文字實時顯示在操作電腦主屏,支持擴展分屏輸出,實時顯示語音識別的文字內容。支持屏幕定制功能,屏幕分辨率自適應,支持文字字體、大小設置,提供優質的分屏文字顯示服務
? 支持錄音文件識別,通過錄音文件導入,自動將錄音文件內容轉換成文字內容;支持mp3、wav等文件格式
? 支持選擇音頻輸入設備,可以連接電腦的音頻輸入設備,實時音頻輸入轉錄文字
■ 支持電腦當前播放聲音內容識別,并自動轉換成文字
 ■ 支持更多自定義功能:軟件支持中、英文切換,以及其他自定義語言;支持二次開發,可根據項目需求開放接口協議或定制開發



 

輕(qing)量級智能(neng)語音識別服(fu)務器
GX-AS201/GX-AS202/GX-AS205/GX-AS208

輕(qing)量級智(zhi)能(neng)語識別服(fu)務器是(shi)針(zhen)對中小(xiao)型(xing)會(hui)(hui)(hui)議(yi)應(ying)用(yong)場(chang)景的(de)智(zhi)能(neng)語音識別計算產(chan)品,內置輕(qing)量級的(de)智(zhi)能(neng)語音識別引擎,具備轉(zhuan)寫 速度快、識別率高(gao)、易(yi)部署,穩定(ding)(ding)性(xing)強等特點(dian)。可(ke)滿足(zu)需(xu)要語音轉(zhuan)寫和(he)記錄的(de)會(hui)(hui)(hui)議(yi)場(chang)景,實現(xian)有效的(de)會(hui)(hui)(hui)議(yi)留(liu)痕。同時服(fu)務器體積 小(xiao),系(xi)統(tong)對接簡單,使(shi)用(yong)便(bian)捷,方便(bian)攜(xie)帶,可(ke)滿足(zu)針(zhen)對不(bu)同會(hui)(hui)(hui)議(yi)場(chang)所的(de)快速設(she)備切換和(he)系(xi)統(tong)搭建,實現(xian)有效的(de)設(she)備共享。適用(yong)于固 定(ding)(ding)會(hui)(hui)(hui)場(chang)、臨時會(hui)(hui)(hui)場(chang)及租賃性(xing)質的(de)會(hui)(hui)(hui)議(yi)場(chang)景。

基本功(gong)能
內嵌ASR智能語音(yin)識(shi)別(bie)引擎
不(bu)同型號的(de)語音識別服務器可實現不(bu)同數量(liang)的(de)語音轉寫(xie)能力(li)
GX-AS201:支(zhi)持1路(lu)語音識別能力
GX-AS202:支(zhi)持2路語音識別能力
GX-AS205:支持5路(lu)語音(yin)識別能力
GX-AS208:支持(chi)8路語(yu)音識別能力
業界領先的單(dan)遍大規模語言模型解(jie)碼(ma)技術(shu)
? 標(biao)準引擎(qing)支持(chi)普(pu)通話(hua)及普(pu)通話(hua)體系的方言及口音識別
? 支持外語(yu)(需定制):英(ying)語(yu)、西班牙語(yu)、阿拉伯語(yu)、俄語(yu)、法語(yu)等
? 可(ke)定制(zhi)金融、政法、醫療、教育等用行業(ye)識別(bie)引擎
配合GONSIN會議管理系統,可實現各參會角色的語音分離識別(bie),滿足同一(yi)場會議內多個話筒同時打開的語音(yin)識別(bie)需求(qiu)
 

智能語音識別服務器 GX-AS301
內嵌ASR智(zhi)能語音識別引擎V3.0以及語音轉寫模塊授(shou)權V1.0



基本功能
安裝(zhuang)ASR智(zhi)能語音識別(bie)引(yin)擎V3.0軟(ruan)件
局域網內(會議中心/多會議室集群(qun))多個會議室語音識別。
支(zhi)(zhi)持(chi)公信全(quan)系列討論(lun)系統(tong)產品,同一時(shi)間最大支(zhi)(zhi)持(chi)50路語音轉寫(根據語音轉寫模塊的授權數)
最大支持50路語音識別并發授權(quan)
業(ye)界(jie)領先的單遍(bian)大規模(mo)語(yu)言模(mo)型解(jie)碼技(ji)術(shu)
? 標(biao)準引擎支持普通話及普通話體系(xi)的(de)方言及口音(yin)識(shi)別
? 支(zhi)持外語(需定制):英語、西班牙語、阿(a)拉(la)伯(bo)語、俄語、法語等
? 可(ke)定制金融(rong)、政(zheng)法(fa)、醫療、教育等用行業識別(bie)引擎(qing)
高效率(lv)CTC模(mo)型(xing),通過選配授權,最大支持50路語音(yin)并發識(shi)別
支持(chi)會(hui)議中心多會(hui)議室(shi)局域網集中部(bu)署(shu),滿足多會(hui)議室(shi)并行語音轉寫
? 配合GONSIN管(guan)理(li)系統,可(ke)實(shi)現各角色(se)分(fen)離識別
? 支持在會議(yi)中心集(ji)群(qun)部署或本(ben)地會議(yi)室部署


音頻擴展器 DCS-AE04
基本功能
■ 支持設備級聯,最大可級聯至32通道 
■ 支持DA/AD兩種工作模式,可根據不同的應用場景進行設置:
 ■ DA模式:可將數字音頻轉成模擬音頻,實現系統擴展
 ■ AD模式:可將模擬音頻轉換成數字音頻,實現數字傳輸



 

ASR智能語音識別引擎V3.1/ V3.2

? 采用業界領先的在線語音識別技術,通過云端部署,為本地語音提供語音識別服務。低延時,高識別準確率,準確率可達到99%以上
■ 引擎采用套餐付費模式,有效降低語音識別的投入成本和建設門檻。用戶可以根據實際語音識別的時長需求,購買合適時長的套餐方案(請及時購買套餐服務,以確保引擎的正常使用)
? 支持角色分離識別:可根據不同角色選擇不同的原語種和翻譯語種,實現多語種同時識別,轉寫成為相應的文字,并翻譯成翻譯語種的文字信息
? 支持國際上多個主流語種,包含中文、英語、法語、俄語、阿拉伯語、西班牙語等,滿足國際大多數語言使用需求
? 搭配公信智能語音識別字幕顯示軟件,可同時顯示原文和翻譯文字,或設置單獨顯示原文/譯文,為跨語種商務洽談、跨語種視頻會議提供字幕服務

ASR智能語音識別引擎V3.0
■ 采用智能化語言識別模型技術,基于AI智能技術實現語音識別
? 標準引擎支持普通話語系識別,支持普通話及普通話體系的方言及口音識別
? 支持多種國外語言識別。支持定制英語、西班牙語、阿拉伯語、俄語、法語等國外語言識別
? 支持應用領域語系識別。支持教育、司法、醫療、會議演講、新聞媒體、娛樂視頻、智能家居、社交、汽車等應用領域及應用場景識別