云創(chuàng)智能會(huì)議轉(zhuǎn)寫系統(tǒng)解決方案_第1頁
云創(chuàng)智能會(huì)議轉(zhuǎn)寫系統(tǒng)解決方案_第2頁
云創(chuàng)智能會(huì)議轉(zhuǎn)寫系統(tǒng)解決方案_第3頁
云創(chuàng)智能會(huì)議轉(zhuǎn)寫系統(tǒng)解決方案_第4頁
云創(chuàng)智能會(huì)議轉(zhuǎn)寫系統(tǒng)解決方案_第5頁
已閱讀5頁,還剩10頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、智能會(huì)議轉(zhuǎn)寫系統(tǒng)解決方案南京日創(chuàng)大數(shù)據(jù)歸技股份有眼O司Nanjing Innovative Data Technologies Inc.2019年3月目錄 TOC o 1-5 h z HYPERLINK l bookmark4 o Current Document I需求背景3 HYPERLINK l bookmark7 o Current Document 2建設(shè)目標(biāo)3 HYPERLINK l bookmark10 o Current Document 4技術(shù)方案3 HYPERLINK l bookmark13 o Current Document 4系統(tǒng)拓?fù)鋱D45語音識(shí)別技術(shù)9仆系統(tǒng)功能1

2、2。I現(xiàn)場轉(zhuǎn)錄、實(shí)時(shí)投屏12 HYPERLINK l bookmark29 o Current Document 音頻轉(zhuǎn)寫13M -同步校正13-個(gè)人詞庫14文本訓(xùn)練14 HYPERLINK l bookmark53 o Current Document 語音輸入,實(shí)時(shí)滾屏播放15?系統(tǒng)價(jià)值167 I提升會(huì)議效率16二提升工作效率加快處理流程167;提供智能分析結(jié)果16提供后臺(tái)管理功能16 HYPERLINK l bookmark56 o Current Document :提供智能化擴(kuò)展功能161需求背景在各類會(huì)議中,需要形成文字版會(huì)議記錄,便于事后追溯或跟蹤?,F(xiàn)有的人 工聽寫方式受限于記錄

3、員的業(yè)務(wù)熟練程度和打字速度,記錄效率較低。在會(huì)議中 應(yīng)用智能語音識(shí)別技術(shù),能夠?qū)⒄Z音實(shí)時(shí)轉(zhuǎn)成文字,會(huì)議結(jié)束即可成稿,可極大 降低對記錄員業(yè)務(wù)素質(zhì)的要求,減輕記錄員工作強(qiáng)度。會(huì)議過程中,會(huì)產(chǎn)生大量的文字及媒體文件,通過無紙化辦公系統(tǒng),可大量 的節(jié)省會(huì)議資料的成本,使得會(huì)議的進(jìn)行更加有效率。2建設(shè)目標(biāo)按照“智慧、創(chuàng)新”的總體思路,充分運(yùn)用云計(jì)算、大數(shù)據(jù)等智能化技術(shù), 圍繞智能語音識(shí)別技術(shù)與會(huì)議場景的深度融合,將會(huì)議的全過程進(jìn)行語音轉(zhuǎn)寫, 對所得的電子記錄數(shù)據(jù)進(jìn)行有效的管理、分析、利用。全面推進(jìn)會(huì)議向智能化方 向發(fā)展?!爸腔邸保簩⒅腔刍l(fā)展理念與會(huì)議場景的實(shí)際需求相結(jié)合,通過智能語音 識(shí)別技術(shù)替代會(huì)

4、議記錄人工錄入,創(chuàng)新的將智能語音識(shí)別技術(shù)與會(huì)議場景進(jìn)行深 度融合,提高工作效率,解放速記員,將會(huì)議記錄從“手動(dòng)錄入”向“自動(dòng)錄入” 進(jìn)行升級(jí)?!皠?chuàng)新”:緊密圍繞會(huì)議業(yè)務(wù)需求,積極探索基于大數(shù)據(jù)、人工智能等新技 術(shù)的應(yīng)用,實(shí)現(xiàn)信息化建設(shè)“技術(shù)創(chuàng)新”。全過程數(shù)字化:通過會(huì)場講話實(shí)時(shí)轉(zhuǎn)寫或會(huì)議錄音離線轉(zhuǎn)寫成電子文本化 文件,實(shí)現(xiàn)會(huì)議記錄全過程的數(shù)字化,確保會(huì)議記錄的真實(shí)、完整。3技術(shù)方案云創(chuàng)智錄系統(tǒng)基于內(nèi)部專網(wǎng)上構(gòu)建智能語音識(shí)別平臺(tái),提供語音識(shí)別基礎(chǔ)支 撐服務(wù),并在此基礎(chǔ)上構(gòu)建云創(chuàng)智錄系統(tǒng)。通過針對不同地區(qū)、不同種類會(huì)議的 定制化語音識(shí)別模型和自定義關(guān)鍵詞識(shí)別優(yōu)化工具,可以有效提升對每次會(huì)議的 語音

5、識(shí)別準(zhǔn)確率,為提升會(huì)議效率和工作效率提供強(qiáng)有力的技術(shù)支撐。系統(tǒng)采用私有云的形式進(jìn)行部署,與外網(wǎng)實(shí)現(xiàn)物理隔離,保障數(shù)據(jù)的安全性。 能實(shí)現(xiàn)會(huì)議中參會(huì)人員語錄的實(shí)時(shí)自動(dòng)分角色語音轉(zhuǎn)寫,并將轉(zhuǎn)寫結(jié)果實(shí)時(shí)展現(xiàn) 在云創(chuàng)智錄系統(tǒng)軟件的管理界面上,以便于書記員同步查看和用詞條修正的操作 來校正轉(zhuǎn)寫出現(xiàn)錯(cuò)誤的內(nèi)容。會(huì)議錄音在會(huì)議結(jié)束后自動(dòng)保存在系統(tǒng)里,書記員也可以通過回聽歷史會(huì)議的錄音記錄來校對轉(zhuǎn)寫結(jié)果。4系統(tǒng)拓?fù)鋱D網(wǎng)絡(luò)版會(huì)議轉(zhuǎn)錄系統(tǒng)由服務(wù)器和會(huì)議室音頻采集設(shè)備組成,能夠支持多個(gè)會(huì) 議室同時(shí)接入(支持?jǐn)U容)。每個(gè)會(huì)議室需部署會(huì)議麥克風(fēng)、音頻處理器和高清 音視頻會(huì)議主機(jī),例如:8路音頻處理器可以接入8個(gè)鵝頸式會(huì)議

6、麥克風(fēng)。會(huì)議 秘書通過秘書電腦訪問智能會(huì)議業(yè)務(wù)系統(tǒng),控制會(huì)議的實(shí)時(shí)轉(zhuǎn)寫。麥克風(fēng)到音頻 處理器之間傳輸距離支持300m以內(nèi),系統(tǒng)拓?fù)鋱D如下圖所示:千兆皿曲書員電腦上述硬件產(chǎn)品相關(guān)描述與介紹如下:產(chǎn)品名稱產(chǎn)品描述音頻處理器功能描述:根據(jù)實(shí)際情況,提供8進(jìn)8出型號(hào),采用平衡式話 筒線路輸入,以及裸線接口端子。主要為現(xiàn)場麥克風(fēng)等 拾音設(shè)備供電,以及提供混音功能,將模擬音頻信號(hào)混 音輸出;設(shè)備參數(shù):無需光盤,設(shè)備自帶安裝軟件;120db的A/D與D/A轉(zhuǎn)換,最高可達(dá)96kHz/48K米 樣率高速DSP處理芯片Ti 450MHz FLOPS DSP處理內(nèi)核 輸入源:輸入方式可切換平衡話筒或線路,采用鳳凰插

7、 接口;量化位數(shù):24bit;采樣率:48K幻像供電:DC 48V ;頻率響應(yīng):2020KHz總諧波失真+噪聲:V0.002% 1KHz ,4dBu數(shù)/模動(dòng)態(tài)范圍(A-計(jì)權(quán)):120dB模/數(shù)動(dòng)態(tài)范圍(A-計(jì)權(quán)):120dB輸入阻抗(平衡式):20KQ;最大輸出阻抗(平衡式):100Q;工作溫度:0-40C;工作電源:AC110V-220V,50Hz/60Hz;機(jī)箱尺寸:482*258*45(mm);電源功耗:70W運(yùn)輸重量:4Kg尺寸(寬 x 深 x 高):483*250*44.5(mm)通道隔離度:1kHz, 100dB輸入共模抑制,60Hz, 80dB等效輸入噪聲EIN (20-20kH

8、z, A計(jì)權(quán)).WT31dBU最大輸出電平:+24dBu ,平衡最大輸入電平:+24dBu ,平衡模擬輸入至模擬輸出系統(tǒng)延時(shí):3ms底噪(A-計(jì)權(quán)):-90dBu高清音視頻會(huì)議主機(jī)功能描述:在會(huì)議場景中,主要接入上游輸入的音頻模擬信號(hào), 進(jìn)行模/數(shù)轉(zhuǎn)換,將數(shù)字音頻信號(hào)輸出給智能語音識(shí)別服 務(wù)器供智能轉(zhuǎn)寫。設(shè)備參數(shù):設(shè)備采用標(biāo)準(zhǔn)機(jī)柜式結(jié)構(gòu)設(shè)計(jì),主機(jī)厚度不得超過 1U。設(shè)備內(nèi)置3塊VFD信息顯示屏,實(shí)時(shí)顯示光驅(qū)及硬 盤刻錄狀態(tài)。設(shè)備支持4路高清視頻輸入,支持SDI或網(wǎng)絡(luò)信號(hào) 輸入,具有4路SDI接口,同時(shí)具有VGA、HDMI輸入接 口;具有HDMI和VGA同時(shí)輸出接口,分辨率均達(dá)到 1920*10

9、80,HDMI與VGA可以同時(shí)輸出相同合成畫面, 也可同時(shí)輸出不同合成畫面。設(shè)備可支持各通道單畫面、畫中畫、三畫面、四畫 面顯示模式。設(shè)備視頻編碼采用H.264, High Profile的視頻編 碼標(biāo)準(zhǔn)。單畫面分辨率大于704像素X576像素,傳輸碼流 大于等于512Kbit/s,硬盤存儲(chǔ)視頻幀率大于等于 25fps,應(yīng)能實(shí)現(xiàn)訊問過程的網(wǎng)絡(luò)直播、音文交互、訊問 現(xiàn)場場景的選擇。設(shè)備含有2路音頻輸入接口,音頻編碼采用AAC采 樣編碼,同時(shí)含有1路以上(含1路)音頻輸出接口。設(shè)備脫離PC平臺(tái),采用嵌入式操作系統(tǒng),集光盤刻 錄、視頻顯示、硬盤備份、網(wǎng)絡(luò)傳輸?shù)裙δ苡谝惑w,安 全穩(wěn)定、簡單實(shí)用。設(shè)備內(nèi)

10、置雙光驅(qū),將錄播現(xiàn)場的音像信息,實(shí)時(shí)同 步直接刻錄在光盤中。并且在刻錄前自動(dòng)格式化并檢測 光盤有效性,對不符合刻錄要求的光盤自動(dòng)彈出,刻錄 結(jié)束后自動(dòng)封盤。設(shè)備內(nèi)置500G硬盤,對錄播現(xiàn)場的音像信息,實(shí)時(shí) 同步備份,確保數(shù)據(jù)信息安全存儲(chǔ),同時(shí)支持外接移動(dòng) 硬盤進(jìn)行實(shí)時(shí)同步刻錄。設(shè)備采用雙光驅(qū),支持直刻支持,支持4.7G單層、 單面雙層8.5G實(shí)時(shí)刻錄。使用標(biāo)準(zhǔn)4.7G容量DVD光盤, 刻錄時(shí)間1小時(shí)至24小時(shí)任選。設(shè)備具備更換光盤時(shí)視頻時(shí)間不間斷功能模式,第 一光盤刻錄完成后,重新放入第二張光盤,系統(tǒng)會(huì)把更 換光盤時(shí)的錄像刻錄到第二張光盤內(nèi),實(shí)現(xiàn)前后兩張光 盤的視頻時(shí)間不間斷,雙光盤刻錄時(shí)支持

11、無斷點(diǎn)換盤模 式,更換光盤時(shí)的錄像不會(huì)丟失。設(shè)備支持哈希值計(jì)算,光盤停止刻錄后即生成視頻 文件唯一哈希值,并寫入光盤,可快速出盤,出盤時(shí)間 不大于1分鐘。設(shè)備內(nèi)置高清錄播采集模塊,可以支持1280X1024、 1920X1080高分辨率,不低于25幀/秒的視頻證據(jù)采集。設(shè)備支持合成畫面1920X1080,不低于25幀/秒高 清分辨直刻。設(shè)備支持網(wǎng)頁對設(shè)備工作狀態(tài)監(jiān)測,及控制刻錄等。設(shè)備可設(shè)置定時(shí)錄像,也可設(shè)定第一光驅(qū)刻錄時(shí)間, 第二光驅(qū)在第一光驅(qū)接近封盤時(shí),自動(dòng)啟動(dòng)刻錄。設(shè)備支持音頻信號(hào)模擬成動(dòng)態(tài)的可視化圖形,同步 顯示在視頻畫面中,可即時(shí)了解音頻信息采集狀態(tài)。設(shè)備可靈活調(diào)整顯示內(nèi)容的背景、顏

12、色、位置、顯 示停留時(shí)間等。設(shè)備可以本機(jī)直接播放光盤視頻,提供暫停,快進(jìn) 等功能。設(shè)備錄制的視頻為通用格式,通用播放器可以播放, 方便錄播示證使用。音視頻單文件刻錄存儲(chǔ)確保光盤文 件連續(xù)性,通用視頻格式文件記錄,可采用QQ影音,暴 風(fēng)影音MEDIA PLAYER等播放器播放??啼浌獗P內(nèi)置重點(diǎn)標(biāo)記索引,在設(shè)備播放時(shí),可以 選擇重點(diǎn)標(biāo)記,設(shè)備會(huì)自動(dòng)定位到錄播中重點(diǎn)標(biāo)記時(shí)間 進(jìn)行播放。設(shè)備可提供WEB服務(wù),用戶通過瀏覽器可遠(yuǎn)程同步 實(shí)時(shí)觀看錄播現(xiàn)場場景,并可以和前端錄播人員進(jìn)行單向語音對講。設(shè)備可防止在使用過程中因外界的影響造成錄播同 步刻錄數(shù)據(jù)的丟失。意外斷電重啟后,無需更換光盤, 以非硬盤導(dǎo)刻方

13、式把原來的光盤恢復(fù)回來,保證光盤數(shù) 據(jù)的可靠性。兩臺(tái)設(shè)備間,支持遠(yuǎn)程雙向音視頻通話,也可以通 過H.323與視頻會(huì)議終端進(jìn)行音、視頻通訊,實(shí)現(xiàn)錄播 功能。設(shè)備具有2路以上(含2路)USB2.0接口,支持外 接USB鍵盤輸入中文,內(nèi)置文字記錄軟件,可在設(shè)備上做 簡單文字記錄,也可通過計(jì)算機(jī)網(wǎng)絡(luò)訪問設(shè)備,在遠(yuǎn)程 WEB界面做遠(yuǎn)程文字記錄。設(shè)備具有2路以上(含2路)100Mbps/1000Mbps自 適應(yīng)網(wǎng)口,支持網(wǎng)絡(luò)拓展應(yīng)用。智能語音識(shí)別服務(wù)器功能描述:提供語音識(shí)別能力,將數(shù)字音頻信號(hào)轉(zhuǎn)寫成文字, 通過以太網(wǎng)線,將文本文字傳至上層會(huì)議系統(tǒng)應(yīng)用中展 現(xiàn);同時(shí)提供會(huì)議系統(tǒng)服務(wù),以及會(huì)議系統(tǒng)各項(xiàng)功能,

14、詳見6.2網(wǎng)絡(luò)版會(huì)議轉(zhuǎn)錄系統(tǒng)功能介紹。推薦配置:(CPU核心數(shù)依實(shí)際生產(chǎn)場景并發(fā)數(shù)確定)系統(tǒng)版本:centos6.7硬件參數(shù):CPU 類型:至強(qiáng) lntel(R)Xeon(R)CPU 型號(hào):Xeon D-1521CPU 頻率:2.40GHzCPU核心:4核心(8線程)內(nèi)存類型:DDR4內(nèi)存容量:128G(4*32GB單條)硬盤接口: SATA3.0/M.2 硬盤容量:250GB SSD 網(wǎng)絡(luò)接口: 3個(gè)千兆網(wǎng)口 USB 接口: USB3.0 2 個(gè) VGA輸出接口: 1個(gè) 電源類型:熱插撥電源 電源數(shù)量:1個(gè) 電源功率:400W會(huì)議室內(nèi)的麥克風(fēng)輸入的模擬信號(hào)聲音通過聲卡、高清音視頻會(huì)議主機(jī)轉(zhuǎn)換

15、 為數(shù)字信號(hào),將音頻最終輸出到智能語音識(shí)別服務(wù)器上。在會(huì)議室原有的秘書電腦上通過智能會(huì)議轉(zhuǎn)錄系統(tǒng)控制會(huì)議語音轉(zhuǎn)寫,并對 會(huì)議信息、會(huì)議記錄進(jìn)行編輯和管理。智能語音識(shí)別服務(wù)器負(fù)責(zé)將音頻識(shí)別為文字,發(fā)送給秘書電腦上的客戶端軟 件。會(huì)議秘書通過客戶端軟件可以實(shí)時(shí)查看、編輯、修改識(shí)別出的文字內(nèi)容。會(huì)議參會(huì)人員可通過高清會(huì)議顯示屏,查閱各類多媒體資料以及文檔資料。語音識(shí)別技術(shù)語音識(shí)別原理語音識(shí)別是機(jī)器通過分析和理解,將人類語音中的詞匯內(nèi)容轉(zhuǎn)換為計(jì)算機(jī)可 讀的輸入的過程,例如按鍵、二進(jìn)制編碼或者字符序列。典型的語音識(shí)別的框架, 有三個(gè)重要的組成部分:模型訓(xùn)練、前端語音處理、后端識(shí)別處理。語音識(shí)別系 統(tǒng)原理

16、框圖如下:圖10語音識(shí)別技術(shù)原理圖功能特性語音識(shí)別支持8k和16k頻率的多種音頻格式。http服務(wù)支持的語音格式如下表:音頻格式備注pcm16K16bit16k16bit錄音數(shù)據(jù),pcm8K16bit8k16bit錄音數(shù)據(jù)ulaw16K8bit16k8bit u-law錄音數(shù)據(jù)ulaw8K8bit8k8bit u-law錄音數(shù)據(jù)alaw16K8bit16k8bit a-law錄音數(shù)據(jù)alaw8K8bit8k8bit a-law錄音數(shù)據(jù)socket服務(wù)支持的語音格式如下表:8K模型pcm8k16bitalaw8Kulaw8Kvox6K4bitvoc8K4bitGSM610v36K4bit16K模

17、pcm16K16bitWebService服務(wù)支持語音格式如下表:音頻格式備注pcm8K16bit8k16bit錄音數(shù)據(jù)vox6K4bit6k4bit vox錄 音數(shù)據(jù)vox8K4bit8k4bit vox錄音數(shù)據(jù)alaw8K8bit8k8bit a-law錄音數(shù)據(jù)ulaw8K8bit8k8bit u-law錄音數(shù)據(jù)GSM6108K16bit錄音數(shù)據(jù)pcm16K16bit16k16bit錄音數(shù)據(jù)v3 6K4bit6K4bit v3錄音數(shù)據(jù)系統(tǒng)功能n現(xiàn)場轉(zhuǎn)錄、實(shí)時(shí)投屏打開【語音轉(zhuǎn)錄】界面,單擊右上角的【新建任務(wù)】按鈕,跳轉(zhuǎn)至任務(wù) 創(chuàng)建界面;選中【現(xiàn)場轉(zhuǎn)錄】后單擊【確定】按鈕,將跳轉(zhuǎn)至【現(xiàn)場轉(zhuǎn)錄】

18、界面;點(diǎn)擊【添加角色】圖標(biāo),在彈出的界面中依次添加對應(yīng)的角色名稱,點(diǎn) 擊確定即可;如需開啟投屏,點(diǎn)擊右側(cè)頂部的【開啟投屏】圖標(biāo),即可在當(dāng)前或其他 屏幕上顯示;點(diǎn)擊【開始】按鈕,開始進(jìn)行語音的實(shí)時(shí)錄入,同時(shí)在左側(cè)編輯框中實(shí) 時(shí)修改校正;轉(zhuǎn)錄完成時(shí)請單擊【結(jié)束】按鈕,界面將自動(dòng)跳轉(zhuǎn)至【同步校正】界面。音頻轉(zhuǎn)寫打開【語音轉(zhuǎn)錄】界面,單擊右上角的【新建任務(wù)】按鈕,跳轉(zhuǎn)至任務(wù) 創(chuàng)建界面選中【音頻轉(zhuǎn)寫】后單擊【上傳音頻】,選擇一個(gè)音頻文件(wma/wav/mp3/m4a/amr格式),單擊【確定】按鈕后將跳轉(zhuǎn)至【音頻轉(zhuǎn) 寫】界面;轉(zhuǎn)錄完成時(shí)界面將自動(dòng)跳轉(zhuǎn)至【同步校正】界面。3飛同步校正單擊【播放】按鈕,進(jìn)行錄音的回聽;錄音播放過程中,系統(tǒng)會(huì)對相應(yīng)的文字內(nèi)容進(jìn)行底框標(biāo)記;當(dāng)遇到需要修改的文字,鼠標(biāo)雙擊該處位置可直接修改編輯;文字修改完成后,單擊下一處文字即可繼續(xù)播放錄音。提個(gè)人詞庫點(diǎn)擊【添加】按鈕,彈出【添加】窗口;輸入【語音輸入】和【文字輸出】,點(diǎn)擊【確定】,即添加成功。點(diǎn)擊【導(dǎo)入】按鈕,可以批量導(dǎo)入txt格式的文檔。替換格式為:原始 詞語二替換詞語。3.;文本訓(xùn)練點(diǎn)擊【導(dǎo)入文本】按鈕,可多選批量導(dǎo)入txt文本;選中文本后單擊【開始訓(xùn)練】即可自動(dòng)訓(xùn)練,直到完成。語音

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論