自然語言浮水印NaturalLanguageWaterMarking.ppt_第1頁
自然語言浮水印NaturalLanguageWaterMarking.ppt_第2頁
自然語言浮水印NaturalLanguageWaterMarking.ppt_第3頁
自然語言浮水印NaturalLanguageWaterMarking.ppt_第4頁
自然語言浮水印NaturalLanguageWaterMarking.ppt_第5頁
已閱讀5頁,還剩32頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

自然語言浮水印(Natural Language Water Marking),International Workshop on Digital Watermarking IWDW 2003,What is NL Watermarking,文字?jǐn)?shù)位 浮水印技術(shù),原文,將浮水印加入數(shù)位文字內(nèi)容中,此浮水印技術(shù)與文字的內(nèi)容語意相關(guān)而無關(guān)於文字儲(chǔ)存的格式,可以加強(qiáng)數(shù)位文字內(nèi)容的保護(hù)。,加入浮水印之後的文章,浮水印技術(shù)規(guī)格,透明性(transparency) 被加入浮水印(watermark)須感官上(perceptually) 看不見(invisible)或聽不到(inaudible) 亦即無法察覺(imperceptible)以免影響原來資訊的品質(zhì)。 非偵測性(undetectability) 所加入的浮水印須無法被偵測出其位置,以免被不法者輕易剪下而移除。 強(qiáng)健性(robustness) 安全的浮水印需能忍受各種數(shù)位處理與攻擊(attacks)以維持其功能,或者至少在其被破壞前原始影像已嚴(yán)重失真。 安全性(security) 即使知道加入的浮水印的程序也無法讓未經(jīng)授權(quán)者移除所加入的浮水印。 非模糊性(unambiguousness) 解決合法擁有者死結(jié)的問題,亦即確認(rèn)唯一合法擁有者。 鑑定時(shí)勿需原始影像(authentication without original source),浮水印示意圖,文字(Doc,Txt),密鑰,加密後語意不變,修改後之文字,浮水印解析,公開發(fā)表,第三者修改,公開發(fā)表,2,3,4,5,6,浮水印植入,1,使用者上載,2005我於臺(tái)北發(fā)表,2005我於臺(tái)北發(fā)表,自然語言浮水印-研發(fā)規(guī)格說明,詞彙分析技術(shù): 發(fā)展一句子語意解析技術(shù),了解句子中的語意,包含斷詞、詞性標(biāo)記與詞彙分析技術(shù)等功能。 語句句型解析技術(shù): 發(fā)展一語句技術(shù)分析是那一種句型,再依照不同的句型解析成不同句型樹。 句子選擇技術(shù): 發(fā)展一句子選擇技術(shù),從文件中分析語句得重要性已選擇適當(dāng)?shù)木渥印?浮水印encoding技術(shù): 發(fā)展一浮水印encoding技術(shù),將欲植入的浮水印分解成小部分,分別植入選定的句子中。而此浮水印encoding技術(shù)採用密鑰(encryption key) approach,只有在獲得密鑰(encryption key)以及encoding後的文章才可解析浮水印。 發(fā)展一句型替換技術(shù),將語句的語意保留而進(jìn)行不同句型的替換,替換的方式包括同義詞與同義句型樹替換。,自然語言浮水印技術(shù)突破,句型替換技術(shù): 同義詞替換 以ACT thesaurus 為基礎(chǔ)之同義詞替換 同義句型替換 Zero Anaphora 技術(shù)研發(fā) Co-Reference 技術(shù)研發(fā) 浮水印encoding技術(shù): 以同義詞替換方法為基礎(chǔ)之資訊隱藏方法 二元樹分法,可隱藏 logn 個(gè)bit ,n 為同義詞個(gè)數(shù)。 完成以同義詞替換為主的浮水印加密方式,植入文字格式數(shù)位浮水印流程圖,文字格式數(shù)位浮水印研發(fā)技術(shù),創(chuàng)新前瞻語意利解搜尋引擎既有成果,文字格式數(shù)位浮水印技術(shù)-詞彙分析技術(shù),了解句子中的語意,當(dāng)進(jìn)行Watermark encoding時(shí)便能維持文字中的語意 斷詞與詞性標(biāo)記 中研院分詞及詞性標(biāo)注Autotag系統(tǒng) 詞彙分析 知網(wǎng)(How Net) 創(chuàng)新前瞻語意搜尋引擎計(jì)畫中所研發(fā)的”ACT thesaurus”,文字格式數(shù)位浮水印技術(shù)-語句句型解析技術(shù)(續(xù)),同義中文結(jié)構(gòu)樹關(guān)聯(lián)技術(shù):由於選定做Watermark encoding的句子的結(jié)構(gòu)不一定能將Watermark encoding在此結(jié)構(gòu)中,需保留句子的語意並且更改句子的結(jié)構(gòu),文字格式數(shù)位浮水印技術(shù)-句子選擇演算法(續(xù)),句子重要性分析技術(shù): 原因 一篇文章中句子數(shù)目眾多,浮水印的資訊有限,不可能每一句子都encoding浮水印資訊於其中。 侵權(quán)者往往只會(huì)盜用重要的句子。 增加浮水印之彈性。 計(jì)算句子資訊量的方法,計(jì)算每一句的資訊量,資訊量高的句子假設(shè)為重要的句子,文字格式數(shù)位浮水印技術(shù)-句子選擇演算法,句子排序技術(shù):將句子做一排序,以決定浮水印的每一小部分資訊encoding到句子中的順序,這樣可保護(hù)浮水印資訊不容易被偵測與不容易被破壞。,文字格式數(shù)位浮水印技術(shù)-句型替換演算法,當(dāng)選定做Watermark encoding的句子不符合時(shí),可將此句的語意保留而進(jìn)行不同句型的替換。,文字格式數(shù)位浮水印技術(shù)-句型替換演算法(續(xù)),同義詞替換技術(shù): 知網(wǎng)(How Net) 與”ACT thesaurus” 所定義之詞義,進(jìn)行詞之相似度計(jì)算建立同義詞庫。,文字格式數(shù)位浮水印技術(shù)-句型替換演算法(續(xù)),同義中文結(jié)構(gòu)樹轉(zhuǎn)換技術(shù):當(dāng)Watermark要encoding到選定句子的結(jié)構(gòu)樹之結(jié)構(gòu)中,而結(jié)構(gòu)樹的結(jié)構(gòu)不符合時(shí),將語意保留而進(jìn)行不同句型的替換。 利用同義中文結(jié)構(gòu)樹關(guān)聯(lián)技術(shù)所建立出來的同義結(jié)構(gòu)樹進(jìn)行替換,文字格式數(shù)位浮水印技術(shù)-浮水印encoding技術(shù),發(fā)展一浮水印encoding技術(shù),將欲植入的浮水印分解成小部分,分別植入選定的句子中,而即使知道加入的浮水印的encoding程序,未經(jīng)授權(quán)者也無法移除所加入的浮水印。 此浮水印encoding技術(shù)採用密鑰(encryption key) approach,只有在獲得密鑰(encryption key)以及encoding後的文章才可解析浮水印。,文字格式數(shù)位浮水印技術(shù)-浮水印encoding技術(shù)(續(xù)),浮水印分解技術(shù):將欲植入的浮水印分解成小部分,分別植入選定的句子結(jié)構(gòu)樹之結(jié)構(gòu)中。 Unicode轉(zhuǎn)換,文字格式數(shù)位浮水印技術(shù)-浮水印encoding技術(shù)(續(xù)),浮水印植入技術(shù):將經(jīng)過分解過後的浮水印資訊的每一小部分,分別Encoding到選定的句子樹狀結(jié)構(gòu)中。,Watermark,Unicode 轉(zhuǎn)換,1 0 0 1 1 1,Bit轉(zhuǎn)換,Bit轉(zhuǎn)換,Bit轉(zhuǎn)換,句子1,句子2,句子n,. . .,Encryption key,Encryption key,Encryption key,1 0 1 0 ,0 1 1 0 ,0 0 1 0 ,Match,Match,Match,Yes,Yes,no,成功,成功,句型替換,文字格式數(shù)位浮水印技術(shù)-浮水印encoding技術(shù)(續(xù)),浮水印解析技術(shù):為浮水印植入技術(shù)的一個(gè)反向操作 滿足就算知道Encoding的方式,只有拿到Encoding用的密鑰(encryption key)以及encoding後的文章才可解析浮水印,Quadratic Residue,二次殘差(quadratic residue),目前做法,找一質(zhì)數(shù)p, 產(chǎn)生 Quadratic Residue Table,Quadratic Residue :1 Quadratic nonResidue:0,同義句型替換,目的,維持一句子的語意,而將句子的結(jié)構(gòu)(句型)進(jìn)行替換(換句換說) 。,同義句型替換- Zero anaphora,n m 他買了一顆蘋果,很新鮮。 他買了一顆蘋果,蘋果很新鮮。,VP,VH,Dfa,很,新鮮,S,VP,VH,Dfa,很,新鮮,NP,Na,蘋果,S,同義句型替換-CoReference,代名詞以其所指涉之名詞替換 張三是老師,他教學(xué)很認(rèn)真。 張三是老師,張三教學(xué)很認(rèn)真。,S,VP,NP,Nh,他,S,VP,NP,Nb,張三,同義句型替換-CoReference (Con.),代名詞(名詞)以其所指涉之(名詞+屬性)替換 張三是老師,同時(shí),他也是一位好爸爸。 張三是老師,同時(shí),張三老師也是一位好爸爸。,S,NP,NP,NP,NP,S,NP,NP,NP,NP,同義句型替換-以 Grammar 分析為基礎(chǔ)之同義句型替換,分析中文 Grammar 以獲得各種同義句型替換規(guī)則。 並列連接詞(Ca) 關(guān)聯(lián)連接詞(Cb) 需有中文人才支援 整理出各種Grammar轉(zhuǎn)換rule Rule如何套用在同義句型替換? 寫死在程式中? 發(fā)展一套用rule的 adapter,並列連接詞(Ca),並列連接詞連接兩個(gè)概念相似的成分,形成向心式結(jié)構(gòu),組成成分的作用與其連接成分相同。 對(duì)等連接詞(Caa),關(guān)聯(lián)連接詞(Cb),一般關(guān)聯(lián)連接詞存在有前後相對(duì)的連接詞(e.g.因?yàn)樗? 。 我因?yàn)樯×怂詪寢尣唤o我出去玩 我生病了所以媽媽不給我出去玩 媽媽不給我出去玩是因?yàn)槲疑×?以同義句型替換方法為基礎(chǔ)之資訊隱藏方法,Encoding Watermark in Tree Structure,以詞性與structure為依據(jù)。 依照詞性標(biāo)上對(duì)應(yīng)之?dāng)?shù)字 利用 DFS, BFS 將數(shù)字連接起來 一個(gè)Tree structure, 兩個(gè)”很大的數(shù)” 。 可以利用 “and”, “or”, “xor”等bit operation 增加其encoding bit的能力。 將所得到的”很大的數(shù)”利用 bit operation合併之後 mod P (Key) 去查 table。,DFS,1547021718470847154747,BFS,47024715471547081718,Bit operation,21232512346235,Mod P & Lookup table,1,435241241241241,Bit operation,Mod P & Lookup table,0,浮水印評(píng)量標(biāo)準(zhǔn),透明性 PSNR 資訊隱藏量 互斥條件 強(qiáng)健性 透明性 容量 1long n 攻擊 同義字替換 句子語意結(jié)構(gòu)樹之替換 部分句子取用 句子順序掉換 新增/刪除句子 竄改偵測 Retrieval Watermark ratio Normal Correction Gaussian sequence,未來應(yīng)用的情境,Text watermarking Data hiding 使用者輸入一文章、密鑰,與一訊息,系統(tǒng)自動(dòng)將訊息隱藏於文章中,而文章的語意不變。 Sub Set of

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論