




下載本文檔
版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、 基于b/s架構(gòu)的電子數(shù)據(jù)相似檢測(cè)審計(jì)方法研究 陳文佳摘要:在一個(gè)或者多個(gè)被審計(jì)數(shù)據(jù)源中可能存在相似重復(fù)實(shí)體,這些相似重復(fù)實(shí)體可能隱藏著審計(jì)項(xiàng)目中需要查找的疑點(diǎn),筆者采用了基于b/s架構(gòu)的軟件開(kāi)發(fā)方法分析并設(shè)計(jì)出相似檢測(cè)審計(jì)方法。本文中介紹了相似檢測(cè)方法的定義和工作原理,并應(yīng)用了審計(jì)案例數(shù)據(jù)對(duì)該方法的實(shí)用性進(jìn)行了檢驗(yàn)。關(guān)鍵詞:相似檢測(cè);電子數(shù)據(jù)審計(jì);案例應(yīng)用:tp31 文獻(xiàn)識(shí)別碼:a :1001-828x(2017)003-0-02在筆者研讀文獻(xiàn)和參與實(shí)踐的過(guò)程中發(fā)現(xiàn),一種用于數(shù)據(jù)清理的相似檢測(cè)方法可以有效地適用于審計(jì)工作中。在一個(gè)或者多個(gè)被
2、審計(jì)數(shù)據(jù)源中可能存在相似重復(fù)實(shí)體,這些相似重復(fù)實(shí)體可能隱藏著審計(jì)項(xiàng)目中需要查找的疑點(diǎn)。一、相似檢測(cè)方法的定義審計(jì)數(shù)據(jù)中也常常出現(xiàn)冗余或有意重復(fù)的部分,通過(guò)應(yīng)用相似檢測(cè)方法,一方面可以提高電子審計(jì)數(shù)據(jù)的質(zhì)量,另一方面審計(jì)人員在分析相似重復(fù)記錄時(shí)也可能挖掘出新的審計(jì)線(xiàn)索。相似重復(fù)記錄的產(chǎn)生通常發(fā)生在數(shù)據(jù)取得和傳遞過(guò)程中,審計(jì)人員需要結(jié)合審計(jì)數(shù)據(jù)本身的作用、來(lái)源等分析相似重復(fù)記錄產(chǎn)生的情況是否可以合理解釋?zhuān)约跋嗨浦貜?fù)記錄產(chǎn)生后是否會(huì)引起重大的后果。二、相似檢測(cè)方法的工作原理(一)相似檢測(cè)的參數(shù)設(shè)置兩條記錄是否相似,常常是通過(guò)其具有代表性的屬性值判斷。因此計(jì)算相似度之前,首先需要選定判斷相似的屬性字
3、段并分配字段權(quán)重?,F(xiàn)實(shí)生活中,每個(gè)實(shí)體都有著多個(gè)屬性,判斷相似時(shí),需要綜合各個(gè)屬性的相似情況。另外,每個(gè)屬性的重要性也是有差別的,因此,對(duì)每一個(gè)屬性需要設(shè)置權(quán)重來(lái)反映其在判定相似度的重要程度,權(quán)重的分配一般需要基于人員對(duì)數(shù)據(jù)屬性的理解和需求來(lái)自主地確定。(二)記錄相似度的算法和度量1.字符型字段的相似度計(jì)算方法對(duì)于字符型字段,其匹配算法采用編輯距離算法,這種算法是計(jì)算一個(gè)字符串通過(guò)插入、替換、刪除字符等編輯方式轉(zhuǎn)換成另一個(gè)字符串所需要的最少的編輯次數(shù),根據(jù)計(jì)算出的編輯距離,需要對(duì)應(yīng)地給出一個(gè)介于0和1之間的小數(shù)表示其相似的程度(完全不同時(shí)為0,完全相同時(shí)為1),這個(gè)數(shù)值的確定方法可以根據(jù)操作人
4、員的需要自行設(shè)定,漢字表述為主的數(shù)據(jù)通常適用這個(gè)算法。2.數(shù)值型字段的相似度計(jì)算方法對(duì)于數(shù)值型字段,可以通過(guò)計(jì)算數(shù)字間的相對(duì)差異取得其相似度:其中a與b為數(shù)值型字段。值得注意的是,通常情況下s(a,b)的取值范圍為0,1,而當(dāng)兩個(gè)數(shù)值符號(hào)不同時(shí),會(huì)導(dǎo)致s(a,b)0,在該情況下,相似度取值為0。3.布爾型字段的相似度計(jì)算方法對(duì)于布爾型字段,如果相同,則相似度為1,如果不同,則相似度為0。計(jì)算完每個(gè)字段對(duì)應(yīng)的相似度后,結(jié)合參數(shù)設(shè)置時(shí)確定的字段權(quán)重,計(jì)算出兩條記錄的整體相似度,這個(gè)相似度的值應(yīng)當(dāng)也介于0和1之間,數(shù)值越大代表其為相似記錄的可能性也越大。三、電子數(shù)據(jù)相似檢測(cè)審計(jì)的應(yīng)用在多個(gè)被審計(jì)數(shù)據(jù)
5、源中可能含有相似的內(nèi)容,這些相似內(nèi)容在某些情況下也許會(huì)成為審計(jì)問(wèn)題的突破口。下文將以某審計(jì)案例數(shù)據(jù)為例介紹本系統(tǒng)的應(yīng)用。為了審計(jì)某省應(yīng)取消的行政審批事項(xiàng)是否及時(shí)取消,審計(jì)人員搜集了國(guó)務(wù)院取消行政審批事項(xiàng)的發(fā)文,并讓省法制辦公室提供該省行政審批事項(xiàng)的清單。審計(jì)人員的審計(jì)方法是將國(guó)務(wù)院發(fā)文中每項(xiàng)取消的事項(xiàng)帶入該省行政審批事項(xiàng)清單中查找是否存在應(yīng)取消的審批事項(xiàng),隨時(shí)將可疑的審批事項(xiàng)記錄下來(lái)。然而,2013年以來(lái),國(guó)務(wù)院通過(guò)取消和下放行政審批事項(xiàng)共618項(xiàng),進(jìn)行完所有的查找至少需要一個(gè)小時(shí)。如果使用本系統(tǒng)的相似檢測(cè)審計(jì)方法,只需要簡(jiǎn)單的幾步操作,具體如下:1.將待對(duì)比的兩個(gè)文件轉(zhuǎn)換為數(shù)據(jù)庫(kù)文件的格式。
6、具體操作過(guò)程為:打開(kāi)access并新建“空白桌面數(shù)據(jù)庫(kù)”,選擇從外部獲取數(shù)據(jù),在對(duì)應(yīng)類(lèi)型下選擇數(shù)據(jù)文件導(dǎo)入即可。本案例中的文檔應(yīng)當(dāng)是國(guó)務(wù)院取消行政審批事項(xiàng)的發(fā)文和該省行政審批事項(xiàng)的清單。2.在網(wǎng)頁(yè)界面中,選擇進(jìn)行匹配的數(shù)據(jù)庫(kù)文件,將數(shù)據(jù)庫(kù)文件上傳到系統(tǒng)指定的目錄下,并界面中顯示出兩個(gè)文件中的內(nèi)容,同時(shí),左側(cè)的“表一字段”和“表二字段”下方的下拉菜單直接獲取表頭的字段名。3.根據(jù)審計(jì)的需要,首先選擇需要進(jìn)行相似檢測(cè)的字段,并根據(jù)字段的數(shù)據(jù)類(lèi)型選擇相應(yīng)的相似檢測(cè)算法,再設(shè)置每對(duì)字段在此次匹配中的權(quán)重,接著設(shè)置“字段間閾值”和“記錄閾值”,用于判斷字段相似度和記錄相似度是否滿(mǎn)足審計(jì)人員認(rèn)定的相似程度
7、。本案例中,兩張表的對(duì)應(yīng)字段為:表一的“項(xiàng)目名稱(chēng)”與表二的“權(quán)力名稱(chēng)”相對(duì)應(yīng),表一的“審批部門(mén)”和表二的“行使主體”相對(duì)應(yīng)。其中,“權(quán)力名稱(chēng)”的相似比“部門(mén)”的相似更重要,所以暫且設(shè)置“權(quán)力名稱(chēng)”的權(quán)重為0.7,“權(quán)力名稱(chēng)”的權(quán)重為0.3,假設(shè)將字段閾值控制在0.3,記錄閾值為0.4,執(zhí)行命令后獲得了兩組記錄(詳細(xì)內(nèi)容見(jiàn)圖1),這兩組數(shù)據(jù)可以作為審計(jì)線(xiàn)索進(jìn)行下一步審計(jì)工作。四、結(jié)語(yǔ)上述案例中,使用本系統(tǒng)的相似檢測(cè)審計(jì)方法得到的結(jié)果與審計(jì)人員得到的結(jié)果是一致的,因此,使用相似檢測(cè)審計(jì)系統(tǒng)能夠更加便于審計(jì)人員發(fā)現(xiàn)更多的審計(jì)線(xiàn)索,提高審計(jì)工作的效率和效果。參考文獻(xiàn):1陳偉.大數(shù)據(jù)環(huán)境下基于模糊匹配的審計(jì)方法j.中國(guó)注冊(cè)會(huì)計(jì)師,2016(11):84-88+3.2殷秀葉.大數(shù)據(jù)環(huán)境下的相似重復(fù)記錄檢測(cè)方法j.武漢工程大學(xué)學(xué)報(bào),2014(09):66-69.基金項(xiàng)目:本文系2016年南京審計(jì)大學(xué)研究生科研創(chuàng)新計(jì)劃項(xiàng)目(項(xiàng)目編號(hào):mz2016001)的研究成果之一。 現(xiàn)代經(jīng)濟(jì)信息2017年3期現(xiàn)代經(jīng)濟(jì)信息的其它文章
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 商用車(chē)企業(yè)經(jīng)營(yíng)管理方案
- 工匠精神與應(yīng)用型院校職業(yè)文化融合機(jī)制
- 2025年刺繡機(jī)電控項(xiàng)目立項(xiàng)申請(qǐng)報(bào)告模板
- 燃?xì)夤ぷ鏖_(kāi)展情況的匯報(bào)材料(6篇)
- 電裝實(shí)習(xí)總結(jié)
- 廣西建筑b類(lèi)安全員考試試題及答案
- 股權(quán)激勵(lì)考試題庫(kù)及答案
- Unit 3 聽(tīng)說(shuō)課-單元整體教學(xué)設(shè)計(jì)
- 防火減災(zāi)考試試題及答案
- 測(cè)量初級(jí)考試題庫(kù)及答案
- 2025年福建三明經(jīng)開(kāi)區(qū)控股集團(tuán)有限公司子公司招聘筆試沖刺題(帶答案解析)
- 北京市朝陽(yáng)區(qū)2023-2024學(xué)年三年級(jí)下學(xué)期語(yǔ)文期末考試卷
- 2025年馬克思主義基本原理考試復(fù)習(xí)試卷及答案
- 理論聯(lián)系實(shí)際談一談如何傳承發(fā)展中華優(yōu)-秀傳統(tǒng)文化?參考答案三
- 酒店拆除工程協(xié)議書(shū)
- 2025年遼寧省沈陽(yáng)市于洪區(qū)中考二模道德與法治歷史試題
- 人工智能芯片研究報(bào)告
- DB43-T 2066-2021 河湖管理范圍劃定技術(shù)規(guī)程
- 新疆開(kāi)放大學(xué)2025年春《國(guó)家安全教育》形考作業(yè)1-4終考作業(yè)答案
- T-GXAS 421-2022 成人急性中毒洗胃操作技術(shù)規(guī)范
- 中考話(huà)題復(fù)習(xí)hobby
評(píng)論
0/150
提交評(píng)論