![問(wèn)答系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)_第1頁(yè)](http://file2.renrendoc.com/fileroot_temp3/2021-11/11/e63bf06c-ab72-45d5-be72-935a69a5e617/e63bf06c-ab72-45d5-be72-935a69a5e6171.gif)
![問(wèn)答系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)_第2頁(yè)](http://file2.renrendoc.com/fileroot_temp3/2021-11/11/e63bf06c-ab72-45d5-be72-935a69a5e617/e63bf06c-ab72-45d5-be72-935a69a5e6172.gif)
![問(wèn)答系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)_第3頁(yè)](http://file2.renrendoc.com/fileroot_temp3/2021-11/11/e63bf06c-ab72-45d5-be72-935a69a5e617/e63bf06c-ab72-45d5-be72-935a69a5e6173.gif)
![問(wèn)答系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)_第4頁(yè)](http://file2.renrendoc.com/fileroot_temp3/2021-11/11/e63bf06c-ab72-45d5-be72-935a69a5e617/e63bf06c-ab72-45d5-be72-935a69a5e6174.gif)
![問(wèn)答系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)_第5頁(yè)](http://file2.renrendoc.com/fileroot_temp3/2021-11/11/e63bf06c-ab72-45d5-be72-935a69a5e617/e63bf06c-ab72-45d5-be72-935a69a5e6175.gif)
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、word可編輯1 名目引 言1第一章 爭(zhēng)辯背景21.1問(wèn)答系統(tǒng)爭(zhēng)辯背景21.2傳統(tǒng)的問(wèn)答系統(tǒng)的缺乏21.3問(wèn)答系統(tǒng)爭(zhēng)辯現(xiàn)狀21.4問(wèn)答系統(tǒng)的類型區(qū)分41.5問(wèn)題的類型進(jìn)行區(qū)分41.6中文問(wèn)答系統(tǒng)爭(zhēng)辯51.7相關(guān)評(píng)測(cè)5第二章 系統(tǒng)分析62.1市場(chǎng)調(diào)查62.2問(wèn)答系統(tǒng)的問(wèn)題分析62.3問(wèn)題分類62.4問(wèn)題相像性判定72.5關(guān)鍵詞擴(kuò)展8第三章 數(shù)據(jù)庫(kù)設(shè)計(jì)103.1數(shù)據(jù)庫(kù)的需求分析103.2數(shù)據(jù)庫(kù)表結(jié)構(gòu)設(shè)計(jì)103.3E-R模型12第四章 系統(tǒng)具體設(shè)計(jì)與實(shí)現(xiàn)154.1系統(tǒng)工作原理介紹154.2系統(tǒng)數(shù)據(jù)流圖164.3系統(tǒng)的實(shí)現(xiàn)算法164.4注冊(cè)模塊的設(shè)計(jì)與實(shí)現(xiàn)194.5注冊(cè)模塊的設(shè)計(jì)與實(shí)現(xiàn)324.6 系統(tǒng)
2、首頁(yè)的設(shè)計(jì)與實(shí)現(xiàn)344.7用戶提問(wèn)模塊的設(shè)計(jì)與實(shí)現(xiàn)384.8問(wèn)題顯示模塊的設(shè)計(jì)與實(shí)現(xiàn)414.9問(wèn)題答復(fù)模塊的登錄與實(shí)現(xiàn)444.10后臺(tái)管理模塊的設(shè)計(jì)與實(shí)現(xiàn)45第五章 系統(tǒng)測(cè)試47第六章 總結(jié)48致謝49參考文獻(xiàn)50引 言問(wèn)答系統(tǒng)的設(shè)計(jì)目標(biāo)是用簡(jiǎn)治、精確的答案答復(fù)用戶用自然語(yǔ)言提出的問(wèn)題。在人工智能和自然語(yǔ)言處理領(lǐng)域,問(wèn)答系統(tǒng)都有著較長(zhǎng)的歷史。1950年英國(guó)數(shù)學(xué)家圖靈(AMTurin8)在論文“Computing Machinery and Intelligence中形象地指出了什么是人工智能,以及機(jī)器應(yīng)當(dāng)?shù)竭_(dá)的智能標(biāo)準(zhǔn)。也就是通過(guò)自然語(yǔ)言問(wèn)答的方式,推斷機(jī)器是否具有智能。20世紀(jì)70年月隨著自
3、然語(yǔ)言理解技術(shù)的進(jìn)展,消滅了第一個(gè)實(shí)現(xiàn)用一般英語(yǔ)與計(jì)算機(jī)對(duì)話的人機(jī)接口LUNAR,該系統(tǒng)是伍德(WWoods)于1972年開(kāi)發(fā)用來(lái)幫助地質(zhì)學(xué)家查找、比較和評(píng)價(jià)阿波羅一號(hào)飛船帶回的月球巖石和土壤標(biāo)本的化學(xué)分析數(shù)據(jù)的系統(tǒng)。本文將簡(jiǎn)要介紹國(guó)內(nèi)外問(wèn)答系統(tǒng)爭(zhēng)辯的進(jìn)展?fàn)顩r。并且針對(duì)問(wèn)答系統(tǒng)中的一個(gè)難點(diǎn)以及實(shí)現(xiàn)方法進(jìn)行了爭(zhēng)辯。并給出如何識(shí)別用戶搜尋關(guān)鍵字的方法。第一章 爭(zhēng)辯背景1.1問(wèn)答系統(tǒng)爭(zhēng)辯背景隨著因特網(wǎng)的快速進(jìn)展,網(wǎng)絡(luò)上流通的信息日益增加,它已儼然成為巨大的訊息流通交換平臺(tái),要在如此大量的數(shù)據(jù)庫(kù)中找尋有用的數(shù)據(jù)著實(shí)不易,通常會(huì)藉助于搜尋引擎的功能來(lái)達(dá)成,然而以關(guān)鍵詞為主的搜尋引擎常會(huì)找出全部相關(guān)的信息
4、,但是其中也包含很多無(wú)用的數(shù)據(jù),用戶鋪張很多時(shí)間掃瞄不相關(guān)的網(wǎng)頁(yè)。隨著互聯(lián)網(wǎng)的進(jìn)展,網(wǎng)絡(luò)已成為人們獵取信息的重要手段。目前,世界上最大的搜尋引擎Google能夠搜尋的網(wǎng)頁(yè)數(shù)量已經(jīng)超過(guò)了百億。傳統(tǒng)的搜尋引擎存在很多缺乏的地方,其中主要有三個(gè)方面:一是以關(guān)鍵詞的規(guī)律組合來(lái)表達(dá)檢索需求二是返回的相關(guān)性信息太多三是以關(guān)鍵詞為根底的索引,停留在語(yǔ)言的表層,而沒(méi)有觸及語(yǔ)義,因此檢索效果很難進(jìn)一步提高。以上兩點(diǎn)使得人們?cè)诨ヂ?lián)網(wǎng)上的海量信息中快速精確地找到自己所需要的信息變得越來(lái)越困難。1.2傳統(tǒng)的問(wèn)答系統(tǒng)的缺乏傳統(tǒng)的問(wèn)答系統(tǒng)雖然可以對(duì)用戶提出的問(wèn)題給出確定的答案,但是這些問(wèn)答系統(tǒng)的數(shù)據(jù)源是基于一個(gè)固定的文檔
5、集合,尚且不能滿足用戶的各種各樣的需求。利用互聯(lián)網(wǎng)上的資源是有效的解決之道互聯(lián)網(wǎng)上具有豐富的信息,是問(wèn)答系統(tǒng)數(shù)據(jù)源的抱負(fù)資源,因此將問(wèn)答系統(tǒng)與互聯(lián)網(wǎng)結(jié)合起來(lái),就變得格外必要。這也就促使了基于互聯(lián)網(wǎng)的問(wèn)答系統(tǒng)的消滅和進(jìn)展的問(wèn)答系統(tǒng)的消滅和進(jìn)展。1.3問(wèn)答系統(tǒng)爭(zhēng)辯現(xiàn)狀問(wèn)答系統(tǒng)的概念雖然提出的時(shí)間并不長(zhǎng),但已經(jīng)形成進(jìn)展出了一些比較成熟的系統(tǒng)。美國(guó)麻省理工學(xué)院人工智能試驗(yàn)室于1993年開(kāi)發(fā)出來(lái)的START,系統(tǒng)( :/ /projects/infolab/start.html)是全世界第一個(gè)基于Internet的問(wèn)答系統(tǒng)。START系統(tǒng)旨在為用戶供給精確的信息,它能夠答復(fù)數(shù)以百萬(wàn)的
6、英語(yǔ)問(wèn)題,主要包括與地點(diǎn)相關(guān)的問(wèn)題(城市、國(guó)家、湖泊、天氣、地圖、人口統(tǒng)計(jì)學(xué)、政治和經(jīng)濟(jì)等)、與電影相關(guān)的問(wèn)題(片名、演員和導(dǎo)演等)、與人物相關(guān)的問(wèn)題(誕生日期、傳記等)以及與詞典定義相關(guān)的問(wèn)題等。該系統(tǒng)接受基于學(xué)問(wèn)庫(kù)和基于信息檢索的混雜模式,系統(tǒng)還保存著原來(lái)的兩個(gè)學(xué)問(wèn)庫(kù),"START KB和“Internet Public Library"。假設(shè)用戶提出的問(wèn)題屬于這兩個(gè)學(xué)問(wèn)庫(kù)的范疇,START就直接利用學(xué)問(wèn)庫(kù)中的學(xué)問(wèn)返回比較精確的答復(fù)。反之,START系統(tǒng)將問(wèn)題解析得到查詢的關(guān)鍵詞,通過(guò)搜尋引擎得到相關(guān)信息,通過(guò)后續(xù)處理得到精確而簡(jiǎn)潔的答復(fù)返回給用戶。比方提出一個(gè)問(wèn)題“W
7、ho was Bill Gates? ", START系統(tǒng)答復(fù)“Cofounder,Microsoft. Born William H. Gates on October 28, 1955,Seattle,Washington. "。同時(shí)系統(tǒng)還返回一個(gè)關(guān)于“Bill Gates"網(wǎng)頁(yè)鏈接,假設(shè)用戶期望了解更具體的信息時(shí)就可以掃瞄改網(wǎng)頁(yè)。美國(guó)華盛頓高校開(kāi)發(fā)的MULDER系統(tǒng)( :/mulder.cx/)是最早實(shí)現(xiàn)的基于Internet的全自動(dòng)的問(wèn)答系統(tǒng)。該系統(tǒng)沒(méi)有學(xué)問(wèn)庫(kù),而完全利用Internet上的資源得到答案。對(duì)于一個(gè)問(wèn)題,MULDER系統(tǒng)返回的不是
8、唯一的答案,而是一組候選答復(fù),并利用統(tǒng)計(jì)的方法給每一個(gè)答復(fù)賦值一個(gè)權(quán)重,稱之為置信度。比方,對(duì)于一個(gè)問(wèn)題“Who was the fast American in space?" ,MULDER系統(tǒng)的返回的候選答案中,"Alan Shepard具有70%的置信度,"John Glenn具有15%的置信度。同時(shí)在每一個(gè)答案下面給出相關(guān)的網(wǎng)頁(yè)鏈接和該網(wǎng)頁(yè)內(nèi)容的摘要。AskJeeves ( :/ask /)是美國(guó)一個(gè)比較有名的商用問(wèn)答系統(tǒng)。對(duì)于自然語(yǔ)言提出的問(wèn)題,AskJeeves系統(tǒng)接受多種方式進(jìn)行答復(fù),直接返回一段文本,并返回一系列文檔鏈接及其內(nèi)容摘要,同時(shí)還接受多
9、媒體文件的形式供給相關(guān)信息。比方對(duì)于問(wèn)題" Who was Bill Gates?",系統(tǒng)在文本答復(fù)的根底上還將顯示一張Bill Gate的照片。作為一個(gè)商用系統(tǒng),AskJeeves的效勞種類很多,不僅僅可以查找Web網(wǎng)頁(yè),也可以接受圖片、新聞、產(chǎn)品作為數(shù)據(jù)源,從而得到所需的信息。AskJeeves系統(tǒng)中的問(wèn)題分析局部是依靠手工完成的,為了能夠正確理解用戶的查詢AskJeeves雇傭了數(shù)百專職人員構(gòu)造問(wèn)題模板,并為這些問(wèn)題模板中常見(jiàn)的問(wèn)題進(jìn)行了緩存。系統(tǒng)的問(wèn)題模板雖然能夠細(xì)化和明確用戶的需求,但由于需要人工產(chǎn)生和維護(hù)的,工作量格外大。美國(guó)密歇根高校開(kāi)發(fā)的AnswerBus
10、:/ answerbus /)系統(tǒng)在多語(yǔ)種問(wèn)題上進(jìn)行了一些嘗試,可以答復(fù)英語(yǔ)、西班牙語(yǔ)、德語(yǔ)、意大利語(yǔ)、葡萄牙語(yǔ)的問(wèn)題。Microsoft公司的Encarta ( :/encarta.msn /)系統(tǒng)作為一個(gè)在線百科全書(shū)式的問(wèn)答式搜尋引擎,也供給了多語(yǔ)種的支持。對(duì)于用戶的每一次查詢,AnswerBus將返還5個(gè)網(wǎng)頁(yè)鏈接,并給出XML和TXT的Possible answers。新加坡開(kāi)發(fā)的LAMP為了更加正確的理解用戶的查詢意圖,列出了person,organization,location,date,time。money,percent等7種查詢類別讓用戶進(jìn)行選擇,LAMP不是返回網(wǎng)頁(yè)鏈接,而
11、是直接返還答案。LAMP所在網(wǎng)址 :/hal .sg/cgi-bin/smadellz/lamp_query.pl此外,南加州高校利用自然語(yǔ)言處理、文本摘要等技術(shù),開(kāi)發(fā)的Webclopedia系統(tǒng)在各項(xiàng)評(píng)測(cè)中也取得了很好的效果;美國(guó)Language Computer公司的問(wèn)答系統(tǒng)( :/ languagecomputer /demos/question_answering)在TREC評(píng)測(cè)中始終名列前茅。國(guó)內(nèi)復(fù)旦高校開(kāi)發(fā)的原型系統(tǒng)FDUQA己經(jīng)具有了初步的效果,同時(shí)哈爾濱工業(yè)高校金山客服和中國(guó)科學(xué)院計(jì)算技術(shù)爭(zhēng)辯所也在從事該領(lǐng)域的爭(zhēng)辯。1.4問(wèn)答系統(tǒng)的類型區(qū)分問(wèn)答系統(tǒng)
12、(Question Answering System, QA)是信息檢索系統(tǒng)的一種高級(jí)形式。它能用精確、簡(jiǎn)潔的自然語(yǔ)言答復(fù)用戶用自然語(yǔ)言提出的問(wèn)題。其爭(zhēng)辯興起的主要緣由是人們對(duì)快速、精確地獵取信息的需求。問(wèn)答系統(tǒng)是目前人工智能和自然語(yǔ)言處理領(lǐng)域中一個(gè)倍受關(guān)注并具有廣泛進(jìn)展前景的爭(zhēng)辯方向。1.5問(wèn)題的類型進(jìn)行區(qū)分問(wèn)答系統(tǒng)問(wèn)答問(wèn)題的類型進(jìn)行區(qū)分:詢問(wèn)人(如:誰(shuí)覺(jué)察了北美洲?)、詢問(wèn)時(shí)間如:人類哪年登錄月球?、詢問(wèn)數(shù)量如:珠穆朗瑪峰有多高?、詢問(wèn)定義如:什么是氨基酸?、詢問(wèn)地點(diǎn)和位置如:芙蓉江在重慶市哪個(gè)縣?、詢問(wèn)緣由如:天為什么是藍(lán)的?。問(wèn)答系統(tǒng)分類如圖1.1問(wèn)答系統(tǒng)限定域問(wèn)答系統(tǒng)開(kāi)發(fā)域問(wèn)答系統(tǒng)基
13、于常用提問(wèn)集問(wèn)答系統(tǒng)機(jī)構(gòu)數(shù)據(jù)庫(kù)問(wèn)答系統(tǒng)自由文本問(wèn)答系統(tǒng)網(wǎng)絡(luò)問(wèn)答系統(tǒng)固定資料庫(kù)問(wèn)答系統(tǒng)單文本問(wèn)答系統(tǒng)圖1.1 問(wèn)答系統(tǒng)分類從系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)來(lái)看,自動(dòng)問(wèn)答系統(tǒng)一般包括三個(gè)主要組成局部:問(wèn)題分析、信息檢索和答案抽取。 目前國(guó)際上,問(wèn)答系統(tǒng)的爭(zhēng)辯方興未艾,很多大的科研院所和有名公司,都樂(lè)觀參與到該領(lǐng)域的爭(zhēng)辯,其中比較有名的如MICROSOFT、IBM、MIT、University of Amsterdam、National University of Singapore、University of Zurich、University of Southern California、Columbia U
14、niversity等等,國(guó)內(nèi)在問(wèn)答系統(tǒng)方面的爭(zhēng)辯相對(duì)國(guó)外較為缺乏,主要有中科院計(jì)算所、復(fù)旦高校、哈爾濱工業(yè)高校、沈陽(yáng)航空工業(yè)學(xué)院、香港城市高校、臺(tái)灣中研院等一些單位。1.6中文問(wèn)答系統(tǒng)爭(zhēng)辯中文問(wèn)答系統(tǒng)相對(duì)于英文有如下幾個(gè)方面的難點(diǎn)或缺乏之處: 連寫(xiě):中文是連續(xù)書(shū)寫(xiě),分詞是漢語(yǔ)言處理的根底。中文問(wèn)答系統(tǒng)由于是句子級(jí)別的信息檢索,要分析句子,首先要分詞。 形態(tài):漢語(yǔ)缺乏狹義的形態(tài)變化,如英文中的主動(dòng)被動(dòng)語(yǔ)態(tài),完成時(shí)進(jìn)行時(shí)等,形態(tài)對(duì)于計(jì)算機(jī)就是標(biāo)記,有利于計(jì)算機(jī)的處理。 語(yǔ)法:漢語(yǔ)語(yǔ)法機(jī)敏,句子各成分之間的關(guān)系靠詞序、“意合、虛詞,變化較多。 語(yǔ)義:一詞多義、同音詞、同義詞、近義詞等,以及豐富的表達(dá)
15、方式,上下文依靠度高,省略語(yǔ)等都是計(jì)算機(jī)處理的難點(diǎn)。 語(yǔ)法爭(zhēng)辯:面對(duì)計(jì)算機(jī)處理的中文語(yǔ)法爭(zhēng)辯缺乏,如中文問(wèn)答系統(tǒng)需要的關(guān)于中文句型形式化、不同句型之間的轉(zhuǎn)換的爭(zhēng)辯資料極少。 相關(guān)資源:缺乏包括語(yǔ)法、語(yǔ)義詞典等中文語(yǔ)言學(xué)資源和相關(guān)生熟語(yǔ)料,國(guó)外這方面強(qiáng)得多,如TREC就供給的相當(dāng)數(shù)量的可用于英文問(wèn)答爭(zhēng)辯和評(píng)測(cè)的語(yǔ)料。 中文問(wèn)答系統(tǒng)需要在現(xiàn)有的中文信息處理技術(shù)根底上,充分爭(zhēng)辯和利用問(wèn)答的特性與需求,通過(guò)各種方法解決和克服(或臨時(shí)回避)以上難點(diǎn)和困難,設(shè)計(jì)和開(kāi)發(fā)問(wèn)答系統(tǒng)。1.7相關(guān)評(píng)測(cè)自1999 年文本檢索會(huì)議( Text Retrieval Conference ,簡(jiǎn)稱TREC) 引入問(wèn)答系統(tǒng)評(píng)測(cè)
16、專項(xiàng)(Question Answering Track ,簡(jiǎn)稱QA Track) 后,人們對(duì)基于自然語(yǔ)言的問(wèn)答系統(tǒng)再次產(chǎn)生了深厚的愛(ài)好,在近些年的TREC 競(jìng)賽中,QA Track 是最受關(guān)注的評(píng)測(cè)工程之一。 日語(yǔ)問(wèn)答評(píng)測(cè)平臺(tái)Question Answering Challenge (QAC) 是從2021 年開(kāi)頭的,每?jī)赡昱e辦一屆。自NTCIR-5開(kāi)頭,其CLQA專項(xiàng)中參加中文評(píng)測(cè)語(yǔ)料,但目前尚未見(jiàn)有簡(jiǎn)體中文。 由IST Programme of the European Union 資助的Cross Language Evaluation Forum (CLEF) 在2021 年設(shè)立第一屆
17、多語(yǔ)言問(wèn)答系統(tǒng)評(píng)測(cè)(Multilingual Question Answering) 工程,并方案每年舉辦一次。第二章 系統(tǒng)分析2.1市場(chǎng)調(diào)查在正式立項(xiàng)之前必需進(jìn)行可行性分析,而可行性分析的根底是對(duì)系統(tǒng)的市場(chǎng)調(diào)查。市場(chǎng)調(diào)查主要由兩局部組成:一般調(diào)查和信息需求初步調(diào)查。一般調(diào)查包括找出相近的站點(diǎn),對(duì)這些站點(diǎn)的網(wǎng)址宣揚(yáng)方法、主頁(yè)設(shè)計(jì)、文字表達(dá)等狀況進(jìn)行了分析,并了解整個(gè)人才溝通的運(yùn)作狀況,充分發(fā)揮本網(wǎng)站的優(yōu)勢(shì)。信息需求初步調(diào)查是通過(guò)發(fā)E-mail和爭(zhēng)辯組的方式對(duì)局部人才和企業(yè)進(jìn)行調(diào)查了解。本系統(tǒng)界面簡(jiǎn)潔、友好,操作簡(jiǎn)便易用,在設(shè)計(jì)時(shí)充分考慮人才網(wǎng)站的特點(diǎn),力求簡(jiǎn)潔,避開(kāi)花哨的內(nèi)容,以沖淡主題,做到
18、個(gè)人用戶與企業(yè)用戶兼顧,使系統(tǒng)簡(jiǎn)潔有用、易操作。2.2問(wèn)答系統(tǒng)的問(wèn)題分析問(wèn)題分析即通過(guò)對(duì)問(wèn)題的語(yǔ)法、語(yǔ)義結(jié)構(gòu)等進(jìn)行解析,獵取該問(wèn)題的關(guān)鍵詞,提取問(wèn)題的焦點(diǎn)、確定問(wèn)題類型和答案類型等等。問(wèn)題分析局部主要完成以下幾局部工作:確定問(wèn)題的類型、提取出問(wèn)題的關(guān)鍵詞、依據(jù)問(wèn)題的類型等因素對(duì)關(guān)鍵詞進(jìn)行適當(dāng)?shù)臄U(kuò)展。從自然語(yǔ)言處理的視角來(lái)看,還要對(duì)問(wèn)題進(jìn)行分詞以及詞性標(biāo)注等分析過(guò)程,有些問(wèn)答系統(tǒng)還對(duì)問(wèn)題進(jìn)行句法分析和語(yǔ)義分析。2.3問(wèn)題分類在TREC 2021和2021中,QA主任務(wù)把問(wèn)題分成3類進(jìn)行分別處理。這3類問(wèn)題是陳述類問(wèn)題(FactoN)、列表類問(wèn)題(Nst)和定義類問(wèn)題(defin小ons)c155
19、1。唐素勤在教學(xué)自動(dòng)問(wèn)答系統(tǒng)中把問(wèn)題分為求知性提問(wèn)與求證性提問(wèn)兩類u“3。求知性提問(wèn)即用戶從系統(tǒng)中獵取未知學(xué)問(wèn),如“什么是學(xué)問(wèn)抽取?;求證性提問(wèn)指用戶提問(wèn)前已具備了某些相關(guān)的學(xué)問(wèn),通過(guò)問(wèn)答對(duì)自身已有的模糊學(xué)問(wèn)或不完整學(xué)問(wèn)進(jìn)行驗(yàn)證、澄清或補(bǔ)充,如“情報(bào)學(xué)專業(yè)的本科階段名稱是信息管理與信息系統(tǒng)嗎?。問(wèn)題從形式上分為疑問(wèn)、設(shè)問(wèn)、反問(wèn)或特指問(wèn)、是非問(wèn);從目的上分為查找信息、驗(yàn)證事實(shí)、收集資料;從性質(zhì)上分為開(kāi)放型、封閉型“V;依據(jù)簡(jiǎn)單程度分為是非問(wèn)題、選擇問(wèn)題、特指性問(wèn)題、語(yǔ)境性問(wèn)題、推理性問(wèn)題、概括性問(wèn)題、專家性問(wèn)題。如表2.1所示。表2.1 問(wèn)題分類是非問(wèn)題選擇問(wèn)題特指性問(wèn)題語(yǔ)境性問(wèn)題推理性問(wèn)題概括
20、性問(wèn)題專家性問(wèn)題是非問(wèn)題(封閉型):數(shù)據(jù)挖掘與學(xué)問(wèn)覺(jué)察是一“回事嗎?選擇問(wèn)題(封閉型):數(shù)據(jù)挖掘與文本挖掘。哪個(gè)概念的范疇更大?特指問(wèn)題:在情報(bào)學(xué)博士生導(dǎo)師隊(duì)伍中。哪一位的博土學(xué)位取得最早(誰(shuí)是擁有博士學(xué)位最早的情報(bào)學(xué)博導(dǎo))?統(tǒng)計(jì)型問(wèn)題:情報(bào)學(xué)博士點(diǎn)有哪幾家?過(guò)程型問(wèn)題:數(shù)據(jù)庫(kù)學(xué)問(wèn)覺(jué)察需要哪些步驟?關(guān)系型問(wèn)題:學(xué)問(wèn)管理與學(xué)問(wèn)工程有何區(qū)分,有何聯(lián)系?緣由型問(wèn)題:現(xiàn)在,為什么沒(méi)有本科階段的情報(bào)學(xué)?推理性問(wèn)題:數(shù)據(jù)挖掘是從數(shù)據(jù)中挖掘,覺(jué)察的結(jié)果是學(xué)問(wèn);那么信息分析是對(duì)信息進(jìn)行分析,爭(zhēng)辯出的結(jié)果就是情報(bào)嗎?(依據(jù)數(shù)據(jù)挖掘與學(xué)問(wèn)覺(jué)察的關(guān)系推論信息分析與情報(bào)爭(zhēng)辯的關(guān)系)概括性問(wèn)題:數(shù)據(jù)挖掘是從數(shù)據(jù)中挖掘文
21、本挖掘就是從文本中挖掘,那么XX挖掘就是從XX中挖掘嗎?專家性問(wèn)題:數(shù)據(jù)挖掘與學(xué)問(wèn)覺(jué)察有何區(qū)分?在爭(zhēng)辯所讀爭(zhēng)辯生與在高校讀爭(zhēng)辯生有何不同?上述關(guān)于問(wèn)題的分類并不是很好,例如。專家性問(wèn)題指只有專家才能答復(fù)的問(wèn)題,問(wèn)題的專業(yè)性格外強(qiáng),也可能是概括性的,也可能涉及推理。問(wèn)答系統(tǒng)中少有反義疑問(wèn)句。針對(duì)于不同類型的問(wèn)題制定相應(yīng)的答案抽取規(guī)章,以便在答案抽取階段應(yīng)用這些規(guī)章來(lái)抽取問(wèn)題的答案。大局部的自動(dòng)問(wèn)答系統(tǒng)部是依據(jù)事先規(guī)定好的類別進(jìn)行分類。但是這種分類還是存在很多缺乏的地方,人為因素太多,而且分類太粗,并不能完全符合實(shí)際的要求。所以也有一局部爭(zhēng)辯人員提出對(duì)問(wèn)題自動(dòng)分類的思想。首先收集大量的問(wèn)題作為訓(xùn)練
22、語(yǔ)料,然后通過(guò)程序統(tǒng)計(jì)出經(jīng)常消滅的疑問(wèn)短語(yǔ)。例如通過(guò)統(tǒng)計(jì)覺(jué)察詢問(wèn)緣由的線索詞有“區(qū)分是什么?、“有什么區(qū)分、“有何差異性?。2.4問(wèn)題相像性判定除了對(duì)問(wèn)題類型進(jìn)行分析以外,有的問(wèn)答系統(tǒng)還使用問(wèn)題庫(kù)進(jìn)行間題的相像性判定。系統(tǒng)包括一個(gè)常問(wèn)問(wèn)題(FAQ)庫(kù),把用戶經(jīng)常提問(wèn)的問(wèn)題及其答案存儲(chǔ)起來(lái)。有了問(wèn)題庫(kù)。光拿用戶的提問(wèn)到FAQ庫(kù)中進(jìn)行搜尋,查找有沒(méi)有相同的問(wèn)題。假設(shè)有,就可以直接把FAQ庫(kù)中這個(gè)問(wèn)題的答案返回;假設(shè)沒(méi)有,查找是否有相像的問(wèn)題。這樣,對(duì)于用戶常問(wèn)的問(wèn)題,問(wèn)答系統(tǒng)就可以很快給出答案,不需要經(jīng)過(guò)簡(jiǎn)單的處理,而且還能保證答案的正確性。所以有了FAQ庫(kù)之后,既能提高問(wèn)答系統(tǒng)的效率。又能提高精
23、確性。?十萬(wàn)個(gè)為什么?、新浪的愛(ài)問(wèn)、百度的知道、網(wǎng)易的學(xué)問(wèn)人、網(wǎng)上詢問(wèn)以及專家問(wèn)答系統(tǒng)等資源都是很好的FAQ庫(kù)。問(wèn)題形似型判定主要表達(dá)在主題相像、結(jié)構(gòu)相像、格相像以及文法相像。結(jié)構(gòu)相像屬于語(yǔ)法方面的范疇,格相像屬于語(yǔ)義方面的范疇,間法相像屬于語(yǔ)用方面的范疇。問(wèn)題相像性判定的原那么為:格相像強(qiáng)于結(jié)構(gòu)相像,結(jié)構(gòu)相像強(qiáng)于主題相像。格相像與結(jié)構(gòu)相像就能確定問(wèn)題相像了,幾乎不需要考慮主題。主題的考慮主要用在目標(biāo)文獻(xiàn)檢索確實(shí)定上。如“學(xué)問(wèn)管理與學(xué)問(wèn)工程有何區(qū)分?與“工程管理與工商管理有什么區(qū)分?,這兩個(gè)問(wèn)題的主題完全不同,屬于兩個(gè)不同的領(lǐng)域;而結(jié)構(gòu)格外相像,“X與Y有何區(qū)分?;語(yǔ)義格也格外相像(可以說(shuō)是相
24、同),即求di財(cái)erencex,y,在前一個(gè)問(wèn)題中,x,y分別為數(shù)據(jù)挖掘與學(xué)問(wèn)覺(jué)察,后一個(gè)問(wèn)題中x,y分別為工程管理與工商管理。問(wèn)法相像指的是同一個(gè)問(wèn)題使用不同的問(wèn)法,目前還很難從技術(shù)上解決語(yǔ)用的問(wèn)題。基于常見(jiàn)問(wèn)題集的問(wèn)答系統(tǒng)類似于基于實(shí)例的機(jī)器翻譯系統(tǒng)?;趯?shí)例的機(jī)器翻譯系統(tǒng)是查找最相像的翻譯例句,然后對(duì)句中不同的局部依據(jù)詞表?yè)Q成相應(yīng)的詞即可。而基于常見(jiàn)問(wèn)題集的問(wèn)答系統(tǒng)那么是查找最相像的間句,卻不能把不同的詞簡(jiǎn)潔替換,假設(shè)強(qiáng)制性替換,首先要有題對(duì)庫(kù)?;趯?shí)例的機(jī)器翻譯直接使用雙語(yǔ)詞典,而問(wèn)答系統(tǒng)卻很難有題對(duì)庫(kù),至少要使用三元組概念或者語(yǔ)義概念關(guān)系的語(yǔ)義詞典,或者本體。例如首都中國(guó),北京,首都
25、英國(guó),倫敦。因此,從這點(diǎn)上來(lái)講,基于常見(jiàn)問(wèn)題集的問(wèn)答系統(tǒng)在答復(fù)新問(wèn)題時(shí),比基于實(shí)例的機(jī)器翻譯在翻譯新句時(shí)要困難。關(guān)鍵詞提取 在用戶提問(wèn)的問(wèn)題中,需要提取對(duì)后續(xù)檢索系統(tǒng)有用的關(guān)鍵詞。關(guān)鍵詞主要由名詞、動(dòng)詞、形容詞、限定性副詞等實(shí)詞組成。疑問(wèn)詞和一些常用的“吧、了、的等詞就應(yīng)當(dāng)被過(guò)濾掉。有一些問(wèn)答系統(tǒng)還可以把關(guān)鍵詞分為兩種:一般關(guān)鍵詞和核心關(guān)鍵詞。核心關(guān)鍵詞也稱“必需含有關(guān)鍵詞。核心關(guān)鍵詞指這些關(guān)鍵詞必需在答案句子中含有,而一般性關(guān)鍵詞可以不被答案句子包含。核心關(guān)鍵詞由專知名詞、限定性副詞(如最大、最高、最快等)、時(shí)間組成。之所以要制定“必需含有的關(guān)鍵詞原那么是因?yàn)樗鼈儗?duì)問(wèn)題有極強(qiáng)的限定性作用,假
26、設(shè)不含有它們的句子幾乎不行能是正確的答案。例如:?jiǎn)栴}是“情報(bào)學(xué)的第一個(gè)博士點(diǎn)在哪個(gè)學(xué)校?而檢索的結(jié)果應(yīng)當(dāng)是“武漢高?;蛘摺拔錆h高校于1990開(kāi)頭招收情報(bào)學(xué)博士,而不是“北京高校于1998年開(kāi)頭招收情報(bào)學(xué)博士,因?yàn)檫@明顯不是用戶想得到的結(jié)果,之所以消滅這種狀況的緣由就在于格外重要的關(guān)鍵詞“第一個(gè)沒(méi)有包含在答案句子中。假設(shè)加上“必需含有的關(guān)鍵詞這個(gè)限制,那么這個(gè)答案就不會(huì)被檢索出來(lái),因此通過(guò)這些關(guān)鍵詞的作用可以極大地提高檢索的精確性。關(guān)鍵詞被賜予不同的權(quán)重,在檢索句子時(shí)這些權(quán)重用來(lái)計(jì)算句子的權(quán)重。通常名詞、限定性副詞會(huì)有比較高的權(quán)重。2.5關(guān)鍵詞擴(kuò)展為了提高檢索系統(tǒng)的召回率,一般的問(wèn)答系統(tǒng)都對(duì)關(guān)鍵
27、詞進(jìn)行擴(kuò)展。由于在問(wèn)題空間和文檔空間之間存在著自然的語(yǔ)義鴻溝,使用基于問(wèn)題分析直接提取的關(guān)鍵詞進(jìn)行查詢,經(jīng)常不能獲得滿足的效果。因?yàn)樵诖鸢付温渲心承┰~經(jīng)常不是原來(lái)問(wèn)題的關(guān)鍵詞而是這些關(guān)鍵詞的擴(kuò)展。例如:?jiǎn)栴}是“搜尋引擎中anchor文件指的是什么?,答案的句子是“把錨庫(kù)文本變成順排索引,存到文檔索引庫(kù)里,并用錨庫(kù)所指向的doclD進(jìn)行關(guān)聯(lián)在問(wèn)題中使用的是“anchor,而在答案中卻接受了“錨庫(kù)這個(gè)詞匯。這就造成關(guān)鍵詞查詢失敗,因此需要對(duì)關(guān)鍵詞做適當(dāng)?shù)臄U(kuò)展常用的關(guān)鍵詞擴(kuò)展方式有:名詞同義詞擴(kuò)展和語(yǔ)義蘊(yùn)涵擴(kuò)展、動(dòng)詞同義詞擴(kuò)展(意義用法相同的詞)、依據(jù)問(wèn)題類型擴(kuò)展。局部工作在有些系統(tǒng)中由一個(gè)叫做“檢
28、索提問(wèn)生成器的組件完成,它接受不同的方法生成擴(kuò)展后的檢索式。如把詞的形態(tài)變化和導(dǎo)出詞作為檢索詞。問(wèn)答系統(tǒng)中通??梢越邮?同義詞詞林?、WordNet、HowNet等同義詞詞典進(jìn)行查詢關(guān)鍵詞的擴(kuò)展。還有一些問(wèn)答系統(tǒng)通過(guò)統(tǒng)計(jì)的方法來(lái)擴(kuò)展關(guān)鍵詞。這種方法需要大量的問(wèn)題和答案語(yǔ)料來(lái)進(jìn)行訓(xùn)練。每一類的問(wèn)題所對(duì)應(yīng)的答案一般都有某種共同的特性口。例如,對(duì)于詢問(wèn)地點(diǎn)的問(wèn)題,答案中經(jīng)常會(huì)消滅“在、位于、坐落在、地處等關(guān)鍵詞。所以通過(guò)統(tǒng)計(jì),找出這些詞后,就可以把它們添加到查詢式中。關(guān)鍵詞擴(kuò)展雖然提高了系統(tǒng)的召回率,但假設(shè)擴(kuò)展不適當(dāng)會(huì)極大地降低檢索的正確率,因此一般的問(wèn)答系統(tǒng)對(duì)關(guān)鍵詞的擴(kuò)展都是很謹(jǐn)慎的。這些系統(tǒng)往往
29、都對(duì)關(guān)鍵詞的擴(kuò)展添加很多限制條件,例如只對(duì)名詞的關(guān)鍵詞進(jìn)行擴(kuò)展。另外還有一些問(wèn)答系統(tǒng)是用檢索返回來(lái)的相關(guān)文檔對(duì)關(guān)鍵詞進(jìn)行擴(kuò)展。擴(kuò)展后的關(guān)鍵詞的重要性往往比從問(wèn)題中提取的關(guān)鍵詞的重要性低,為了提高系統(tǒng)的精確性,很多問(wèn)答系統(tǒng)又對(duì)關(guān)鍵詞賜予權(quán)重,以此來(lái)區(qū)分他們之間的重要性。 關(guān)鍵詞擴(kuò)展屬于問(wèn)題分析模塊,因?yàn)殛P(guān)鍵詞擴(kuò)展旨在解決問(wèn)題涉及哪些詞;而檢索式的構(gòu)造屬于文檔檢索模塊,因?yàn)闄z索式構(gòu)造旨在解決這些關(guān)鍵詞和目標(biāo)文獻(xiàn)之間可能的相關(guān)關(guān)系。第三章 數(shù)據(jù)庫(kù)設(shè)計(jì)3.1數(shù)據(jù)庫(kù)的需求分析依據(jù)系統(tǒng)需求,可以列出以下數(shù)據(jù)項(xiàng)和數(shù)據(jù)結(jié)構(gòu):用戶表:包括用戶名、密碼、真實(shí)姓名、用戶積分、性別、 、生日、密碼保護(hù)問(wèn)題及答案;問(wèn)題
30、表:包括問(wèn)題編號(hào)、提問(wèn)者、問(wèn)題題干、提問(wèn)時(shí)間、分類名稱、子類名稱、圖片、最正確答案編號(hào);答案表:包括答案編號(hào)、答案內(nèi)容、問(wèn)題編號(hào)、答復(fù)者、答復(fù)時(shí)間、提問(wèn)者評(píng)論、好評(píng)次數(shù);管理員表:用戶名、密碼、密碼保護(hù)問(wèn)題及答案;問(wèn)題父類表:包括問(wèn)題分類;問(wèn)題子類表:分類名稱、子類名稱;3.2數(shù)據(jù)庫(kù)表結(jié)構(gòu)設(shè)計(jì)數(shù)據(jù)庫(kù)表結(jié)構(gòu)設(shè)計(jì)如以下各表表示表3.1 用戶表(aa_user)字段名數(shù)據(jù)類型是否為空默認(rèn)值備注字段說(shuō)明usernamevarchar(20)N主鍵用戶名passwordvarchar(200)N密碼namevarchat(20)N真實(shí)姓名integralintY用戶積分sexvarchar(4)N性別p
31、honevarchar(11)Y datedateY生日question1varchar(100)Y密保問(wèn)題1question2varchar(100)Y密保問(wèn)題2question3varchar(100)Y密保問(wèn)題3answer1varchar(100)Y答案1answer2varchar(100)Y答案2answer3varchar(100)Y答案3注:用戶表保存用戶相關(guān)信息,如用戶名、密碼、 號(hào)碼等信息。這些都屬于用戶隱私,需要接受肯定的平安措施對(duì)用戶信息進(jìn)行管理。表3.2 問(wèn)題表(aa_question)字段名數(shù)據(jù)類型是否為空默認(rèn)值備注字段說(shuō)明Q_IDlongN自動(dòng)增長(zhǎng)主鍵問(wèn)題編號(hào)us
32、ernamevarchar(20)N外鍵提問(wèn)者姓名problemvarchar(500)N問(wèn)題timedateN提問(wèn)時(shí)間typevarchar(20)N分類名稱sub_typevarchar(20)N子類名稱picturevarchar(100)Y圖片A_IDlongYNULL外鍵最正確答案表3.3 答案表(aa_answer)字段名數(shù)據(jù)類型是否為空默認(rèn)值備注字段說(shuō)明A_IDlongN自動(dòng)增長(zhǎng)主鍵答案編號(hào)Q_IDlongN外鍵問(wèn)題編號(hào)contenttextN答案內(nèi)容usernamevarchar(20)N外鍵答復(fù)者timedateN答復(fù)時(shí)間commentvarchar(100)Y提問(wèn)者評(píng)論go
33、odintY0好評(píng)次數(shù)表3.4管理員表(aa_manager)字段名數(shù)據(jù)類型是否為空默認(rèn)值備注字段說(shuō)明usernamevarchar(20)N主鍵用戶名passwordvarchar(200)N密碼typevarchar(20)N用戶類型question1varchar(100)Y密保問(wèn)題1question2varchar(100)Y密保問(wèn)題2question3varchar(100)Y密保問(wèn)題3answer1varchar(100)Y答案1answer2varchar(100)Y答案2answer3varchar(100)Y答案3注:管理員表記錄了管理員的各種信息,用戶名和密碼是用戶登錄時(shí)的
34、身份驗(yàn)證機(jī)制求職聘請(qǐng)狀態(tài)描述將為用戶供給有效的求職聘請(qǐng)路徑,這不僅有利于管理員對(duì)用戶的管理,同時(shí)也利于用戶自己的管理與維護(hù)。表3.5 問(wèn)題分類(aa_question_type)字段名數(shù)據(jù)類型是否為空默認(rèn)值備注字段說(shuō)明typevarchar(20)NY分類名稱表3.6 問(wèn)題分類2(aa_question_subType)字段名數(shù)據(jù)類型是否為空默認(rèn)值備注字段說(shuō)明sub_typevarchar(20)N主鍵子類名稱typevarchar(20)N外鍵分類名稱3.3E-R模型為了把用戶的數(shù)據(jù)要求清楚明確地表達(dá)出來(lái),通常要建立一個(gè)概念性的數(shù)據(jù)模型也稱為信息模型。概念性數(shù)據(jù)模型是一種面對(duì)問(wèn)題的數(shù)據(jù)模型,
35、是依據(jù)用戶的觀點(diǎn)來(lái)對(duì)數(shù)據(jù)和信息建模。它描述了從用戶角度看到的數(shù)據(jù),它反映了用戶的現(xiàn)實(shí)環(huán)境,且與在軟件系統(tǒng)中的實(shí)現(xiàn)方法無(wú)關(guān)。最常用的表示概念性數(shù)據(jù)模型的方法,是實(shí)體聯(lián)系方法EntityRelationship Approach。這種方法用ER圖描述現(xiàn)實(shí)世界中的實(shí)體,而不涉及這些實(shí)體在系統(tǒng)中的實(shí)現(xiàn)方法。用這種方法表示的概念性數(shù)據(jù)模型又稱為ER模型。ER模型中包含“實(shí)體,“聯(lián)系和“屬性。在本系統(tǒng)中,問(wèn)題父類與問(wèn)題子類的關(guān)系是一對(duì)多的關(guān)系1:N,問(wèn)題與答案是一對(duì)多的關(guān)系1:N,問(wèn)題、答案與用戶之間的關(guān)系是1:N如圖3.1,問(wèn)題父類與問(wèn)題子類間的關(guān)系3.2所示。在本系統(tǒng)數(shù)據(jù)表中用到的主鍵有:管理員表中的
36、username字段管理員名;問(wèn)題表中的Q_ID字段問(wèn)題編號(hào);答案表中的A_ID字段答案編號(hào);用戶表中的username字段用戶名;問(wèn)題父類表中的type字段父類名稱;問(wèn)題子類表中的sub_type字段子類名稱;問(wèn)題父類問(wèn)題子類屬于父類名稱子類名稱1N圖3.2問(wèn)題父類與問(wèn)題子類間的關(guān)系問(wèn)題表問(wèn)題內(nèi)容提問(wèn)時(shí)間問(wèn)題父類問(wèn)題圖片問(wèn)題子類問(wèn)題編號(hào)最正確答案答案表答案編號(hào)答案內(nèi)容答復(fù)時(shí)間答復(fù)者好評(píng)次數(shù)提問(wèn)者評(píng)論用戶表密碼保護(hù)答案性別積分真實(shí)姓名密碼用戶名生日密碼保護(hù)問(wèn)題屬于屬于NN11圖3.1 問(wèn)題答案與用戶間的關(guān)系參照完整性是保證在主鍵被參照表中和外鍵之間的關(guān)系總是得到維護(hù)。對(duì)兩個(gè)相關(guān)聯(lián)的表主表和從表
37、進(jìn)行操作數(shù)據(jù)的插入和刪除的時(shí)候,通過(guò)參照完整性保證它們之間的數(shù)據(jù)的全都性。用戶自定義完整性,不同的數(shù)據(jù)庫(kù)系統(tǒng)依據(jù)起數(shù)據(jù)應(yīng)用環(huán)境的不同,往往還需要一些特殊的約束條件。它反響某一具體應(yīng)用所涉及的數(shù)據(jù)必需滿足的語(yǔ)義要求。對(duì)于用戶自定義完整性可以通過(guò)數(shù)據(jù)庫(kù)設(shè)計(jì),也可以通過(guò)程序代碼來(lái)實(shí)現(xiàn)。由于程序設(shè)計(jì)的機(jī)敏性和便捷性,在整個(gè)系統(tǒng)的調(diào)試過(guò)程中對(duì)于不完善的地方只需對(duì)代碼進(jìn)行修改而不用更改數(shù)據(jù)庫(kù),因此在系統(tǒng)中接受了程序代碼來(lái)實(shí)現(xiàn)數(shù)據(jù)庫(kù)用戶自定義完整性的約束。第四章 系統(tǒng)具體設(shè)計(jì)與實(shí)現(xiàn)4.1系統(tǒng)工作原理介紹本系統(tǒng)接受B/S結(jié)構(gòu)(Browser/Server,掃瞄器/效勞器結(jié)構(gòu))和基于Web效勞兩種模式,是一個(gè)適
38、用于Internet環(huán)境下的模型結(jié)構(gòu)。只要用戶能連上Internet,便可以在任何時(shí)間、任何地點(diǎn)求職聘懇求職的內(nèi)容。系統(tǒng)工作原理圖如圖4.1所示:圖 4.1 系統(tǒng)工作原理圖系統(tǒng)的工作流程包括以下一些關(guān)鍵環(huán)節(jié):(1)用戶注冊(cè)。在每一個(gè)用戶使用該系統(tǒng)之前需要注冊(cè),系統(tǒng)會(huì)將用戶輸入的信息記錄到用戶模型中。(2)用戶登陸。用戶輸入用戶名和密碼后,系統(tǒng)驗(yàn)證是否正確并打算用戶是否能進(jìn)入進(jìn)行求職聘請(qǐng)。(3)問(wèn)題搜尋。用戶在搜尋框中輸入要搜尋的關(guān)鍵字進(jìn)行搜尋,當(dāng)用戶輸入多關(guān)鍵字的時(shí)候要用“空格隔開(kāi)。系統(tǒng)將依據(jù)用戶的輸入對(duì)關(guān)鍵字進(jìn)行拆分和對(duì)相關(guān)內(nèi)容搜尋。(4)問(wèn)題發(fā)表。用戶單擊我要提問(wèn),在彈出的網(wǎng)站中輸入問(wèn)題,
39、進(jìn)行發(fā)表問(wèn)題,問(wèn)了進(jìn)一步將問(wèn)題闡釋清楚積分到達(dá)100含分以上的用戶在發(fā)表問(wèn)題的時(shí)候可以附加一張不超過(guò)50Kb的JPG格式圖片。提問(wèn)一次將花費(fèi)積分5(5)問(wèn)題答復(fù)。用戶單擊我要答復(fù),在彈出的網(wǎng)站可以選擇自己想要答復(fù)的問(wèn)題,答復(fù)以下問(wèn)題一次將增加積分5,假設(shè)答復(fù)的問(wèn)題被提問(wèn)者接受為最正確問(wèn)題將獲得5分的嘉獎(jiǎng)。(6)用戶信息管理。其中包括對(duì)用戶信息的查詢和修改,系統(tǒng)會(huì)依據(jù)修改后的用戶信息重新自動(dòng)合成網(wǎng)頁(yè)內(nèi)容。(7)后臺(tái)管理。管理員通過(guò)后臺(tái)可以對(duì)用戶、問(wèn)題及答案進(jìn)行管理??梢詫⒉缓戏ǖ男畔⒑蛺阂庥脩暨M(jìn)行刪除 。4.2系統(tǒng)數(shù)據(jù)流圖數(shù)據(jù)流圖Data Flow Diagram,簡(jiǎn)稱DFD能精確地在規(guī)律上描繪
40、系統(tǒng)的功能、輸入、輸出和數(shù)據(jù)存儲(chǔ)等,擺脫了物理內(nèi)容,是描繪系統(tǒng)規(guī)律模型的最主要的工具。經(jīng)過(guò)系統(tǒng)具體調(diào)查分析以及用戶需求分析,我們得到了新系統(tǒng)的數(shù)據(jù)流圖。如圖4.2用戶登錄數(shù)據(jù)流圖:圖4.2登錄數(shù)據(jù)流圖4.3系統(tǒng)的實(shí)現(xiàn)算法用戶信息初始化算法 通過(guò)前面幾章的分析,我們已經(jīng)知道用戶信息是求職聘請(qǐng)導(dǎo)航的根底。由用戶模型可以了解,個(gè)人信息是用戶登陸共性化網(wǎng)上人才聘請(qǐng)系統(tǒng)的入口;求職聘請(qǐng)記錄那么是依據(jù)用戶的求職聘請(qǐng)進(jìn)度動(dòng)態(tài)更新供給內(nèi)容、求職聘請(qǐng)狀態(tài)提示的必要條件。所以設(shè)計(jì)好用戶信息輸入算法對(duì)后面的智能導(dǎo)航有著重要作用。用戶信息是在第一次使用系統(tǒng)注冊(cè)時(shí)輸入的。該算法中牽涉的數(shù)據(jù)有:用戶數(shù)據(jù)庫(kù)中的用戶信息管理
41、表、職位信息表。算法主要功能是通過(guò)接收用戶輸入或選擇的信息初始化用戶模塊中有關(guān)信息,以下便是該算法所涉及的數(shù)據(jù)結(jié)構(gòu)和具體過(guò)程。輸入:1用戶輸入的信息,如姓名,密碼等。 2用戶選擇的信息,如用戶求職聘請(qǐng)狀態(tài)等。輸出:用戶模塊信息初始化。算法的主要步驟如下:(1)初始化,包括翻開(kāi)數(shù)據(jù)庫(kù)aa_user、建立相關(guān)控件與數(shù)據(jù)庫(kù)的連接等;(2)將用戶信息管理表、用戶狀態(tài)表各添加一條記錄;(3)讀取各文本控件或列表控件中用戶輸入或選擇的信息到各表中對(duì)應(yīng)的字段中;(4)結(jié)束。檢索算法用戶翻開(kāi)網(wǎng)頁(yè)后在文本框中輸入關(guān)鍵字進(jìn)行搜尋,系統(tǒng)將依據(jù)用戶輸入的關(guān)鍵字進(jìn)行搜尋,并返回和關(guān)鍵字相關(guān)的信息,假設(shè)用戶輸入的是多關(guān)鍵
42、字系統(tǒng)將對(duì)用戶輸入的關(guān)鍵字進(jìn)行拆分,然后搜尋全部含有相關(guān)信息的記錄返回給用戶界面:(1) 用戶關(guān)鍵字,并進(jìn)行提交;(2) 從提交表單中提取數(shù)據(jù),并進(jìn)行相應(yīng)推斷;(3) 連接數(shù)據(jù)庫(kù),建立記錄集,用查詢語(yǔ)句對(duì)表中數(shù)據(jù)進(jìn)行查詢;(4) 將結(jié)果進(jìn)行加工顯示給用戶;(5) 結(jié)束;算法流程圖如圖4.3所示:開(kāi)頭開(kāi)頭初始化系統(tǒng)輸入關(guān)鍵字并提交推斷用戶輸入,假設(shè)為多關(guān)鍵字那么進(jìn)行拆分依據(jù)關(guān)鍵字查詢數(shù)據(jù)庫(kù)返回查詢結(jié)果并進(jìn)行加工將加工后的結(jié)果顯示到用戶界面圖4.3 搜尋算法流程圖 4.4注冊(cè)模塊的設(shè)計(jì)與實(shí)現(xiàn)在本系統(tǒng)中,將會(huì)有一些公用頁(yè)面,即每個(gè)文件或局部文件都會(huì)用到的文件,在使用這些文件時(shí),只需要一個(gè)包含語(yǔ)句&l
43、t;?php include “filename;?>即可,這樣大大削減了代碼的冗余,同時(shí)也使編碼簡(jiǎn)潔,削減了很多工作量。主要的公用文件包括:conn.php文件、logout.php文件、is_login.php等。(1)conn.php 文件對(duì)于程序中建立數(shù)據(jù)庫(kù)連接和關(guān)閉數(shù)據(jù)庫(kù)連接的操作,最好放在一個(gè)包含文件中,這樣便于維護(hù)和修改。前面一局部為建立數(shù)據(jù)庫(kù)連接的語(yǔ)句,其中mysql_connect為建立數(shù)據(jù)庫(kù)連接的對(duì)象,mysql_select_db為數(shù)據(jù)庫(kù)連接字符串,它說(shuō)明白數(shù)據(jù)庫(kù)連接的物理路徑以及接受的數(shù)據(jù)庫(kù)類型,這里接受的是MySQL數(shù)據(jù)庫(kù)。<?php$host="
44、;localhost"$user="root"$password="123456"$db="aa"/連接效勞器mysql_connect($host,$user,$password) or die("SORRY! 鏈接效勞器失??!");/鏈接數(shù)據(jù)庫(kù)mysql_select_db($db) or die ("SORRY! 翻開(kāi)數(shù)據(jù)庫(kù)失??!");mysql_query("SET NAMES 'gb2312'");?> (2)is_login.php
45、 文件is_login.php是用戶權(quán)限驗(yàn)證文件,便利調(diào)用和維護(hù)削減代碼冗余。(3)logout.php 文件logout.php文件是用戶退出文件,改文件用于關(guān)閉和刪除用戶SESSION。其他一些公用文件的代碼這里將不一一列舉。系統(tǒng)公用頁(yè)面用戶注冊(cè)頁(yè)面用戶注冊(cè)界面如圖4.4所示。用戶必需填寫(xiě)以下內(nèi)容,這便于對(duì)用戶的管理以及用戶的平安性。用戶注冊(cè)頁(yè)面的信息是用戶進(jìn)入系統(tǒng)的有利憑證。該頁(yè)面涉及的主要PHP文件為register.php文件。圖4.4注冊(cè)頁(yè)面<?phpinclude "admin/conn.php"require "admin/injection
46、.php"?><html><head><!-author:STONE(QQ:822854153)blog: :/blog.163 /scbzzl/time:2021.09.09version 1.0-><meta -equiv="Content-Type" content="text/html; charset=gb2312" /><title>用戶注冊(cè)</title><script language=javascript>var DS_x,DS_y;fu
47、nction dateSelector() /構(gòu)造dateSelector對(duì)象,用來(lái)實(shí)現(xiàn)一個(gè)日歷形式的日期輸入框。 var myDate=new Date(); this.year=myDate.getFullYear(); /定義year屬性,年份,默認(rèn)值為當(dāng)前系統(tǒng)年份。 this.month=myDate.getMonth()+1; /定義month屬性,月份,默認(rèn)值為當(dāng)前系統(tǒng)月份。 this.date=myDate.getDate(); /定義date屬性,日,默認(rèn)值為當(dāng)前系統(tǒng)的日。 this.inputName='' /定義inputName屬性,即輸入框的name,默
48、認(rèn)值為空。留意:在同一頁(yè)中消滅多個(gè)日期輸入框,不能有重復(fù)的name! this.display=display; /定義display方法,用來(lái)顯示日期輸入框。function display() /定義dateSelector的display方法,它將實(shí)現(xiàn)一個(gè)日歷形式的日期選擇框。 var week=new Array('日','一','二','三','四','五','六'); document.write("<style type=text/css>&quo
49、t;); document.write(" .ds_font td,span font: normal 12px 宋體; color: #000000; "); document.write(" .ds_border border: 1px solid #000000; cursor: hand; background-color: #DDDDDD "); document.write(" .ds_border2 border: 1px solid #000000; cursor: hand; background-color: #DDDDDD
50、 "); document.write("</style>"); document.write("<input style='text-align:center;' id='DS_"+this.inputName+"' name='"+this.inputName+"' value='"+this.year+"-"+this.month+"-"+this.date+"' ti
51、tle=雙擊可進(jìn)行編緝 ondblclick='this.readOnly=false;this.focus()' onblur='this.readOnly=true' readonly>"); document.write("<button style='width:60px;height:18px;font-size:12px;margin:1px;border:1px solid #A4B3C8;background-color:#DFE7EF;' type=button onclick=this.next
52、Sibling.style.display='block' onfocus=this.blur()>選擇日期</button>"); document.write("<div style='position:absolute;display:none;text-align:center;width:0px;height:0px;overflow:visible' onselectstart='return false;'>"); document.write(" <div
53、 style='position:absolute;left:-60px;top:20px;width:142px;height:165px;background-color:#F6F6F6;border:1px solid #245B7D;' class=ds_font>"); document.write(" <table cellpadding=0 cellspacing=1 width=140 height=20 bgcolor=#CEDAE7 onmousedown='DS_x=event.x-parentNode.style.
54、pixelLeft;DS_y=event.y-parentNode.style.pixelTop;setCapture();' onmouseup='releaseCapture();' onmousemove='dsMove(this.parentNode)' style='cursor:move;'>"); document.write(" <tr align=center>"); document.write(" <td width=12% onmouseover=th
55、is.className='ds_border' onmouseout=this.className='' onclick=subYear(this) title='減小年份'><<</td>"); document.write(" <td width=12% onmouseover=this.className='ds_border' onmouseout=this.className='' onclick=subMonth(this) title='
56、;減小月份'><</td>"); document.write(" <td width=52%><b>"+this.year+"</b><b>年</b><b>"+this.month+"</b><b>月</b></td>"); document.write(" <td width=12% onmouseover=this.className='ds_b
57、order' onmouseout=this.className='' onclick=addMonth(this) title='增加月份'>></td>"); document.write(" <td width=12% onmouseover=this.className='ds_border' onmouseout=this.className='' onclick=addYear(this) title='增加年份'>>><
58、/td>"); document.write(" </tr>"); document.write(" </table>"); document.write(" <table cellpadding=0 cellspacing=0 width=140 height=20 onmousedown='DS_x=event.x-parentNode.style.pixelLeft;DS_y=event.y-parentNode.style.pixelTop;setCapture();' onmouseup='releaseCapture();' onmousemove='dsMove(this.parentNode)' style='cursor:move;'>
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年貨車從業(yè)資格證答題軟件
- 2024-2025學(xué)年四年級(jí)語(yǔ)文上冊(cè)第二單元明月4走月亮作業(yè)設(shè)計(jì)北師大版
- 個(gè)人前臺(tái)自我總結(jié)
- 獨(dú)家合作協(xié)議范本
- 個(gè)人下半年主題計(jì)劃書(shū)
- 公司年終人力資源工作總結(jié)
- 五年級(jí)上冊(cè)語(yǔ)文教學(xué)計(jì)劃
- 水電安裝勞務(wù)承包合同范本
- 監(jiān)控租賃合同范本
- 臨聘人員勞動(dòng)合同范本
- 2025年電力鐵塔市場(chǎng)分析現(xiàn)狀
- GB 12158-2024防止靜電事故通用要求
- 2025-2030年中國(guó)清真食品行業(yè)運(yùn)行狀況及投資發(fā)展前景預(yù)測(cè)報(bào)告
- 中國(guó)服裝零售行業(yè)發(fā)展環(huán)境、市場(chǎng)運(yùn)行格局及前景研究報(bào)告-智研咨詢(2025版)
- 臨床提高膿毒性休克患者1h集束化措施落實(shí)率PDCA品管圈
- 中國(guó)工運(yùn)史知識(shí)競(jìng)答附答案
- 瑞幸咖啡SWOT分析
- DL∕T 1867-2018 電力需求響應(yīng)信息交換規(guī)范
- 小學(xué)生品德發(fā)展水平指標(biāo)評(píng)價(jià)體系(小學(xué))
- 水利工程地震應(yīng)急預(yù)案
- 日歷表空白每月打印計(jì)劃表
評(píng)論
0/150
提交評(píng)論