人工智能結(jié)果論文報(bào)告_第1頁(yè)
人工智能結(jié)果論文報(bào)告_第2頁(yè)
人工智能結(jié)果論文報(bào)告_第3頁(yè)
人工智能結(jié)果論文報(bào)告_第4頁(yè)
人工智能結(jié)果論文報(bào)告_第5頁(yè)
已閱讀5頁(yè),還剩1頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

PAGE2人工智能結(jié)課報(bào)告學(xué)院:信息工程與自動(dòng)化學(xué)院專業(yè):計(jì)算機(jī)科學(xué)與技術(shù)教師:年級(jí):班級(jí):姓名:學(xué)號(hào):人工智能結(jié)果論文報(bào)告移動(dòng)Web搜索研究ResearchonMobileWebSearch摘要:隨著3G時(shí)代的到來(lái)和Web資源的飛速增長(zhǎng),移動(dòng)互聯(lián)網(wǎng)呈現(xiàn)出快速發(fā)展的趨勢(shì),人們可以利用移動(dòng)終端設(shè)備便捷地訪問(wèn)網(wǎng)絡(luò),從中獲取用戶想要信息。然而如何對(duì)Web資源進(jìn)行地理標(biāo)記,并將地理數(shù)據(jù)與Web數(shù)據(jù)進(jìn)行無(wú)縫集成,為移動(dòng)用戶提供有價(jià)值的高度相關(guān)的信息,卻都是十分具有挑戰(zhàn)性的技術(shù)研究。我學(xué)習(xí)了這一篇文章,《移動(dòng)Web搜索研究》提出了一個(gè)移動(dòng)Web搜索的系統(tǒng)框架,該框架對(duì)移動(dòng)Web搜索領(lǐng)域關(guān)鍵性技術(shù)進(jìn)行了分類概括總結(jié)。在對(duì)已有技術(shù)進(jìn)行深入對(duì)比分析的基礎(chǔ)上,指出了該領(lǐng)域未來(lái)的研究工作和面臨的挑戰(zhàn),具有深遠(yuǎn)的認(rèn)識(shí)和影響。應(yīng)用價(jià)值:隨著移動(dòng)通信和Internet在人們?nèi)粘I钪械娜找嫫占啊⒁苿?dòng)通信帶寬的大幅度提高以及移動(dòng)終端功能的逐漸增強(qiáng),傳統(tǒng)的服務(wù)已經(jīng)不能滿足用戶多元化的需求,人們希望隨時(shí)隨地訪問(wèn)互聯(lián)網(wǎng)上的服務(wù),從中獲取豐富的信息。移動(dòng)互聯(lián)網(wǎng)實(shí)現(xiàn)了Web和移動(dòng)通信的逐步融合,加入了移動(dòng)性、位置可確定性、終端個(gè)人化等固有屬性,使其成為產(chǎn)業(yè)界備受關(guān)注的領(lǐng)域,同時(shí)也帶來(lái)了許多新的挑戰(zhàn)。在移動(dòng)環(huán)境下,根據(jù)移動(dòng)用戶的需求,準(zhǔn)確地標(biāo)記Web資源的地理位置,并將用戶上下文信息(比如位置、時(shí)間等)與Web中的數(shù)據(jù)結(jié)合起來(lái)去回答提出的搜索,在此基礎(chǔ)上進(jìn)行高效的面向移動(dòng)用戶的查詢處理,獲得高度精確的滿足用戶需求的結(jié)果,從而為用戶提供精確便利的服務(wù),都具有非常重要的研究?jī)r(jià)值,為3G時(shí)代下的移動(dòng)Web搜索提供了一條新道路,具有十分廣闊的應(yīng)用前景和市場(chǎng)價(jià)值。必將成為業(yè)界的頂尖技術(shù)和研究項(xiàng)目。難點(diǎn):通過(guò)查詢各種資料,我了解到移動(dòng)Web搜索研究還處于起步階段,在地理標(biāo)記Web資源、混合索引的構(gòu)建、面向移動(dòng)用戶的查詢處理方法、相關(guān)排名技術(shù)以及查詢結(jié)果的處理與可視化等主要技術(shù)都只處于理論性研究,考慮到用戶終端設(shè)備和用戶所在區(qū)域的各異性,加入了移動(dòng)性、位置不可確定性、終端個(gè)人化等因素,使得移動(dòng)Web搜索的發(fā)展和推廣存在巨大障礙,更多的技術(shù)細(xì)節(jié)還有待學(xué)習(xí)和研究。收獲:經(jīng)過(guò)這段時(shí)間的學(xué)習(xí),我知道移動(dòng)Web搜索是以移動(dòng)網(wǎng)絡(luò)為數(shù)據(jù)傳輸承載,將分布在傳統(tǒng)互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)上的數(shù)據(jù)信息進(jìn)行搜集整理,供手機(jī)用戶查詢的業(yè)務(wù)。移動(dòng)搜索是搜索技術(shù)與移動(dòng)通信技術(shù)的一種結(jié)合體,融合了兩種技術(shù)各自的特點(diǎn)。移動(dòng)搜索的出現(xiàn)真正打破了地域、網(wǎng)絡(luò)的局限性,滿足了手機(jī)用戶隨時(shí)隨地的搜索服務(wù)請(qǐng)求。不僅具有傳統(tǒng)搜索引擎的頁(yè)面、圖片、新聞搜索功能,而且移動(dòng)搜索可以使用定位功能自動(dòng)定位出用戶當(dāng)前的位置,當(dāng)用戶使用本地搜索時(shí),搜索結(jié)果中會(huì)融入用戶的位置信息,可以實(shí)時(shí)地獲得更加準(zhǔn)確、實(shí)用的信息。此外,移動(dòng)版的即時(shí)瀏覽功能可以進(jìn)行直觀的比較搜索結(jié)果與網(wǎng)頁(yè)預(yù)覽等,我也感覺(jué)到自己專業(yè)與這一研究領(lǐng)域的相關(guān)度,日后會(huì)更加關(guān)注和學(xué)習(xí)移動(dòng)Web搜索的相關(guān)知識(shí)。綜述:移動(dòng)Web搜索一直是我最感興趣和想了解的技術(shù)。從小就一直接觸手機(jī),可是以前的手機(jī)只能打電話和發(fā)短信,還有基本的單一功能,如音樂(lè)播放器、相機(jī)、視頻播放器等??珊髞?lái)的新型手機(jī)功能更加強(qiáng)大,加入了很多功能,如QQ、飛信、MSN等網(wǎng)絡(luò)通信功能。通過(guò)自己的專業(yè)學(xué)習(xí),我對(duì)電子網(wǎng)絡(luò)更加感興趣。而且隨著3G時(shí)代的到來(lái),越來(lái)越多的用戶使用移動(dòng)終端就能夠便捷地訪問(wèn)網(wǎng)絡(luò)。根據(jù)中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心發(fā)表的最新報(bào)告,手機(jī)網(wǎng)民數(shù)已達(dá)4億,并呈直線上升趨勢(shì)。而移動(dòng)Web搜索是用戶在訪問(wèn)網(wǎng)絡(luò)時(shí)最經(jīng)常進(jìn)行的活動(dòng)之一。在日常生活中,我們隨處可見(jiàn)人們?cè)谟弥謾C(jī),不僅僅是打電話和發(fā)短信,人們還用移動(dòng)設(shè)備查詢各種他們需要的信息民。人們經(jīng)常會(huì)碰到很多“NowandHere”的問(wèn)題,需要查詢與其正在進(jìn)行的活動(dòng)相關(guān)的信息,如:我要找的地方位于什么位置?附近有沒(méi)有比較好的吃晚餐的地方?現(xiàn)在有一些什么優(yōu)惠活動(dòng)?電影院現(xiàn)在正在放映什么電影,離自己位置最近的影院有無(wú)剩余的票?我需要停車,現(xiàn)在最近的有停車位的停車場(chǎng)在哪里?怎么乘車才能到達(dá)自己想去的地方等等。由以上問(wèn)題可以看出,人們使用移動(dòng)設(shè)備搜索時(shí)大多數(shù)需求都與位置密切相關(guān),很多人都會(huì)有相同的處境,那就是自己開(kāi)車到別的地方(城市)去,手拿著地圖,卻不知道自己在什么位置,人們都會(huì)想要是手機(jī)能搜索到電子地圖且能標(biāo)出自己所處位置就好了。但傳統(tǒng)的搜索引擎僅僅利用純粹的文本搜索,用戶往往不能獲得理想的查詢結(jié)果.此外,與傳統(tǒng)互聯(lián)網(wǎng)搜索環(huán)境相比,移動(dòng)終端受到屏幕尺寸小、網(wǎng)絡(luò)帶寬有限等限制,這些不同點(diǎn)為新環(huán)境下移動(dòng)Web搜索帶來(lái)了許多新的機(jī)遇和挑戰(zhàn)。我也是大眾中的一員,也深深的體會(huì)到其帶來(lái)的便利。出于興趣和好奇,我開(kāi)始向這一領(lǐng)域了解學(xué)習(xí)。因?yàn)閯傞_(kāi)始了解,我憑自己的專業(yè)常識(shí),從理論到實(shí)踐的過(guò)程,我查閱了很多相關(guān)的書(shū)集和資料,從最初的《移動(dòng)Web實(shí)現(xiàn)指南:面向移動(dòng)設(shè)備的網(wǎng)站優(yōu)化、開(kāi)發(fā)和設(shè)計(jì)》提供了很多實(shí)例,學(xué)習(xí)起來(lái)不是那么難,但在于很多的專業(yè)名詞不理解,只好半知半解的看了些,至今都還沒(méi)看完。后來(lái)我又在網(wǎng)上看到了《智能手機(jī)Web標(biāo)準(zhǔn)開(kāi)發(fā)實(shí)戰(zhàn):為iPhone、Android、PalmPre、BlackBerry、WindowsMobile及NokiaS60開(kāi)發(fā)通用的基于Javascript、CSS、HTML和Ajax的Web應(yīng)用(移動(dòng)與嵌入式開(kāi)發(fā)技術(shù))》的書(shū),看了簡(jiǎn)介感覺(jué)這本書(shū)比前一本要實(shí)用,且較容易理解。我花了30元買翻譯過(guò)的中文版,在自己的專業(yè)水平上看了一些,如Javascript、CSS、HTML代碼等,還是從中學(xué)到了很多不知道的程序知識(shí)。雖然看了些書(shū)和資料,我還是不明白它們其中的真正技術(shù)。之后我又在計(jì)算機(jī)學(xué)報(bào)中搜集到《移動(dòng)Web搜索研究》的剘刊,現(xiàn)在讀完了這一文章。雖然文章講的不是具體的實(shí)現(xiàn)技術(shù),但其中分析中很多關(guān)于移動(dòng)Web搜索的概念及其特點(diǎn),移動(dòng)Web搜索的整體流程及相關(guān)技術(shù)和關(guān)鍵技術(shù)的分析。其中提到了IR-tree算法,和我所學(xué)過(guò)的樹(shù)的相關(guān)算法很相似。這也是我讀完這文章后最大的收獲,就是能完全的理解IR-tree算法。其中還講了幾種算法的時(shí)間復(fù)雜度和空間復(fù)雜度,從用戶角度出發(fā),分析了從用戶開(kāi)始搜索到系統(tǒng)運(yùn)行,再到系統(tǒng)響應(yīng)用戶的過(guò)程,來(lái)講解移動(dòng)Web搜索的整個(gè)過(guò)程。使我讀完這一文章之后,能夠?qū)σ苿?dòng)Web搜索有一個(gè)完整的思路,學(xué)習(xí)起來(lái)也很多容易,且記憶牢固、長(zhǎng)久。分析:在之前在學(xué)習(xí)和讀完《移動(dòng)Web搜索研究》文章之后,我對(duì)移動(dòng)Web搜索有了一個(gè)經(jīng)較完整的思維架構(gòu)。特別是在閱讀完《移動(dòng)Web搜索研究》這一文章之后,我更明確了移動(dòng)Web搜索的整個(gè)流程,主要分為兩個(gè)過(guò)程:(1)移動(dòng)客戶端通過(guò)Internet訪問(wèn)Web服務(wù)器,通過(guò)連接GPS設(shè)備獲取當(dāng)前位置坐標(biāo)。當(dāng)用戶提交一個(gè)基于關(guān)鍵字的查詢時(shí),如果想要獲得本地信息,需將用戶自己的位置信息附在提交的查詢中一起傳遞給Web服務(wù)器,否則直接將用戶自己的查詢提交給服務(wù)器進(jìn)行處理。(2)服務(wù)器檢索到相關(guān)的信息并將結(jié)果返回給移動(dòng)客戶端,然后顯示給用戶。移動(dòng)Web搜索流程大體如下圖:之所心將整個(gè)流程分成兩部分主要有以下的優(yōu)點(diǎn):客戶端僅僅需要顯示處理得到的結(jié)果,并不需要在大型數(shù)據(jù)庫(kù)中做過(guò)多的過(guò)濾和搜索工作。這使得該系統(tǒng)可以運(yùn)行在具有低處理能力的設(shè)備上,而讓服務(wù)器端做大多數(shù)重量級(jí)的工作,使整個(gè)流程簡(jiǎn)單化?!兑苿?dòng)Web搜索研究》文章中提出的框架被劃分為4個(gè)模塊:數(shù)據(jù)收集模塊、預(yù)處理模塊、索引模塊、搜索模塊。這四個(gè)模塊中,包含很多移動(dòng)Web搜索關(guān)鍵技術(shù),比如地理標(biāo)記Web資源、混合索引的構(gòu)建、面向移動(dòng)用戶的查詢處理、查詢結(jié)果的處理與可視化等。而地理標(biāo)記Web資源對(duì)于移動(dòng)Web搜索是最重要的部分,一方面,許多與地理相關(guān)的興趣點(diǎn),比如商店、旅游景點(diǎn)、餐館、娛樂(lè)服務(wù)、公共交通等都與描述性文本相關(guān)聯(lián);另一方面,Web文檔顯式或隱式地包含地理信息,地理位置和文本文檔的集成使得查詢不僅要考慮位置相近性,還需要考慮文本相關(guān)性。其中又包括眾多的小模塊,如地名識(shí)別、地名分辨、地理聚焦點(diǎn)的確定等。查找出文檔所覆蓋的地理區(qū)域,目前已提出了多種方法,文章中提到Web-a-Where使用層次本體確定地理聚焦點(diǎn),在層次結(jié)構(gòu)中分辨出來(lái)的每一個(gè)地名為其父節(jié)點(diǎn)貢獻(xiàn)分值,然后選擇分值最高的本體節(jié)點(diǎn)作為該文檔的地理聚焦點(diǎn)。但該方法不能處理包含有多個(gè)地理聚焦點(diǎn)的文檔。另外一種普遍使用的策略是選擇出現(xiàn)頻度最高的地名作為地理聚焦點(diǎn)。都沒(méi)辦法達(dá)到完美,這仍是一項(xiàng)技術(shù)難題。在以上的基礎(chǔ)上,就到服務(wù)器索引相關(guān)的文檔的過(guò)程。說(shuō)索引,目前已有很多搜索方法,而在移動(dòng)環(huán)境中,移動(dòng)性與位置相關(guān)性使得移動(dòng)Web搜索需要同時(shí)考慮文本信息和位置信息。此外,位置信息額外增加了CPU和存儲(chǔ)的開(kāi)銷,使得對(duì)建立以文本和地理位置為基礎(chǔ)的高效索引要求很多高。我們都知道普通的文本搜索索引是面向集合的,主要索引技術(shù)有倒排文件、位圖、簽名文件等。而位置信息是面向二維空間的,主要索引技術(shù)有R-tree、R*-tree、四分樹(shù)、網(wǎng)格。在《移動(dòng)Web搜索研究》文章中研究者提出了一種高效的索引存儲(chǔ)結(jié)構(gòu)―――QUOTE-tree(informationretrievalR-tree),它是以R-tree為基礎(chǔ),并將R-tree和簽名文件相結(jié)合組成的一種混合索引。在該結(jié)構(gòu)節(jié)點(diǎn)中的每一項(xiàng)包含兩部分信息:空間信息和關(guān)鍵字信息,前者用最小邊界區(qū)域表示,后者用簽名文件表示。IR2-tree的葉子節(jié)點(diǎn)中每一項(xiàng)用三元組(A,N,S)表示,其中,A和N定義在R-tree中,N表示節(jié)點(diǎn)的邊界區(qū)域;S是A所指向?qū)ο髮?duì)應(yīng)的簽名文件。在非葉子節(jié)點(diǎn)中,每一項(xiàng)用三元組(A,N,S)表示,S是簽名文件。一個(gè)節(jié)點(diǎn)的簽名是該節(jié)點(diǎn)所有項(xiàng)簽名的疊加,就相當(dāng)于以該節(jié)點(diǎn)為根的子樹(shù)中所有文檔簽名的疊加。QUOTE-tree采用插入和刪除操作對(duì)索引進(jìn)行維護(hù),是R-tree相應(yīng)操作的修改和擴(kuò)充。都采用樹(shù)的相關(guān)遍歷加以實(shí)現(xiàn),這也讓我想起了樹(shù)的深度優(yōu)先遍歷和廣度優(yōu)先遍歷的兩種算法。而由于IR-tree在構(gòu)造過(guò)程中僅考慮了位置信息,為了進(jìn)一步提高查詢處理的各種性能,又想到對(duì)IR-tree進(jìn)行擴(kuò)展。也有研究者提出了一種稱為DIR-tree的混合索引結(jié)構(gòu),這種索引在構(gòu)造的過(guò)程中綜合考慮位置信息和文本相似度,IR-tree可以看作是DIR-tree的一種特殊情況。但DIR-tree混合索引結(jié)構(gòu)我至今弄不明白是怎么回事,也沒(méi)有更多的中文資料詮釋它,而我自己的英語(yǔ)水平又不高,對(duì)于英文資料的閱讀理解相當(dāng)困難,且也沒(méi)有那么多時(shí)間去查詢翻譯。此外還提到很多混合索引結(jié)構(gòu),例如bR*-tree、Light-Weighted索引結(jié)構(gòu)。bR*-tree、Light-Weighted索引都使用距離互斥和關(guān)鍵字互斥、加速剪枝的剪枝策略,所不同的是前者基于先驗(yàn)的搜索策略,而后者是用自底向上先驗(yàn)搜索策略。在對(duì)搜索完成后,就是搜索結(jié)果排序部分了。結(jié)果排序是搜索技術(shù)中最關(guān)鍵的部分之一,排序策略和誹序算法決定了排序效果的優(yōu)劣。移動(dòng)設(shè)備由于自身的特點(diǎn)只能為用戶提供較小的顯示區(qū)域,無(wú)法瀏覽大量的信息,如果用戶被淹沒(méi)于大量查詢結(jié)果中,會(huì)導(dǎo)致用戶的滿意度下降。對(duì)檢索結(jié)果的排序需要綜合考慮多個(gè)因素對(duì)排序的影響,有文本信息、位置信息和周圍環(huán)境等。目前,已有的對(duì)地理和文本排序進(jìn)行整合方法的的研究相對(duì)較少,在《移動(dòng)Web搜索研究》文章中主要采用的是與查詢關(guān)鍵字、位置信息相似度和相關(guān)性的高低順序排序。此外,在文章中還提到另一種排序方法,可惜的是文章只理論性講解,查詢結(jié)果按照排名函數(shù)f(distance(o.loc,Q.loc),IRscore(o.doc,Q.keywords))進(jìn)行排序。其中,(0,1),用來(lái)權(quán)衡空間相近性和文本相關(guān)性所占的比重;D(Q.loc;o.loc)表示Q和o之間的歐幾里德距離;maxD是數(shù)據(jù)庫(kù)D中兩個(gè)對(duì)象之間的最大距離,用來(lái)對(duì)距離進(jìn)行歸一化處理;文本相關(guān)性使用語(yǔ)言模型進(jìn)行計(jì)算,maxP用來(lái)對(duì)文本進(jìn)行歸一化處理。由于移動(dòng)設(shè)備固有的一些局限(比如屏幕小、電量有限、與用戶的交互能力較差等),已有的Web搜索信息發(fā)現(xiàn)機(jī)制并不適合移動(dòng)環(huán)境下查詢結(jié)果的可視化。在《移動(dòng)Web搜索研究》文章中提到多種查詢結(jié)果處理與可視化的方法,主要有基于摘要的方法、單列方法、和Fisheye可視化方法等。在多種查詢結(jié)果處理與可視化的方法中,各有優(yōu)缺點(diǎn),而在我看來(lái),這里的方法可以跟據(jù)客戶端的設(shè)備來(lái)選擇,這樣就可以滿足不同用戶的要求,也減少了系統(tǒng)響應(yīng)時(shí)間,從而達(dá)到移動(dòng)Web搜索最佳

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論