網(wǎng)絡(luò)圖像檢索提問式調(diào)整行為研究_第1頁
網(wǎng)絡(luò)圖像檢索提問式調(diào)整行為研究_第2頁
網(wǎng)絡(luò)圖像檢索提問式調(diào)整行為研究_第3頁
網(wǎng)絡(luò)圖像檢索提問式調(diào)整行為研究_第4頁
網(wǎng)絡(luò)圖像檢索提問式調(diào)整行為研究_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、    網(wǎng)絡(luò)圖像檢索提問式調(diào)整行為研究    摘要:通過網(wǎng)絡(luò)圖像檢索實驗,采集用戶進(jìn)行圖像搜索任務(wù)時的提問式及其變化序列,并進(jìn)行小規(guī)模實證。通過內(nèi)容編碼和統(tǒng)計分析發(fā)現(xiàn):圖像檢索提問調(diào)整絕大多數(shù)與內(nèi)容調(diào)整有關(guān),縮檢、擴(kuò)檢、平移和跟隨系統(tǒng)相關(guān)搜索詞是發(fā)生最頻繁的四類主要提問調(diào)整行為,用戶在圖像檢索時表現(xiàn)出從寬泛檢索入手,逐步縮小范圍的行為趨向;就圖像提問調(diào)整模式而言,有四種基本模式和四種混合模式,各有特點;網(wǎng)絡(luò)圖像檢索的演進(jìn)性偏于一種自演進(jìn),而現(xiàn)有圖像檢索系統(tǒng)對交互式演進(jìn)的支持明顯不足。圖1。表2。參考文獻(xiàn)7。關(guān)鍵詞:圖像檢索,提問式,檢索需求,用戶行為1

2、引言網(wǎng)絡(luò)信息搜索過程是一個重復(fù)迭代的過程,雖然用戶竭力選擇合適的檢索提問詞,但未必能夠獲得理想結(jié)果。在網(wǎng)絡(luò)圖像檢索情境中,由于圖像理解和表達(dá)的模糊性和多維性,圖像檢索需求表達(dá)的障礙可能更大,發(fā)生在圖像檢索過程中提問式的調(diào)整則更為頻繁。針對檢索過程中提問式的調(diào)整和變換行為開展研究,有助于揭示圖像檢索需求表達(dá)的行為特征,探索圖像檢索過程的演進(jìn)機(jī)制,發(fā)現(xiàn)圖像檢索的行為模式或規(guī)律?;诖?,本文設(shè)計了網(wǎng)絡(luò)圖像檢索的用戶實驗來探索圖像檢索提問調(diào)整中的行為模式和相關(guān)規(guī)律。具體做法是:隨機(jī)征集30名日常生活中有網(wǎng)絡(luò)圖像檢索體驗的大學(xué)生作為被試,專業(yè)分布廣泛;在某大學(xué)的網(wǎng)絡(luò)實驗室環(huán)境下,要求被試完成三個不同類型

3、的網(wǎng)絡(luò)圖像檢索任務(wù),不限定搜索任務(wù)完成時間,搜索過程利用“屏幕錄像專家”軟件錄制成視頻1。實驗開始前,進(jìn)行10分鐘關(guān)于視頻軟件使用的培訓(xùn);研究人員幫助并確保每個被試正確設(shè)置了相應(yīng)技術(shù)參數(shù)和保存路徑;清空ie瀏覽器的歷史記錄和收藏夾,以避免受前一位搜索者行為的影響。實驗結(jié)束后,對被試進(jìn)行問卷調(diào)查和訪談。訪談主要是針對完成任務(wù)特別快(小于5分鐘)和特別慢(大于15分鐘)的兩類被試,訪談問題是“您為什么選擇××提問式”。最終通過人工對視頻樣本逐一進(jìn)行內(nèi)容采集,共采集到88個行為樣本中的圖像檢索提問式648個,同時記錄下這些檢索提問式的時間先后次序及各時間點。數(shù)據(jù)分析階段主要是提問

4、式編碼和統(tǒng)計分析。為了降低提問式編碼的主觀誤差,研究者基于統(tǒng)一的編碼框架,隔了一個月后對所有提問式調(diào)整行為樣本又進(jìn)行了一次編碼,對照兩次編碼結(jié)果,對不一致的編碼進(jìn)行必要的重新分析,并對編碼框架進(jìn)行了必要的合并和調(diào)整,提高編碼的一致性和客觀性。統(tǒng)計分析主要采用描述性統(tǒng)計和基于案例的歸納。實驗后問卷調(diào)查的數(shù)據(jù)將用于后續(xù)研究中關(guān)于網(wǎng)絡(luò)圖像檢索行為影響因素的分析,本文暫未觸及。2 圖像檢索提問式調(diào)整的分析框架國內(nèi)外相關(guān)研究給出了一些關(guān)于信息搜索提問調(diào)整分析的框架案例:jörgensen等分析圖像搜索的提問式調(diào)整時,重點考察了三類調(diào)整行為2:增加提問詞、減少提問詞、改變提問詞。改變提問詞包括諸

5、多情況,如轉(zhuǎn)移到相關(guān)提問詞、單復(fù)數(shù)改變、反義詞調(diào)整、順序調(diào)整等。rieh和xie在以excite搜索引擎2000年9月搜索日志為數(shù)據(jù)樣本分析提問式調(diào)整模式時,提出了關(guān)于文本檢索提問式調(diào)整行為分析的三大類九小類分析框架3。三大類分為:內(nèi)容類調(diào)整、格式類調(diào)整和資源類調(diào)整。其中內(nèi)容類調(diào)整包括:縮檢、擴(kuò)檢、同義詞替換、平移四個子類;格式類調(diào)整包括術(shù)語調(diào)整、操作符運用、錯誤糾正三個子類;資源類調(diào)整包括資源類型限定和網(wǎng)站域名限定兩個子類。yoon在關(guān)于圖像檢索不同階段提問式調(diào)整規(guī)律的研究中4,借鑒了rieh和xie的分析框架,將圖像搜索提問式的調(diào)整行為分為兩大類:內(nèi)容類和格式類。內(nèi)容類的子類又分為縮檢、擴(kuò)

6、檢、同義詞替換、增加同義詞、平移、要求額外結(jié)果、中斷、重復(fù)使用已用過的提問式等8個子類。我國學(xué)者賴茂生等在分析網(wǎng)絡(luò)用戶的文本查詢與點擊行為時5,數(shù)據(jù)分析過程中一共識別出7種調(diào)整提問式的方法:改換檢索工具、句法調(diào)整、擴(kuò)檢、縮檢、點擊提示詞、新檢索、修改與調(diào)整。其中涉及檢索工具調(diào)整1種、句法調(diào)整1種和語義調(diào)整5種。借鑒文本檢索提問式研究的經(jīng)驗,并結(jié)合圖像搜索過程自身的特點,我們共識別出三大類12個子類的圖像提問式調(diào)整類型,并進(jìn)行相應(yīng)編碼(見表1)。表1 圖像檢索提問式調(diào)整類型調(diào)整類別子類編碼示例內(nèi)容調(diào)整縮檢,提問式改變的效果縮小了檢索結(jié)果的范圍。方式有增加提問詞,或者用內(nèi)涵更窄的詞來替換。s老虎

7、華南虎運動 體育運動擴(kuò)檢,提問式改變的效果擴(kuò)大了檢索結(jié)果的范圍。方式有減少提問詞,或者用內(nèi)涵更寬泛的詞來替換。g兩只老虎 老虎一樽還酹江月 江月同義詞替換,用同義詞替換先前的詞。y老虎打架 老虎打斗平移,提問式有明顯調(diào)整,含義上沒有縮小或擴(kuò)大,調(diào)整前后的提問詞含義上有部分重疊,或反映不同側(cè)面,或在不同提問要素之間平移。也可以是明顯不同的新檢索。p老虎打架 老虎嬉戲老虎 打斗 老虎 草原 排球 海報 排球 手繪畫中斷恢復(fù),在并行多頁面搜索中,回到先前搜索界面時提問式繼續(xù)翻頁。方式有切換檢索窗口,或采用“后退”按鈕回到原來檢索界面。i月亮 月光(新搜索頁面)月亮(回到原頁面)老虎 兩只老虎 老虎(

8、點“后退”按鈕返回)內(nèi)容調(diào)整重復(fù)先前提問,輸入或點擊先前嘗試過的提問詞。u跟隨系統(tǒng)相關(guān)搜索詞,點擊搜索結(jié)果頁面底部的相關(guān)搜索詞。r月色 月色朦朧(系統(tǒng)相關(guān)詞)語法和句法調(diào)整術(shù)語調(diào)整,改變提問式的句法格式,包括更換縮寫、大小寫、副詞增刪、介詞增刪、前后位置調(diào)整、中英文互換等。t老虎 tiger人與球 人 球兄弟 虎 虎 兄弟使用操作符,使用and/or/not,“+”、“-”,空格,或者用“”來限定。o兄弟虎 兄弟 虎資源范圍調(diào)整更換檢索入口重復(fù)檢索,嘗試某個提問式未果之后,換一個檢索工具或用已使用過的提問式重復(fù)搜索e文件格式調(diào)整,對文件格式和尺寸大小等提出要求f念奴嬌 赤壁懷古 ppt背景圖圖

9、像范圍限定,調(diào)整圖像來源,或指定網(wǎng)站,或限定圖像所在領(lǐng)域,如新聞圖片、廣告圖片等。d虎 虎 新聞圖片對同一個提問式調(diào)整樣本進(jìn)行分析時,不排除同時編碼為兩種及以上的調(diào)整類型。如,用戶重復(fù)點擊“可愛小老虎”的系統(tǒng)提示的相關(guān)搜索詞,第一次行為編碼為“跟隨系統(tǒng)相關(guān)搜索詞”,第二次則同時編碼為“跟隨系統(tǒng)相關(guān)搜索詞”和“重復(fù)先前提問”兩種類型。再如,“老虎打架”“老虎嬉戲”,同時編碼為“平移”和“術(shù)語調(diào)整”,因為其中涉及空格的增加。另外,用戶先后在不同檢索入口采用相同的提問式進(jìn)行查詢,該類調(diào)整行為將同時編碼為“更換檢索工具重新檢索”和“重復(fù)先前提問”兩種類型。3 圖像檢索提問式調(diào)整類型分布每個圖像搜索過程

10、排除初始提問式之外,共觀測到提問式的調(diào)整行為560個,構(gòu)成圖像提問式調(diào)整模式分析的基礎(chǔ)樣本集。不考慮系統(tǒng)相關(guān)搜索詞的外部介入作用,實驗共識別提問式調(diào)整類型610頻次(有些調(diào)整行為同時編碼為23個類型)。3.1 圖像檢索提問式調(diào)整類型分布我們考察圖像提問式調(diào)整行為中各種調(diào)整類型發(fā)生的可能性(見表2),其中95.9%的調(diào)整都與內(nèi)容調(diào)整有關(guān);7.2%的調(diào)整與資源范圍的改變有關(guān);語法和格式類調(diào)整發(fā)生的可能性為6.1%。與已有研究相比,結(jié)論有差異。yoon &chung在考察圖像查尋不同階段提問調(diào)整類型時認(rèn)為4,內(nèi)容調(diào)整占80%,而格式類調(diào)整占20%,其中用戶會不斷使用操作符來調(diào)整提問方向;而j

11、örgensen等針對圖像提問調(diào)整的研究也發(fā)現(xiàn)2,用戶會不斷使用not或and運算符來縮小搜索結(jié)果列表。可見,中文網(wǎng)絡(luò)圖像檢索中,語法和格式調(diào)整所占比例要小得多,而用戶對圖像檢索提問的調(diào)整更傾向于檢索詞本身的內(nèi)容調(diào)整。與rieh & xie關(guān)于文本搜索提問式調(diào)整的研究結(jié)果進(jìn)行比較3,可以發(fā)現(xiàn),在圖像搜索過程中內(nèi)容調(diào)整占據(jù)更大比例(95.9%:80.3%),而語法和句法類調(diào)整的比例很少(6.1%:14.4%),資源范圍調(diào)整的比例更大一些(7.2%:2.8%)。這些差異可能是由圖像資源搜索本身的特點決定的。首先,語法與句法類調(diào)整可能更適合文本,而不適合圖像;圖像理解和表達(dá)與一般的

12、語法和句法并不密切相關(guān);其次,用戶圖像需求的表達(dá)應(yīng)該側(cè)重在圖像內(nèi)容要素上;再次,圖像庫的選擇、圖像領(lǐng)域范圍的限定對于圖像搜索而言是可以嘗試的策略之一。對于各個子類在同類中的分布,在內(nèi)容調(diào)整中,縮檢的比例最大(35.1%),而擴(kuò)檢和平移也經(jīng)常性發(fā)生,上述三類調(diào)整是最主要的內(nèi)容調(diào)整形式。此外,用戶還較多地選擇“跟隨系統(tǒng)相關(guān)搜索詞”。在語法和句法調(diào)整中,術(shù)語調(diào)整的比例要遠(yuǎn)高于操作符調(diào)整。在資源范圍調(diào)整中,更換檢索入口(數(shù)據(jù)庫)進(jìn)行重新檢索占據(jù)較大比例(60%),其次是對文件格式的要求和限定,對圖像所在領(lǐng)域和網(wǎng)站范圍的要求并不多見。表2 圖像搜索提問式調(diào)整類型分布調(diào)整類別子類頻次同類中百分比(%)內(nèi)容

13、調(diào)整(95.9%)縮檢s18835.1擴(kuò)檢g12623.5同義詞替換y224.1平移p10519.6中斷恢復(fù)i50.9重復(fù)先前提問u275.0跟隨系統(tǒng)相關(guān)搜索詞r6311.8合計536100語法和句法調(diào)整(6.1%)術(shù)語調(diào)整t2367.6使用操作符01132.4合計34100資源范圍調(diào)整(7.2%)更換檢索入口重復(fù)檢索e2460.0文件格式調(diào)整f1025.0圖像范圍限定d615.0合計40100n=5603.2 四類主要提問式調(diào)整行為縮檢、擴(kuò)檢、平移、跟隨系統(tǒng)相關(guān)搜索詞是發(fā)生較頻繁的四類主要的提問式調(diào)整行為。首先,縮檢比擴(kuò)檢的比例要高很多,表明在圖像搜索過程中,用戶從寬泛提問不斷縮小檢索范圍的

14、行為模式更突出一些。其次,提問式的平移變換發(fā)生較頻繁,可能的原因在于對圖像理解的多面性,圖像呈現(xiàn)給用戶是多個不同側(cè)面,因此,發(fā)生在圖像要素之間的平移非常有必要。往往是在不同圖像要素之間平移,如由對象平移到事件,由事件平移至地點環(huán)境,由形狀平移至顏色等,如“老虎打斗”平移至“老虎草原”。這一點在yoon等的研究結(jié)論中也有體現(xiàn),用戶在搜索過程中,使用更多的內(nèi)容平移策略和運用操作符來不斷調(diào)整搜索方向4。最后,有一定比例的調(diào)整行為屬于用戶的跟隨性行為,用戶會選擇跟隨系統(tǒng)提供的相關(guān)搜索詞繼續(xù)搜索。3.3 系統(tǒng)相關(guān)搜索的反作用力我們認(rèn)為,用戶在搜索結(jié)果不理想的情況下,傾向于點擊搜索結(jié)果頁面下方的相關(guān)搜索詞

15、,而這明顯會打斷用戶提問式構(gòu)造和調(diào)整的正常行為模式。系統(tǒng)提供的相關(guān)搜索詞作為一種外部介入力量,可能會徹底改變用戶圖像搜索的方向。為了考量系統(tǒng)提供的相關(guān)搜索詞在用戶提問式調(diào)整中的外部干預(yù)作用和方向,我們對涉及相關(guān)搜索詞的提問式調(diào)整行為進(jìn)行了專門分析。對63個點擊系統(tǒng)相關(guān)搜索詞的提問式調(diào)整樣本進(jìn)行二次編碼,結(jié)果顯示:其中32個引導(dǎo)提問式“擴(kuò)檢”;22個引導(dǎo)提問式“縮檢”;7個引導(dǎo)提問式“平移”;引導(dǎo)術(shù)語調(diào)整和同義詞替換各1個。根據(jù)我們的研究結(jié)果,現(xiàn)有圖像搜索引擎在相關(guān)搜索詞的引導(dǎo)上在三大基本類別的分布上是合理的,但是,在對“縮檢”和“擴(kuò)檢”的支持方向上似乎與用戶行為習(xí)慣有所背離(根據(jù)3.2研究結(jié)果

16、,行為過程中縮檢模式更為突出一些),系統(tǒng)相關(guān)搜索功能可能存在一定的反作用力,這會在一定程度上中斷用戶正常的檢索邏輯,干擾用戶嘗試提問式的方向,使搜索進(jìn)程忽左忽右,方向搖擺,加大茫然和盲目程度。4 圖像檢索提問式調(diào)整的行為模式分析圖像檢索過程中提問式調(diào)整的行為動作及其變換序列,同樣可以歸納出提問式調(diào)整的行為模式,反映圖像檢索過程的狀態(tài)轉(zhuǎn)移規(guī)律。yoon和chung在研究不同檢索階段用戶如何調(diào)整他們的檢索提問時4,除了考察圖像查尋五個階段提問式所屬類別的分布規(guī)律之外,還歸納出了圖像檢索提問的兩種策略模式:上升模式,即用戶在搜索過程中,使用更多的內(nèi)容平移策略和運用操作符來不斷調(diào)整自己的搜索方向。下降

17、模式,即用戶會越來越少地使用專指性詞匯、同義詞替代,先前使用過的關(guān)鍵詞等來調(diào)整自己的搜索進(jìn)程。與yoon等的一般性闡述不同,本研究通過對88個行為案例的模式識別,基于案例分析而歸納出圖像檢索提問式調(diào)整的四種基本模式和四種動態(tài)混合模式?;灸J剑侵赴l(fā)生在局部的相對穩(wěn)定的線性模式,在提問式內(nèi)涵上傾向于逐步縮小、擴(kuò)大或平移等局部線性的變化趨勢,能夠體現(xiàn)圖像檢索提問式調(diào)整的相對穩(wěn)定的思路,調(diào)整的策略性相對單一而明顯?;灸J绞菢?gòu)成復(fù)雜提問式調(diào)整過程的基礎(chǔ)模塊,呈現(xiàn)線性特征。而大多數(shù)時候,用戶圖像提問式的調(diào)整并非是單一、穩(wěn)定的,更多時候是一種混合模式,在多種模式基元之間跳躍,充滿復(fù)雜與動態(tài)變化。如“s-g-s-g”、“s-p-s-p-s”的變化序列。因此,混合模式往往基于基本線性模式組合而成,呈現(xiàn)非線性特征。在歸納行為模式過程中,鑒于內(nèi)容調(diào)整是提問式調(diào)整的最主要方式,我們主要從處于高頻區(qū)的四類內(nèi)容調(diào)整類型(縮減、擴(kuò)檢、平移、跟隨系統(tǒng)相關(guān)搜索詞)出發(fā)來把握序列的主流變換方向,“重復(fù)先前提問”和“更換檢索入口重新檢索”這兩類對提問式調(diào)整方向也會產(chǎn)生一定影響,也納入主要分析對象體系中,而其他六類調(diào)整類型可能會穿插在序列中,但基本不會改變

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論