




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、信息管理學(xué)第1章1.2 信息的定義問題:1. 不被主體(人)所感知的內(nèi)容是信息嗎? 本體論層次的信息。定義:事物存在的方式和運動狀態(tài)的表現(xiàn)形式。 “事物”泛指存在于人類社會、思維活動和自然界中一切可能的對象。“存在方式”指 事物的內(nèi)部結(jié)構(gòu)和外部聯(lián)系?!斑\動”泛指一切意義上的變化,包括機械的、物理的、化學(xué) 的、生物的、思維的和社會的運動。 “運動狀態(tài)”則是指事物在時間和空間上變化所展示 的特征、態(tài)勢和規(guī)律。離開主體的信息價值大嗎? 信息定義二:(認識論層次)信息是主體所感知或表述的事物存在的方式和運動狀態(tài)主體是有思考能力和目的性的,因此,同樣的信息對不同主體所產(chǎn)生的效應(yīng)是否相同 呢?信息的使用價
2、值相對于該信息持有者的不同而不同數(shù)據(jù)、信息、知識及相關(guān)概念數(shù)據(jù)+背景=信息信息是數(shù)據(jù)載荷的內(nèi)容,對于同一信息,其數(shù)據(jù)表現(xiàn)形式可以多種多樣。知識是信息接收者通過對信息的提煉和推理而獲得的正確結(jié)論,是人通過信息對自然界、人 類社會以及思維方式與運動規(guī)律的認識與掌握,是人的大腦通過思維重新組合的、系統(tǒng)化的 信息集合。同樣,我們可以表達為如下公式:信息+經(jīng)驗=知識 知識與信息的關(guān)系知識告訴我們:“這組數(shù)據(jù)意味著什么。” 但實際上知識卻同貨物絕不相同,它并不像西紅柿土豆之類的東西,只要主顧付了錢,就可 以從店伙手里拿到,用袋子裝走,回家炒著吃煮著吃。知識是人類心靈經(jīng)過了學(xué)習而獲得的 東西,其中含了無數(shù)的
3、甘苦。學(xué)者不但要知道學(xué)習獲得的結(jié)果,而且更重要的是要知道得到 這樣結(jié)果的過程。 季羨林一個例子:乘飛機 假如我現(xiàn)在要馬上從佐治亞州的亞特蘭大飛到上海,在旅行社網(wǎng)站上查看時間表信息。網(wǎng)站上有一張航班圖,標注著現(xiàn)有空座航班的出發(fā)時間。我通過閱讀和解釋頁面上的內(nèi)容, 有效地收集必要的原始數(shù)據(jù)。我知道班機會在倫敦停留。一小時后出發(fā)的航班是英國航空公司的,中途在倫敦的希思羅 機場停留。之后兩小時出發(fā)的是德耳塔公司的航班,中途停留倫敦的 Gatwick 機場。比較現(xiàn) 在與出發(fā)時間,我得到了必要的信息。我曾搭乘過從新德里起飛途徑倫敦的航班,知道所有從北美飛往亞洲大陸的航班必須在Gat wick機場轉(zhuǎn)機,而且
4、從希思羅機場到Gat wick機場有一個小時汽車的路程。早出發(fā)的航 班不會比晚出發(fā)的早到。我以這個經(jīng)驗為基礎(chǔ)做出了判斷,決定乘晚一點的航班,這樣就有 足夠的時間收拾東西。思考:數(shù)據(jù)、信息、知識的區(qū)別?區(qū)別該例中,哪些為知識,哪些為信息?哪些為數(shù)據(jù)? 如何理解信息是一種資源? ”資源一般指天然財富的來源“信息就是資源的口號給人一種誤導(dǎo)信息的資源意義在于信息的使用者例 1 兩名鞋廠營銷人員同一地區(qū)考察的案例例 2 農(nóng)夫山泉的天然水與純凈水案例 信息的資源意義不在于信息本身,也不在于你是否掌握這一信息,而在于你對信息的思考, 即對信息的管理。案例日本人巧妙搜集信息 第二次世界大戰(zhàn)后,日本經(jīng)濟高速發(fā)展
5、,一個重要原因就是重視信息的采集、開發(fā)、利用。日本的信息傳遞、查詢非常迅速。510分鐘搜集到世界各地金融市場的行情;35分鐘 查詢并調(diào)用日本國內(nèi)1 萬多重點公司、企業(yè)經(jīng)營數(shù)據(jù);5分鐘模擬出國際國內(nèi)經(jīng)濟因素變化 可能給宏觀經(jīng)濟帶來的變動圖和曲線; 510分鐘可查詢或調(diào)用政府的法律、法令和國會記 錄。這種現(xiàn)代化的信息處理技術(shù),大大提高了行政效率 。日本人善于從平淡的信息報道中 分離出重要的信息內(nèi)容。例如,日本人在二十世紀六十年代,根據(jù)中國的媒體公開報道,分 析判斷出大慶油田開發(fā)的重要信息,從而與中國談成了產(chǎn)品設(shè)計買賣。日本人對大慶油田早 有耳聞,但始終得不到準確信息。 1964年4月人民日報寫到“
6、大慶精神大慶人”,于 是判斷“中國確有大慶油田”。 1966年 7月中國畫報封面有一張照片,鐵人王進喜身 穿大棉襖、頭頂鵝毛大雪,猜測到“大慶油田在冬季零下30 度的東北地區(qū)”。 1966年 10 月,日本人又從人民中國找到了王進喜的先進事跡,從事跡介紹分析得知“最早鉆井地 點是在北安東北部的馬家窯”。日本人又從偽滿州地圖上查到“馬家窯是黑龍江省海倫縣東 面的一個小村”。這就找到了大慶油田的準確地理位置。 為了弄清楚大慶煉油廠的加工能 力,日本情報機構(gòu)從1966 年的一期中國畫報上找到了一張煉油廠反應(yīng)塔照片,從反應(yīng) 塔上的扶手欄桿(一般為一米多)與塔的 相對比例推知塔直徑約5米,從而計算出大慶
7、煉 油廠年加工原油能力約為1 00萬噸,而在1966年大慶已有820口井出油,年產(chǎn)360萬噸, 估計到 1971 年大慶年產(chǎn)量可增至1200 萬噸。通過對大慶油田位置、規(guī)模和加工能力的情 報分析后,日本決策機構(gòu)推斷:“中國在近幾年中必然會感到煉油設(shè)備不足,買日本的輕油 裂解設(shè)備是完全可能的,所要買的設(shè)備規(guī)模和數(shù)量要滿足每天煉油一萬噸需要。”于是就按 他們估計的大慶油田要求進行產(chǎn)品設(shè)計。最后等待中國人去購買。 思考問題:(1)日本人采集信息對我們有什么啟示? 信息管理的概念 信息管理(狹義)就是對信息本身的管理,即采用各種技術(shù)方法和手段(如分類、主題、代碼、 計算機處理等等)對信息進行組織、控制
8、、存貯、檢索和規(guī)劃等,并將其引向預(yù)定目標; 信息管理(廣義)不單單是對信息的管理,而是對涉及信息活動的各種要素(信息、人、機器、 機構(gòu)等)進行合理的組織和控制,以實現(xiàn)信息及有關(guān)資源的合理配置,從而有效地滿足社會 的信息要求。信息資源管理的局限性:僅關(guān)注顯在知識的管理而忽略隱性知識的管理,大大限制了管理范圍和信息管理效能的發(fā) 揮僅關(guān)注人類智力勞動的最終成果而忽略學(xué)習與創(chuàng)新過程,不能實現(xiàn)全方位的信息管理。僅關(guān)注將信息提供給利用者而對利用者需求信息重視不夠,限制了信息效用價值的實現(xiàn)。僅關(guān)注信息在組織內(nèi)部的免費流動而忽視信息的增值問題,影響了組織對信息的評價。 信息管理與管理信息系統(tǒng)的區(qū)別? 信息管理
9、包括信息的搜集、存儲、傳遞、交流、控制,信息政策、法規(guī)的制定等等。 英國學(xué)者馬丁認為, MIS 是一種為明確限定的某一管理層次提供特定信息的“管理工具。 與信息管理活動相比,其范圍更窄。信息系統(tǒng)的三種重要資源是信息、信息 技術(shù)和人。這三種資源中你認為哪一個最重要?為 什么?最不重要的是什么?為什么?人最重要。在數(shù)據(jù)轉(zhuǎn)化為信息時,是人賦予了其內(nèi)容、意義和價值,也正是這些人能夠從信 息中獲得價值。在信息生命周期的中期存儲、歸納和傳播上,信息技術(shù)是有幫助的。但 對于信息的創(chuàng)造或使用,其幫助并不大。信息與信息技術(shù)誰最重要呢? 設(shè)想有一個有著水管情結(jié)的世界。在這個奇異的世界里,所有的話題都是關(guān)于下水管道
10、,管 道設(shè)備大王的相片出現(xiàn)在各種出版物的封面上。他們是世界上最富有的人。許多公司發(fā)費了 幾百萬、幾十億,甚至幾萬億的金錢去連接所有的管道設(shè)施,以確保管道能通達至每一個辦 公桌、每一個家庭辦公室,甚至每一輛汽車上。但他們忽略了什么?水! 它是清潔的水嗎?這種水恰好是消費者想飲用的水嗎?第2 章 信息交流主要內(nèi)容:信息交流的基本概念信息交流傳播的一般模式信息傳遞的基本規(guī)律(重點)信息交流的實現(xiàn)與障礙(重點定義:信息交流是不同時間或不同空間上的認知主體(人或由人組成的機構(gòu)、組織)之間相互交換 信息的過程。認知主體可以處在同一時間和同一空間,也可以處在不同時間或不同空間。信息傳遞的基本規(guī)律:守恒與擴散
11、信息守恒信息守恒:信息一經(jīng)生成,只能被掩蔽,但不會被消滅。同樣,信息被接收后只能被遺忘, 但不會消失。信息守恒的三個角度: S 信息守恒意味著任何信息生產(chǎn)者,只要信息自他的大腦中輸?shù)酵?部世界,這些信息就是永恒存在的。R信息守恒描述的是信息接受者在接收信息時所特有的 “0”或“1”的特征。信息要么被接收,要么被選擇過濾。 “信息?!眰鬟f信息守恒,即 T(Transfer)信息守恒保證信息輸出與信息輸入的信息守恒,保證在對信息進行種種加工、 處理過程中,不篡改或損害信息的內(nèi)容。信息擴散原理信息擴散的多向?qū)ΨQ性信息擴散的多向?qū)ΨQ性是指信息在傳遞或擴散過程中,如果信息源S所處的外圍介質(zhì)(包括 自然介
12、質(zhì)、社會介質(zhì))是同質(zhì)均勻分布的話,則S的信息傳遞就成一種各向?qū)ΨQ結(jié)構(gòu)。多向?qū)ΨQ的形式:傳遞速度對稱;傳遞內(nèi)容對稱;傳遞空間(或距離)對稱;傳 遞的信息強度對稱。 (實際情況中,這一條件是否容易滿足呢?當這一條件不成立時,信息 擴散遵循什么規(guī)則呢?)多向?qū)ΨQ性法則的條件及其引申原則多向?qū)ΨQ性原則的適用條件是同質(zhì)均勻分布的外部介質(zhì),當這一條件不成立時,也就導(dǎo)出了 一些新的信息擴散規(guī)律。這就是多向?qū)ΨQ的引申原則,具體包括:信息傳遞的拓撲原則(信息棧拓撲圖):拓撲原則是指信息從S傳遞至R時,如果是均勻 介質(zhì)環(huán)境,則SR是最直接、最快速的傳遞。但若是非均勻介質(zhì)條件下,SR信息流就要 出現(xiàn)拓撲變換,即在傳
13、遞過程中會出現(xiàn)種種“信息?!眮韨鬟f信息,因為信息介質(zhì)的每一次 改變都要經(jīng)過一次轉(zhuǎn)換,都要經(jīng)過“信息?!庇枰宰儞Q。多路傳遞法則:多路傳遞法則,又稱多通道原則,它是指在S至R的信息傳遞過程中,除 了 S與R的直接溝通之外,還可以通過其他的通道,經(jīng)過或不經(jīng)過信息棧而將信息傳遞給接 受者R。多路傳遞法則的理論基礎(chǔ):a.信息是可以分享的;b.信息是可以分棧傳遞的。信息傳遞的密度遞減法則從空間方面來說,設(shè)S為信息源,并設(shè)其在t時刻以聲音向外傳遞信息。信息是以各向?qū)ΨQ 形式發(fā)送的,呈圓周對稱形狀。如果以他聲音的壓強為信息特征,顯然,壓強大,則信息被 感受的可能性就大,當壓強減至一定程度時,信息就無法被接受者
14、感知。從時間上來說,也存在信息遞減,即S所發(fā)生的信息,時間越久,衰減越嚴重。 除了物理空間的信息密度遞減外,在精神空間中亦是如此。在時間軸上,知識也存在一種積 淀過程?,F(xiàn)代所獲知的信息中, 10 年后可能有1/3是被剔除的, 20年后可能就有一半是過 時的 。思考:如何看待信息遞減律與T守恒律?第 3 章 信息分布主要內(nèi)容:信息產(chǎn)生與分布中的馬太效應(yīng)信息生產(chǎn)者分布規(guī)律(難點)信息離散分布規(guī)律(難點)信息對時間的分布規(guī)律(難點)信息產(chǎn)生與分布中的馬太效應(yīng)馬太效應(yīng)描述了優(yōu)勢與劣勢的積累過程:一經(jīng)存在有優(yōu)勢,這種優(yōu)勢局面就會不斷加強,反之若處于 劣勢,則這種不利條件也會繼續(xù)加劇。2、馬太效應(yīng)的表現(xiàn)和
15、作用形式豈核心趨勢-高產(chǎn)作者群體的形成-期刊信息密度增大高頻詞匯的確立豈集中取向一篇論文多次被引一個網(wǎng)站被眾多用戶點擊3、馬太效應(yīng)的負面影響信息分布的富集現(xiàn)象-突出重點、摒棄平均,為信息源的選擇、獲取、評價和利用提供依據(jù),降低 信息管理成本,提高信息利用效益。豈核心信息源-忽略分布在其他信息源中有價值的信息。-馬太效應(yīng)青睞名人、拒絕新人的習慣勢力限制了新思想、新知識和新信息的 產(chǎn)生及傳播信息生產(chǎn)者分布規(guī)律洛特卡定律洛特卡定律f(yx)= C/x2 (C=60.79%)f(yx):表示寫x篇論文的作者出現(xiàn)的頻率yx 表示寫 x 篇論文的作者數(shù)目f(yx)= yx/S yx提問: 假設(shè)萬方數(shù)據(jù)庫中
16、,撰寫信息管理學(xué)文章的作者有1000人,根據(jù)洛特卡定律,這1000人中,發(fā)表3篇信息管理學(xué)文章的作者數(shù)量大約是多少?f(yx)= C/x2= y x / S y x2. 普賴斯定律 在某一特定領(lǐng)域中,全部論文的半數(shù)由該領(lǐng)域中全部作者的平方根的那些人(核心或高產(chǎn)作 者)撰寫的。論文數(shù)人數(shù)1N1 N2MNm論文數(shù)人數(shù)1N1 N2MNmmaxNmaxN= N.N1maxN +.+.N =N1/2,則m(1)(2)maxM+.+max=M與max的關(guān)系?高產(chǎn)作者M=0.749(max)1/2 式子表明,高產(chǎn)作者中一位最低產(chǎn)的作者發(fā)表的論文數(shù)量,等于最 高產(chǎn)作者所發(fā)表論文數(shù)的平方根的0.749倍。提問:
17、假設(shè) 2000-2004年,中國期刊網(wǎng)數(shù)據(jù)庫中發(fā)表信息管理學(xué)文章的總?cè)藬?shù)為10000人,其 中最高產(chǎn)作者人數(shù)為 25 人,每人發(fā)表文章 16 篇,根據(jù)普賴撕定律,求出高產(chǎn)作者區(qū)的人 數(shù),以及高產(chǎn)區(qū)作者中發(fā)表文章的最少篇數(shù)。信息離散分布規(guī)律 信息的離散分布是信息的重要屬性,表現(xiàn)為信息的內(nèi)容單元以不同方式從不同角度分布于各 種載體中。信息的離散分布具有復(fù)雜的機理,本質(zhì)上是由信息的生產(chǎn)和利用決定的。1.布拉德福分散定律如果將科學(xué)期刊按期刊載某個學(xué)科主題的論文數(shù)量,以遞減順序排列起來,就可以在所有這 些期刊中區(qū)分出載文率最高的“核心”部分和包含著與核心部分同等數(shù)量論文的隨后幾區(qū),這 時核心區(qū)和后繼各區(qū)
18、中所含的期刊數(shù)成1: a: a2的關(guān)系(al)。將所有期刊分成三個區(qū),使每區(qū)論文數(shù)大致相等,則期刊數(shù)服從布拉德福定律即 1: 5: 52 即:若第1分區(qū)期刊數(shù)為9則第2分區(qū)的期刊總數(shù)大約為?第三分區(qū)呢?2.齊夫定律如果將一篇較長文章(約 5 000字以上)中每個詞按其出現(xiàn)頻次遞減排列起來(高頻詞在前, 低頻詞在后),并用自然數(shù)給這些詞編上等級序號(出現(xiàn)頻次最高的為1級,其次為2級 這樣一直到D級),如果用f表示詞在文章中出現(xiàn)的頻次,用r表示詞的等級,則有:f r=c(c 為常數(shù))(出現(xiàn)頻率最高的為 1 級)齊夫詞頻分布曲線f300250200150100501 2 3 4 5 6 r如果建立f
19、與r的直角坐標系,用縱坐標表示詞的等級序號,橫坐標表示出現(xiàn)頻次,就得到 一條雙曲線。如果等級r與頻次f都取對數(shù),則雙曲線變成一條直線。與之等價的數(shù)學(xué)表達 式為:1 2 3 4 5 6 rlgr+lgf=lgc信息對時間的分布規(guī)律3.4.1指數(shù)增長律普賴斯曲線 如果我們以文獻量為縱軸,以歷史年代為橫軸,把各不同年代的文獻量在坐標圖上逐 點描繪出來,然后以一光滑曲線連接各點,則可十分近似地表征文獻隨時間增長的規(guī)律。這 就是著名的普賴斯曲線。普賴斯曲線F(t)F(t)F(t)=a e bt(3-23)式中:a是統(tǒng)計的初始時刻(t=0)的文獻量; e=2.718;b 表示持續(xù)增長率。人們還常常用文獻量
20、翻一倍的時間來衡量文獻的增長速度,即t =ln 2/b(3-24)式中:U為文獻量翻倍時間,b為持續(xù)增長率。文獻翻倍的時間:t ” =ln2/b2aebt=aeb*0t ” =ln2/b設(shè)某一初始時刻,文獻量a=10000,增長率b=10%求10年后文獻量 和文獻翻一番的時間。 則10年后文獻量 F(10)=10000 * e 0.1(10)=27183文獻翻一番的時間是t =ln2/b=0693/0.1=693 (年)實際的統(tǒng)計發(fā)現(xiàn),不同時期、不同級別、不同質(zhì)量、不同學(xué)科領(lǐng)域的文獻信息增長態(tài)勢是不 一樣的。勒希爾考察了不同質(zhì)量級別的文獻增長狀況,發(fā)現(xiàn)它們的增長速度差別很大。勒希 爾認為,文獻
21、的數(shù)量與其質(zhì)量有關(guān)。他定義A (0W入W1)為文獻的質(zhì)量級別,則不同級別上 的文獻量為F(t)入。他給入的具體值如下:入=1:至少是一般文獻(實際代表所有文獻)入=3/4:至少是有意義的文獻入=1/2 :至少是重要的文獻入=1/4 :至少是非常重要的文獻入=0:第一流的文獻對于第一流的文獻(即入=0),文獻數(shù)量為lnF(t)。入文獻翻番時間為L= L/入(入工0)(2)當入=0 時,F(xiàn)0(t)=lnaebt=lna +bt思考:文獻總量為10000, b=0.1翻一番的時間是t =ln2/b=0.693/0.1=6.93 (年)現(xiàn)求2 =3/4, 1/2,1/4,0的翻番時間。文獻半衰期:表示
22、某學(xué)科領(lǐng)域中尚在利用的全部文獻的一半是在多長時間內(nèi)發(fā)表的。 例如:物理學(xué)文獻的半衰期是4.6,兩個含義:現(xiàn)在仍在利用的物理學(xué)文獻的50%,其出版年輪不超過4.6年。物理學(xué)文獻一半失效的時間也是4.6年。文獻信息老化曲線用縱坐標表示現(xiàn)在正被利 用(引證)的文獻的被引量,橫坐標 表示時間,我們可以繪制出文獻的 老化曲線。相應(yīng)的方程可表示為:C(t)=ke-at (3-26)式中:C(t)表示發(fā)表了 t年的文5 獻的被引次數(shù),k是常數(shù),隨學(xué)科不同而異,a為老化率。第5 章 信息組織信息組織的基本原理信息組織的概念和內(nèi)容信息組織,是利用一定的規(guī)則、方法和技術(shù)對信息的外部特征和內(nèi)容特征講行描述和揭示,
23、并按給定的參數(shù)和序列公式排列,使信息從無序集合轉(zhuǎn)換為有序集合的過程。 期刊論文:文獻的題目、著者、著者的工作單位、文獻的出處(刊名、年卷期、起止頁碼)、語種、 參考文獻及圖表的數(shù)量、刊號 圖書:書名、著者(或編者、譯者)、出版項(出版社、地點、時間)、稽核項(價格、頁數(shù) 參考文獻)、書號 信息的外表特征是指信息的名稱、來源、加工者、類型及表現(xiàn)形式等內(nèi)容 怎么組織內(nèi)容特征(1) 是根據(jù)信息檢索的需要,以文本及各種類型的信息資源為對象,通過對其內(nèi)容特征等的分 析、選擇、標引、處理,使其成為有序化集合的過程。分析: 內(nèi)容特征是隱含的,需要分析方能顯現(xiàn)。選擇: 并不是所有的內(nèi)容特征都需要反映出來以供檢
24、索,所以根據(jù)使用目的加以選擇 標引: 分析信息資源的內(nèi)容屬性(特征)及相關(guān)的外表屬性,并用特定的語言表達分析出 的屬性或特征,從而賦予其檢索標識的過程。處理: 按照一定的規(guī)則組織成檢索工具,并給予適當?shù)恼f明。 二、為什么需要信息組織1、從環(huán)境來看 信息資源數(shù)量急劇增加,大量無序信息將有用的信息湮沒其間,使得人們比過去 更難獲取有用信息。2、從信息組織的目的來看 信息組織的目的是將無序的信息變成有序的集合。這一目的的實現(xiàn)手段是組織各 種類型的信息資源檢索工具,這也正是信息組織的任務(wù)。思考: 信息組織與信息檢索的關(guān)系信息的描述與揭示1.元數(shù)據(jù)(metadata) 關(guān)于數(shù)據(jù)的數(shù)據(jù),關(guān)于信息的信息,或
25、描述數(shù)據(jù)的數(shù)據(jù)。它是專門用來描述數(shù)據(jù)的 特征和屬性,也是描述和組織信息資源、發(fā)現(xiàn)信息資源的語言和工具。數(shù)據(jù)倉庫 數(shù)據(jù)倉庫是決策支持體系結(jié)構(gòu)的基礎(chǔ)WHInmon (數(shù)據(jù)倉庫之父)認為數(shù)據(jù)倉庫具有以下四個特征:面向主題的:就面向主題而言,這里指機構(gòu)的“名詞”(如客戶、后勤、財務(wù)、營銷 和銷售)。集成的:數(shù)據(jù)倉庫提供了企業(yè)主要涉及的一些主題域的集成視圖。非易失的:數(shù)據(jù)倉庫的數(shù)據(jù)不能被用戶直接更新,只能被訪問。隨時間變化的:即使數(shù)據(jù)會隨著時間變化,數(shù)據(jù)倉庫仍然保留其歷史視圖。 數(shù)據(jù)集市 數(shù)據(jù)集市通常被設(shè)計用來滿足特定的、性質(zhì)相同的業(yè)務(wù)用戶群(如市場、財務(wù)、人力資源等) 的需求。第 6 章 信息檢索信息
26、檢索概念(續(xù)) 信息檢索是從任何信息集合中識別和獲取所需信息的過程及其所采取的一系列方法 和策略。信息組織和信息檢索是一對互逆過程。衣 檢索是信息組織的反變換過程。信息組織的目的是將零散的信息組成一個有序的體 系,檢索的目的則是迅速從這個體系中搜尋所需的信息。(五)信息檢索特性豈信息檢索的相關(guān)性相關(guān)性表明用戶是否認為一文獻與一提問吻合。豈信息檢索的不確定性 在標引和檢索詞的選用中都存在不確定性,二種不確定性作用于檢索系統(tǒng),使得 信息檢索具有不確定性。(1)標引的不確定性 指不同標引員在給同一篇信息對象進行標引時會選用不同的標引詞,即標引詞選用的不一致性。(2)檢索詞選用的不確定性 指候選檢索詞
27、集不只一個,而是多個,檢索過程具有試探性:系統(tǒng)依次選用詞集進行檢索,直到檢出或在失敗中放棄查找。信息檢索特性(續(xù))衣信息檢索的邏輯性信息檢索作為信息管理的核心,具有非常強的邏輯性。檢索語言方面,檢索詞表作為檢索語言的典據(jù)性文本,其自身編排具有很強的邏 輯性。檢索策略是指處理信息檢索提問的邏輯與查找步驟的科學(xué)安排。正確的檢索策略 優(yōu)化了檢索過程,有助于取得最佳的檢索效果,獲得具有高相關(guān)度的文獻。 檢索效果評價(續(xù))査全率 R (Recall ratio)奇 R=檢出的相關(guān)文獻量/檢索系統(tǒng)中相關(guān)文獻總量*100%查準率 P (Precision ratio)奇 P=檢出的相關(guān)文獻量檢出的文獻總量*
28、100% 理想的檢出結(jié)果是查全率與查準率都趨近于1。但在實際檢索中,查全率與查準率之間存在 互逆相關(guān)性。如果追求過高的查全率,就可能降低查準率。R思考:影響檢索效果的主要原因?討論:1.信息檢索技巧能否獲取利潤?如何理解信息爆炸與信息匱乏之間的矛盾?第7 章 信息服務(wù)多業(yè)務(wù)數(shù)據(jù)來源公司 萬事達卡國際公司不愿讓他們的數(shù)據(jù)閑置,它與對稱資源公司合作。對稱資源公司是一家在 佛羅里達的市場研究公司。萬事達卡公司與對稱資源公司的合資公司叫多業(yè)務(wù)數(shù)據(jù)來源公 司。對稱資源公司的員工與萬事達卡公司數(shù)據(jù)庫的專家們緊密合作,把這一超大型的數(shù)據(jù)庫 經(jīng)營得井井有條,富有效率。Advisor),多業(yè)務(wù)數(shù)據(jù)來源公司把數(shù)據(jù)按流通渠道、地區(qū)、全國范圍提供給商號,并對它們 的客戶行為深入分析,同時讓商號在了解自我表現(xiàn)的同時,知道如何與對手競爭。 數(shù)據(jù)可以回答以下問題:怎么樣的消費者主導(dǎo)銷售額? 他們閱讀什么雜志,我們可以在什么雜志上作廣告? 他們看什么樣的電視節(jié)目?客戶還買其他什么產(chǎn)品?在哪兒買的? 什么樣的消費者不是從我這兒,而是從競爭對手那里購買?多業(yè)務(wù)數(shù)據(jù)來源公司的董事長和CEO比爾恩格爾說,商人顧問系統(tǒng)的與眾不同之處是嚴格 使用可靠的數(shù)據(jù)。萬事達卡國際公
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 加盟健康中心合作合同范本
- 初創(chuàng)公司分紅合同范本
- 保證合同范本單方
- 醫(yī)用合同范本
- 單位和個人合伙合同范本
- 勞務(wù)門店合同范本
- 書畫居間合同范本
- 供用熱力合同范本
- 關(guān)聯(lián)交易合同范本
- 會展活動合同范本
- 商業(yè)動線設(shè)計(修改版)
- FMEA第五版表格(實例)
- 【講座】情境性試題:基于《中國高考評價體系》的高考語文命題研究
- 建筑行業(yè)鋼桁架等制作工藝流程圖
- 承德市普通住宅區(qū)物業(yè)服務(wù)等級和基準價格
- 環(huán)??己嗽嚲?8285(含答案)
- SMED培訓(xùn)材料-快速換模
- HG20592-2009法蘭(PL)法蘭蓋(BL)精加工尺寸
- 叉車蓄電池容量與鐵箱規(guī)格表
- 風管、水管支架估算表
- 淺談小學(xué)低年級數(shù)學(xué)計算課堂教學(xué)的有效策略
評論
0/150
提交評論