網(wǎng)絡(luò)信息膨脹和信息膨脹問題解決_第1頁
網(wǎng)絡(luò)信息膨脹和信息膨脹問題解決_第2頁
網(wǎng)絡(luò)信息膨脹和信息膨脹問題解決_第3頁
網(wǎng)絡(luò)信息膨脹和信息膨脹問題解決_第4頁
網(wǎng)絡(luò)信息膨脹和信息膨脹問題解決_第5頁
已閱讀5頁,還剩44頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第一章

網(wǎng)絡(luò)信息膨脹與信息膨脹問題的解決信息與網(wǎng)絡(luò)信息網(wǎng)絡(luò)信息膨脹及其帶來的負面影響信息膨脹問題產(chǎn)生的原因分析解決信息膨脹問題的基本思路1.1信息與網(wǎng)絡(luò)信息信息概述網(wǎng)絡(luò)信息網(wǎng)絡(luò)信息與非網(wǎng)絡(luò)信息的比較1.1.1信息概述

為了科學(xué)地理解信息的本質(zhì),必須區(qū)分信息、消息、信號、符號的不同涵義。信息與信號、符號、消息在科學(xué)

涵義上是根本不同的。信號是攜帶信息的各種物理過程,同一信息可以用各種信號來攜帶和傳遞;符號則是語言、文字、圖像、密碼、指令、程序等的統(tǒng)稱,是人類用來

表示信息的各種標志,是非物理性的,同樣的信息也可

以用不同的符號來表征;各種信號都可以與某種符號集

合建立起對應(yīng)關(guān)系;信號系列和符號系列構(gòu)成了消息,

消息是信息載體或表達者,消息和信息是形式和內(nèi)容的

關(guān)系。所以,信息是一個社會概念,它是社會共享的、

人類的一切知識、學(xué)問以及從客觀現(xiàn)象提煉出來的各種

消息的總稱,信息反映了客觀世界中各種事物的特征和

變化的組合,是一種有用的知識。信息具有以下幾方面的特性:普遍性

普遍性是指從空間分布上講,信息是無處不在的。信息普遍存在于自然界、人類社會以及人類的思維或精神領(lǐng)域;從時間上講,盡管具體的某個信息是有時效的,但是由于人們對世界的認識是無限的,因此,就整體而言信息是無限的。從社會學(xué)的角度看,信息一開始就直接聯(lián)系于社會應(yīng)用,真正意義上的信息離不開社會。時效性

具體的信息都有時效性。在某一特定時刻所獲得的關(guān)于某一事物的信息僅僅反映了這一時刻事物自身所處的狀態(tài)和環(huán)境狀況,一般不能反映事物這一時刻之后所產(chǎn)生的問題。時效性是信息的重要特征。3.傳遞性

信息可以脫離開某一具體事物而載荷到別的事物上,從而可以被轉(zhuǎn)移、被復(fù)制、被記錄、被存儲、被傳送。信息的這種特性使信息借助于一定的載體從一地傳遞到另一地,在人們之間進行傳播,從而實現(xiàn)信息巨大的潛在效用??商娲?/p>

信息的物質(zhì)載體形態(tài)是可以互相轉(zhuǎn)移變換的。即指信息的描述可以有多種不同的方法,這些不同的描述方法之間只需保持某種對應(yīng)關(guān)系,這種對應(yīng)關(guān)系稱為信息變換關(guān)系。5.可轉(zhuǎn)化性

信息中包含有知識,使人們對某個事物的運動狀態(tài)和其變化方式由不了解到了解,使知識由少變多。由此,人們利用信息就可以提高工作效率的質(zhì)量,從而降低經(jīng)濟成本。因此說,信息的這種可轉(zhuǎn)化的特性,是信息被正確利用所產(chǎn)生的社會和經(jīng)濟效益的依據(jù)。共享性

信息可以同時為眾多的接收者共同使用。在信息的擴散和用戶分享信息的過程中,信息載體本身的信息量并不因此過程而減少,各用戶分享的信息不因分享的人的多少而受影響。這是由于信息不是事物本身,而是事物運動狀態(tài)及其變化的描述,信息可以脫離開產(chǎn)生它的那個事物,從而可以實現(xiàn)信息的轉(zhuǎn)移、傳播和復(fù)制,達到信息的共享。

人類生存與發(fā)展離不開信息。信息是人類進化和社會發(fā)展中一種不可缺少的前提和推動社會進步的重要因素,信息的根本作用在于消除人們認識的不確定性和增強世界的有序性。

信息的運行環(huán)境,直接影響著人類利用信息的程度。隨著現(xiàn)代信息技術(shù)的不斷發(fā)展進步,先進的信息技術(shù)被廣

泛應(yīng)用,促使信息的運行環(huán)境、管理技術(shù)逐步現(xiàn)代化。

計算機技術(shù)、電子技術(shù)、通信技術(shù)在信息的搜集、存儲、加工、傳遞、交換、管理等方面的普遍應(yīng)用,從根本上

改變了信息的存取與傳播方式。計算機、網(wǎng)絡(luò)已成為傳

播文化知識,獲取信息資源的重要手段。1.1.2網(wǎng)絡(luò)信息互聯(lián)網(wǎng)的產(chǎn)生與發(fā)展

互聯(lián)網(wǎng)的出現(xiàn)是20世紀最偉大的科學(xué)成就之一,其發(fā)展速度遠遠超過世界上其他科學(xué)技術(shù)的發(fā)展速度?;ヂ?lián)網(wǎng)與它所負載的海量信息,正在對社會經(jīng)濟生活、對人們的價值觀念和生存方式產(chǎn)生著強烈的沖擊。

互聯(lián)網(wǎng)最初起源于ARPAnet(阿帕網(wǎng))。目的是通過該網(wǎng)絡(luò)把美國的幾個軍事及研究用計算機主機聯(lián)接起來,形成一個新的軍事指揮系統(tǒng)。1981年,美國全國科學(xué)基金會開發(fā)了有五個超級計算機中心相連的網(wǎng)絡(luò)。當時的全國許多大學(xué)和學(xué)術(shù)機構(gòu)把已經(jīng)建成的一批地區(qū)性網(wǎng)絡(luò)與五個超級計算機中心相連,形成了一個新的大的網(wǎng)絡(luò)——NSFnet,該網(wǎng)絡(luò)上的成員之間可以互相進行通訊,從而開始了互聯(lián)網(wǎng)真正發(fā)展的階段。

采用Internet的名稱是在MILnet(由ARPAnet分出來)實現(xiàn)和NSFnet連接后開始的。隨后,其他聯(lián)邦部門的計算

機網(wǎng)相繼并入Internet,NSF巨型計算機中心則一直肩負著擴展Internet的使命。

Internet在20世紀80年代的擴張不單有量的改變,也帶來質(zhì)的某些變化。由于多種學(xué)術(shù)團體、企業(yè)研究機構(gòu)、甚至個人用戶的進入,Internet的使用者不再限于“純粹”的計算機專業(yè)人員。新的使用者逐步把Internet當作一種交流與信息傳遞的工具,而不僅僅只是共享NSF巨型計算機的運算能力。

1991年,General

Atomics、Performance

SystemsInternational、UUNet

Technologies等3家公司組成了

“商用Internet協(xié)會”(Commercial

Internet

ExchanAssociation),宣布用戶可以把它們的Internet子網(wǎng)用任何的商業(yè)用途。其它Internet的商業(yè)子網(wǎng)也看到了

Internet用于商業(yè)用途的巨大潛力,紛紛做出類似的承諾

Internet商業(yè)化服務(wù)提供商的接連出現(xiàn),使工商企業(yè)可以真正地進入Internet。

大量商業(yè)機構(gòu)的進入帶來了Internet發(fā)展史上一次質(zhì)的飛躍。到1994年年底,Internet已通往全世界150個國家和地區(qū),聯(lián)接著3萬多個子網(wǎng),320多萬臺計算機主機,直接的用戶超過3500萬,成為世界最大的計算機網(wǎng)絡(luò)。

數(shù)據(jù)庫技術(shù)的發(fā)展,特別是分布式數(shù)據(jù)庫技術(shù)的進步使得大量的信息內(nèi)容被放入計算機網(wǎng)絡(luò),從而使得人們能夠迅速地從網(wǎng)絡(luò)上檢索和得到他們所需的信息。特別是環(huán)球網(wǎng)技術(shù)的出現(xiàn),人們可以使用超文本格式把文字、圖像等信息匯于一體,放入數(shù)據(jù)庫中,極大地豐富了互聯(lián)網(wǎng)中的信息資源。

目前,互聯(lián)網(wǎng)上的信息涉及到現(xiàn)代社會生活的各個方面。通過信息在網(wǎng)上的傳播,人們可以方便地從互聯(lián)網(wǎng)上獲

取各種不同需求的信息。對于企業(yè)來說,可以從互聯(lián)網(wǎng)

上獲取市場信息,還可以通過創(chuàng)建本企業(yè)的主頁(Homepage),在網(wǎng)上發(fā)布企業(yè)信息,宣傳企業(yè)形象,推銷企業(yè)產(chǎn)品,進行技術(shù)支持和售后服務(wù)等。2.網(wǎng)絡(luò)信息的類型、特點與傳播方式

信息可根據(jù)其載體形式和傳遞方式分為文獻信息和網(wǎng)絡(luò)信息兩大類型。文獻信息是指傳統(tǒng)的介質(zhì)(紙張)和現(xiàn)

代介質(zhì)(如磁盤、光盤、縮微膠片等)記錄和存貯的知

識信息。文獻信息的載體形式主要有圖書、報紙、期刊,政府報告、會議資料以及光盤資料和縮微資料等。文獻

信息資源具有較強的系統(tǒng)性、連續(xù)性和穩(wěn)定性特點。網(wǎng)

絡(luò)信息一般可以理解為“通過計算機網(wǎng)絡(luò)可以利用的各

種信息”,即通過國際互聯(lián)網(wǎng)可以利用的各種信息,它

包括:科技數(shù)據(jù)庫、時事評論、社會科學(xué)、文學(xué)藝術(shù)、

歷史資源等方面豐富的文獻資料和一些公用軟件。網(wǎng)絡(luò)

信息具有內(nèi)容的廣泛性、訪問的快捷性、搜索的網(wǎng)絡(luò)性

和資源的動態(tài)性等特點。(1)網(wǎng)絡(luò)信息的類型按信息的時效分類:網(wǎng)上出版物。即在網(wǎng)上出版的報紙,期刊等。

動態(tài)信息。如政府機構(gòu)發(fā)布的消息、政策法規(guī)、會議消息,以及論文集、科研成果、產(chǎn)品目錄、新聞及廣告、交通、股市行情等。

聯(lián)機館藏書目數(shù)據(jù)庫。在互聯(lián)網(wǎng)中,圖書館目錄正發(fā)展成為OPAC(Online

Public

Access

Catalog,即聯(lián)機公共目錄檢索系統(tǒng))。已有上萬個電子圖書館的館藏機讀書目數(shù)據(jù)庫,包括大學(xué)圖書館、公共圖書館和專業(yè)圖書館的館藏。

聯(lián)機數(shù)據(jù)庫。許多國際聯(lián)機檢索系統(tǒng)都開設(shè)了與互聯(lián)網(wǎng)的接口,用戶通過遠程登錄或互聯(lián)網(wǎng)均可進行檢索。2)按所對應(yīng)的非網(wǎng)絡(luò)信息分類:館藏書目數(shù)據(jù)庫。

電子書刊。即完全在網(wǎng)絡(luò)環(huán)境下編輯、出版、傳播的書刊,以及印刷型書刊的電子版。

參考工具書。這是一些傳統(tǒng)的和現(xiàn)代的參考工具書的網(wǎng)絡(luò)版。如大不列顛百科全書、牛津大辭典等。

數(shù)據(jù)庫。指聯(lián)入互聯(lián)網(wǎng)的數(shù)據(jù)庫,數(shù)據(jù)庫的內(nèi)容涉及不同領(lǐng)域和不同專業(yè)。

其他類型。如個人主頁、電子郵件、電子公告、新聞組、用戶組等也成為信息交流的重要渠道,并成為網(wǎng)絡(luò)信息

的重要組成部分之一。3)按人類信息交流的方式分類:

非正式出版信息。如電子郵件、電子會議、專題組和論壇、電子公告板新聞等。

半非正式出版物。一些無法從正式出版物查詢到的信息。如各種學(xué)術(shù)團體和教育機構(gòu)、企業(yè)、國際組織和政府機

構(gòu)、行業(yè)協(xié)會等的網(wǎng)址或主頁上發(fā)布的信息。

正式出版物。即用戶可以查詢到的各種數(shù)據(jù)庫、聯(lián)機雜志、電子版工具書、報紙、專利信息等。4)按信息存取方式分,可分為郵件型、揭示板型(如網(wǎng)絡(luò)新聞、匿名FTP等)、廣播型、圖書館型以及書目型。從網(wǎng)絡(luò)信息檢索角度,按信息查詢方式對網(wǎng)絡(luò)信息進行分類:1)互聯(lián)網(wǎng)(WWW)信息?;ヂ?lián)網(wǎng)上的信息是分布于網(wǎng)絡(luò)各處的文字、圖像、聲音和多媒體超文本信息。由于檢索方便、靈活、快捷,因此,發(fā)展迅速,已成為互聯(lián)網(wǎng)信息的主流。FTP信息。FTP以發(fā)布、傳遞軟件和長文件見長。Telnet信息。使用Telnet用戶可以使用遠程計算機上對外放的信息資源,尤其是圖書館目錄系統(tǒng)。USENET/Newsgroup信息資源。USENET利用網(wǎng)絡(luò)環(huán)境,為用戶提供專題討論服務(wù)。USTSERV/Mailing

List信息。即電子郵件群和郵件列表。Gopher信息。是一種類似互聯(lián)網(wǎng)的分布式客戶機/服務(wù)器形式的信息資源體系。(2)網(wǎng)絡(luò)信息的特征數(shù)據(jù)量大,增長迅速。

內(nèi)容豐富,形式多樣?;ヂ?lián)網(wǎng)已發(fā)展成為當代信息存儲與傳播的主要媒介之一,存儲著不同學(xué)科,不同領(lǐng)域、不同地域、不同語言的各種信息,是一個巨大的信息資源庫。

變化快,質(zhì)量參差不齊?;ヂ?lián)網(wǎng)上的信息地址、信息連接、信息內(nèi)容均具有動態(tài)性,信息資源的更迭、消亡無法預(yù)測。

信息分散、無序?;ヂ?lián)網(wǎng)是一個基于TCP/IP協(xié)議的聯(lián)結(jié)各國、各機構(gòu)數(shù)以萬計的計算機網(wǎng)絡(luò)的通信網(wǎng),對網(wǎng)絡(luò)信息資源本身的組織管理無統(tǒng)一標準和規(guī)范,網(wǎng)絡(luò)信息分散于不同國家、不同地區(qū)服務(wù)器上,采用不同的操作系統(tǒng)及數(shù)據(jù)結(jié)構(gòu),字符界面、圖形界面、菜單方式、超文本方式等缺乏集中統(tǒng)一的管理機制。(3)網(wǎng)絡(luò)信息的傳播方式利用環(huán)球網(wǎng)傳播圖、文、音并茂的信息。利用電子郵件傳播信息。利用遠程登錄(Telnet)使用遠程計算機的有關(guān)信息資源利用網(wǎng)絡(luò)論壇Usenet傳播信息。利用FTP傳播信息。3.中國網(wǎng)絡(luò)信息用戶使用分析

到目前,全世界互聯(lián)網(wǎng)上的用戶已超過6.5億。20世紀90年代初,互聯(lián)網(wǎng)進入中國。從1997年到2002年,上網(wǎng)用

戶總數(shù)已從62萬人達到5910萬人,增長了94.3倍。截止到

2002年12月31日,中國WWW站點數(shù)為371600個,和2001年同期相比增長34.1%。

在我國,網(wǎng)絡(luò)用戶的范圍十分廣泛,年齡和受教育程度有著很大的差別,知識結(jié)構(gòu)、認知能力也不相同;上網(wǎng)的目的和利用網(wǎng)絡(luò)信息的種類也存在明顯的差異。年齡18歲以下18--2425--3031--3536

--4041--

5050歲以上比重(%)1997年10月5.60%36.30%29%13.20%4.3%6.80%4.

80%比重(%)2003年1月17.5%10.2

%14.9%16.5%14.4%16.7%9.8%(1)用戶年齡分布從1997年10月到2003年1月,中國互聯(lián)網(wǎng)用戶人數(shù)已從62萬發(fā)展到5910萬,其年齡分布如表1-1。表1-1中國互聯(lián)網(wǎng)用戶的年齡分布資料來源:中國互聯(lián)網(wǎng)絡(luò)中心.中國互聯(lián)網(wǎng)絡(luò)發(fā)展狀況統(tǒng)計報告,因特網(wǎng):(2)用戶性別統(tǒng)計資料來源:中國互聯(lián)網(wǎng)絡(luò)中心.中國互聯(lián)網(wǎng)絡(luò)發(fā)展狀況統(tǒng)計報告,因特網(wǎng):表1-2中國互聯(lián)網(wǎng)用戶的性別統(tǒng)計從右表可以看出,女性用戶1999年1月比1998年7月增長100%,而2003年1月已增至四成以上。中國女網(wǎng)民的增加非常明顯。一方面說明近幾年來中國女性對互聯(lián)網(wǎng)的關(guān)注在增多,另一方面也說明中國女性的知識層次和收入水平也在提高。充分利用這方面的信息,有利于女性市場的開拓。(3)用戶文化程度

在中國互聯(lián)網(wǎng)用戶的文化結(jié)構(gòu)中,從1999年到2003年,大專、本科學(xué)歷的用戶占60%左右,且變化不大。這說明,在中國,上網(wǎng)用戶主要集中在學(xué)歷層次較高的人群中。另外在上網(wǎng)用戶中高中及高中以下學(xué)歷的占10%左右,它比高學(xué)歷人數(shù)(碩士、博士)還要高出5-10個百分點,原因是這部分人大多比較年輕,有很強的求知欲和接受能力。相比之下碩士、博士學(xué)歷的上網(wǎng)人數(shù)僅占到不足3%,可見,高學(xué)歷人才在我國數(shù)量還很少,這部分人是我國目前很缺乏的人才。他們大多是從事科研、教育的工作者,上網(wǎng)的目的也多是為了獲取科技、經(jīng)濟、教育等方面的信息。這也反映出網(wǎng)絡(luò)沒有為高層次人才提供足夠的有用信息,不能滿足他們的需求,這是網(wǎng)絡(luò)信息亟待解決的問題之一。(4)用戶行業(yè)分布情況分析表1-3用戶的行業(yè)分布(不包括軍人、學(xué)生和無業(yè)人員)資料來源:中國互聯(lián)網(wǎng)絡(luò)中心.中國互聯(lián)網(wǎng)絡(luò)發(fā)展狀況統(tǒng)計報告,因特網(wǎng):表1-4用戶的職業(yè)分布資料來源:中國互聯(lián)網(wǎng)絡(luò)中心.中國互聯(lián)網(wǎng)絡(luò)發(fā)展狀況統(tǒng)計報告,因特網(wǎng):(5)用戶上網(wǎng)目的

從CNNIC

1999年7月~2003年1月以來的統(tǒng)計報告看,占用戶上網(wǎng)目的第一位的是查詢信息,占用戶的50%左右。之外主要是用于學(xué)習(xí)、工作需要及獲得各種免費資源等目的的占到了用戶總數(shù)的14%左右。所以,在網(wǎng)民中廣

泛普及、推廣網(wǎng)絡(luò)信息查詢技術(shù),最大限度地利用網(wǎng)絡(luò)信息資源,應(yīng)當成為我國推進信息化建設(shè)的一項極為重要的工作。(6)用戶最常使用的網(wǎng)絡(luò)服務(wù)

網(wǎng)絡(luò)服務(wù)主要是指互聯(lián)網(wǎng)提供的一些基本服務(wù),如電子郵件,專題討論,遠程登錄,信息發(fā)布,文件傳輸和信息檢索等。在1999年7月~2003年1月CNNIC發(fā)布的統(tǒng)計報告中電子郵件始終排在第一位,2003年1月調(diào)查顯示為

92.6%的用戶常用這一服務(wù)。搜索引擎排在第二位,有68.3%的上網(wǎng)用戶常用這一服務(wù),排在第四位的是各類信息查詢,使用這項服務(wù)的用戶占42.2%。這說明,互聯(lián)網(wǎng)已經(jīng)成為繼報紙、廣播、電視之后,很重要的信息傳播媒體。(7)用戶在網(wǎng)絡(luò)上主要獲取哪方面信息表1-5用戶在網(wǎng)絡(luò)上主要獲取信息的比例資料來源:中國互聯(lián)網(wǎng)絡(luò)中心.中國互聯(lián)網(wǎng)絡(luò)發(fā)展狀況統(tǒng)計報告,因特網(wǎng):1.1.3網(wǎng)絡(luò)信息與非網(wǎng)絡(luò)信息的比較

信息的發(fā)布。與非網(wǎng)絡(luò)信息相比,網(wǎng)絡(luò)信息的數(shù)量多,質(zhì)量也較難控制。

信息的傳播。隨著光纖技術(shù)、交換技術(shù)的發(fā)展和網(wǎng)絡(luò)的迅速普及,使通信速度迅速提高而通信費用顯著下降。這使得計算機網(wǎng)絡(luò)正在成為人們重要的通信工具,通信的快速、廉價使人們能夠獲得超地域的相互溝通能力,極大地擴大了人們的聯(lián)系。

信息的變化頻率。網(wǎng)絡(luò)信息,包括信息地址、信息鏈接、信息內(nèi)容經(jīng)常處于變動之中,非網(wǎng)絡(luò)信息一般變化較慢。

信息的擴充性。指已發(fā)布的信息的擴充性。非網(wǎng)絡(luò)信息一經(jīng)出版,就有了固定的樣式,一般較難加以擴展和擴充,而網(wǎng)絡(luò)信息則可以根據(jù)實際需要,隨時加以擴充。形式多樣性。網(wǎng)絡(luò)信息在形式上包括了文本、超文本、圖像、聲音、軟件、數(shù)據(jù)等多種形式;在存取與利用方法上也具有多樣性。這也是與非網(wǎng)絡(luò)信息的一個很重要的區(qū)別。

關(guān)聯(lián)程度。非網(wǎng)絡(luò)信息的關(guān)聯(lián)能力較差,主要通過參考文獻、引用文獻等方式來進行關(guān)聯(lián),而網(wǎng)絡(luò)信息可以利用超文本技術(shù),通過鏈接方式直接指導(dǎo)用戶去查閱所引用的原始文獻。1.2網(wǎng)絡(luò)信息膨脹及其帶來的負面影響網(wǎng)絡(luò)信息膨脹的含義及表現(xiàn)信息膨脹帶來的負面影響1.2.1網(wǎng)絡(luò)信息膨脹的含義及表現(xiàn)信息膨脹和網(wǎng)絡(luò)信息膨脹的含義

信息量與信息價值存在著正比關(guān)系,即信息越多,從中獲得的價值越大。信息量與信息價值的正比關(guān)系存在著一個臨界點,到達臨界點之后,信息量越大,總體價值卻反而開始降低,這就是信息膨脹。信息膨脹問題已經(jīng)成為我們生活中難以避免的一個問題。

網(wǎng)絡(luò)信息膨脹是指網(wǎng)絡(luò)信息隨著現(xiàn)代信息技術(shù)的發(fā)展急劇增加,過量的“垃圾”信息充斥網(wǎng)絡(luò)站點,網(wǎng)絡(luò)信息的檢索成本不斷上升,網(wǎng)絡(luò)信息自身的價值隨著網(wǎng)絡(luò)信息量的增加而貶值,二者呈現(xiàn)出反比關(guān)系。2.網(wǎng)絡(luò)信息膨脹的表現(xiàn)信息失實信息冗余信息超載信息過時淫穢信息電腦病毒1.2.2信息膨脹帶來的負面影響查詢時間延長經(jīng)濟損失嚴重查詢結(jié)果不理想1.3信息膨脹問題產(chǎn)生的原因分析信息本身在急劇膨脹網(wǎng)絡(luò)信息的傳播方式導(dǎo)致信息膨脹網(wǎng)絡(luò)信息的發(fā)布方式導(dǎo)致信息膨脹法律規(guī)范的滯后導(dǎo)致信息膨脹1.3.1信息本身在急劇膨脹

世界各地的信息通過各種渠道快速的相互傳播,全球的各類信息量都在成數(shù)十倍數(shù)百倍甚至更多的數(shù)量增長。

在這一過程中,大量冗余的、無價值的信息混雜在各類

信息當中。在全球信息系統(tǒng)中,信息垃圾比例不低于50%有的學(xué)科領(lǐng)域甚至占到80%!同時,由于科學(xué)技術(shù)飛速發(fā)展,知識更新速度不斷加快,知識老化現(xiàn)象明顯。此外,虛假信息傳播者有意識地傳遞的虛假錯誤信息,誤導(dǎo)、誘騙消費者;甚至還有一些無從證實的傳聞、流言、誹謗等惡意傳遞的污垢信息;所有這些都充斥在信息社會中,成為人們信息處理的負擔。1.3.2網(wǎng)絡(luò)信息的傳播方式導(dǎo)致信息膨脹

傳播速度快、范圍廣,是網(wǎng)絡(luò)傳播的最大特點,也是其最大的優(yōu)勢,然而,又反過來造成了信息的膨脹和過剩。信息作為一種產(chǎn)品,其最大特點是復(fù)制成本極低。并且

在絕大多數(shù)情況下,信息產(chǎn)品具有非排他性,具有一定

的公共產(chǎn)品的特征。另一方面,影響信息產(chǎn)品擴散的還

有信息的傳播成本,互聯(lián)網(wǎng)的出現(xiàn)使信息的傳播成本也得到了大幅度的降低。網(wǎng)絡(luò)外部性(Network

Externalities)

網(wǎng)絡(luò)外部性是指一件產(chǎn)品由于其他相同產(chǎn)品的使用而獲得額外的價值。在互聯(lián)網(wǎng)領(lǐng)域里,網(wǎng)絡(luò)的外部性表現(xiàn)的

十分明顯,特別是在一些側(cè)重與交流的虛擬社區(qū)類的網(wǎng)

站中:網(wǎng)站每“銷售”出一件信息產(chǎn)品,它就同時獲得

了在未來“銷售”更多產(chǎn)品的可能。通過對網(wǎng)絡(luò)外部性

的內(nèi)部化,使互聯(lián)網(wǎng)有可能表現(xiàn)出邊際收益遞增的特征。并且網(wǎng)站的交互性越強,這種邊際收益遞增就越明顯。

邊際收益遞增的信息生產(chǎn)也導(dǎo)致了互聯(lián)網(wǎng)信息產(chǎn)品的生

產(chǎn)過剩。信息過剩不僅僅是過剩,與之相伴隨的還有信

息的質(zhì)量問題,信息的信用問題等等。這些對于互聯(lián)網(wǎng)

的發(fā)展都帶來了不利的影響,又反過來對信息使用者帶

來不便。1.3.3網(wǎng)絡(luò)信息的發(fā)布方式導(dǎo)致信息膨脹

互聯(lián)網(wǎng)可以使人人都成為出版人。一方面是在互聯(lián)網(wǎng)上發(fā)表一篇文章,由于占用的磁盤空間少,使發(fā)布信息的成本很低,這使得任何人都可以在網(wǎng)上發(fā)表自己的作品或資料,而不會有什么發(fā)布上和經(jīng)濟上的困難,這種信息發(fā)布的便利性使得網(wǎng)絡(luò)信息的數(shù)量迅速增加。另一方面,在互聯(lián)網(wǎng)上發(fā)表任何文章不需要經(jīng)過任何人或部門的審查和批準。由于這兩方面的原因,各種任意夸大、縮小、捏造、剪輯、畸彎、拼湊、克隆得到的信息,低水平重復(fù)、老化失效、無限泛濫和內(nèi)容不健康的無效信息都可以不受限制的在互聯(lián)網(wǎng)上發(fā)布,這就使得網(wǎng)絡(luò)信息的真實性和可靠性無法得到保障。1.3.4法律規(guī)范的滯后導(dǎo)致信息膨脹

法制規(guī)范的滯后,使得各類網(wǎng)站的建設(shè)無法可依,信息發(fā)布處于無序狀態(tài),重復(fù)信息、無用信息充斥網(wǎng)絡(luò),造成大量信息失實、冗余、超載,信息膨脹問題嚴重。

一個健全的網(wǎng)絡(luò)法律體系應(yīng)該包括通信與信息服務(wù),電子商務(wù)和知識產(chǎn)權(quán)等各方面。在涉及的信息內(nèi)容方面,

應(yīng)包括信息采集、處理,互聯(lián)網(wǎng)信息、電子出版新聞等;在網(wǎng)絡(luò)信息安全方面,包括信息網(wǎng)絡(luò)安全、信息網(wǎng)絡(luò)保

密、電子簽名與認證等;既要制訂管理性的法律法規(guī),又要制訂促進信息技術(shù)發(fā)展的法律法規(guī)。1.4解決信息膨脹問題的基本思路加強網(wǎng)絡(luò)信息檢索新技術(shù)的開發(fā)網(wǎng)絡(luò)信息檢索機制及應(yīng)用的研究本書網(wǎng)絡(luò)信息檢索的解決辦法預(yù)期達到的效果1.4.1加強網(wǎng)絡(luò)信息檢索新技術(shù)的開發(fā)發(fā)展自然語言處理技術(shù)

自然語言,是指作者的書面用語,采用自然語言。可以減少概念間轉(zhuǎn)換產(chǎn)主的誤差,檢索入口詞多,操作簡單、方便、靈活,也適合專業(yè)人員之外的廣大用戶群。

對自然語言進行適當控制的方法有事先控制法和事后控制法。

由于各種數(shù)據(jù)庫采用的檢索語言不同,試圖用一種檢索語言統(tǒng)一各種數(shù)據(jù)庫的不同分類體系及敘詞法是不現(xiàn)實的。采用中介語言來實現(xiàn)多種語言的兼容是一種新的嘗試。

通過標準化手段實現(xiàn)各種檢索語言的兼容也是一種嘗試。標準化是檢索語言兼容的最高層次。2.大力發(fā)展智能化檢索技術(shù)智能化是網(wǎng)絡(luò)信息檢索工具的發(fā)展方向。實現(xiàn)檢索手段智能化的技術(shù)主要包括:蜘蛛(spiders)軟件的智能化。它可以對網(wǎng)頁上文獻的相關(guān)性及其所含鏈接的質(zhì)量作出判斷,篩掉不相關(guān)的網(wǎng)頁。智能搜索引擎技術(shù)(如Ask

Jeeves)。其功能是:先通過模擬傳統(tǒng)檢索過程的咨詢協(xié)商,索取有關(guān)檢索數(shù)據(jù),再

到大型知識庫中進行檢索。智能搜索引擎還具有推理能力、調(diào)整用戶檢索策略、提高檢索效率和提供用戶定制服務(wù)等功能。3.建立以用戶為核心的技術(shù)服務(wù)模式對現(xiàn)代信息技術(shù)的深層次開發(fā),創(chuàng)建和支持以用戶為核心的技術(shù)服務(wù)模式,是網(wǎng)絡(luò)檢索服務(wù)研究的重要內(nèi)容。“推”技術(shù),是指根據(jù)網(wǎng)上用戶個人需求的特征,運用

“篩選”、“過濾”機制。將信息不斷、主動地提供給用戶的一系列軟件技術(shù)的總稱。網(wǎng)絡(luò)信息的查詢是一個設(shè)計、發(fā)現(xiàn)、歸納、總結(jié)的過程。信息的獲取,除了必要的技術(shù)條件外,還必需有相應(yīng)的

檢索方法與之配合。開展網(wǎng)絡(luò)環(huán)境下的信息檢索方法研究就成了一項非常的重要的工作。這項工作做好了,我們就可以建立一套從實際需要的角度出發(fā),以一定的查詢目的為起點,通過多種檢索途徑獲取所需資料的方法,更快、更多、更準確地在網(wǎng)絡(luò)上獲取信息,盡可能的減少或避免信息膨脹所帶累的負面影響。1.4.2網(wǎng)絡(luò)信息檢索機制及應(yīng)用的研究針對WWW網(wǎng)站資源的組織過程與方式,理論界提出了

檢索機制的三個組成部分,即采集標引機制、數(shù)據(jù)組織機制和用戶檢索機制。其中,以Robots為核心的網(wǎng)絡(luò)信息資源自動采集,旨在以HURL、HTTP為基礎(chǔ),集中不同類型的信息產(chǎn)品,使全球范圍內(nèi)的各種信息資源能實時及時地進入信息系統(tǒng)。自

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論