版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
第一章網(wǎng)絡信息膨脹與信息
膨脹問題的解決1.1信息與網(wǎng)絡信息1.2網(wǎng)絡信息膨脹及其帶來的負面影響1.3信息膨脹問題產(chǎn)生的原因分析1.4解決信息膨脹問題的基本思路
1.1
信息與網(wǎng)絡信息1.1.1信息概述1.1.2網(wǎng)絡信息1.1.3網(wǎng)絡信息與非網(wǎng)絡信息的比較1.1.1
信息概述為了科學地理解信息的本質(zhì),必須區(qū)分信息、消息、信號、符號的不同涵義。信息與信號、符號、消息在科學涵義上是根本不同的。信號是攜帶信息的各種物理過程,同一信息可以用各種信號來攜帶和傳遞;符號則是語言、文字、圖像、密碼、指令、程序等的統(tǒng)稱,是人類用來表示信息的各種標志,是非物理性的,同樣的信息也可以用不同的符號來表征;各種信號都可以與某種符號集合建立起對應關系;信號系列和符號系列構成了消息,消息是信息載體或表達者,消息和信息是形式和內(nèi)容的關系。所以,信息是一個社會概念,它是社會共享的、人類的一切知識、學問以及從客觀現(xiàn)象提煉出來的各種消息的總稱,信息反映了客觀世界中各種事物的特征和變化的組合,是一種有用的知識。信息具有以下幾方面的特性:1.普遍性
普遍性是指從空間分布上講,信息是無處不在的。信息普遍存在于自然界、人類社會以及人類的思維或精神領域;從時間上講,盡管具體的某個信息是有時效的,但是由于人們對世界的認識是無限的,因此,就整體而言信息是無限的。從社會學的角度看,信息一開始就直接聯(lián)系于社會應用,真正意義上的信息離不開社會。2.時效性
具體的信息都有時效性。在某一特定時刻所獲得的關于某一事物的信息僅僅反映了這一時刻事物自身所處的狀態(tài)和環(huán)境狀況,一般不能反映事物這一時刻之后所產(chǎn)生的問題。時效性是信息的重要特征。
3.傳遞性
信息可以脫離開某一具體事物而載荷到別的事物上,從而可以被轉(zhuǎn)移、被復制、被記錄、被存儲、被傳送。信息的這種特性使信息借助于一定的載體從一地傳遞到另一地,在人們之間進行傳播,從而實現(xiàn)信息巨大的潛在效用。
4.可替代性信息的物質(zhì)載體形態(tài)是可以互相轉(zhuǎn)移變換的。即指信息的描述可以有多種不同的方法,這些不同的描述方法之間只需保持某種對應關系,這種對應關系稱為信息變換關系。5.可轉(zhuǎn)化性信息中包含有知識,使人們對某個事物的運動狀態(tài)和其變化方式由不了解到了解,使知識由少變多。由此,人們利用信息就可以提高工作效率的質(zhì)量,從而降低經(jīng)濟成本。因此說,信息的這種可轉(zhuǎn)化的特性,是信息被正確利用所產(chǎn)生的社會和經(jīng)濟效益的依據(jù)。6.共享性信息可以同時為眾多的接收者共同使用。在信息的擴散和用戶分享信息的過程中,信息載體本身的信息量并不因此過程而減少,各用戶分享的信息不因分享的人的多少而受影響。這是由于信息不是事物本身,而是事物運動狀態(tài)及其變化的描述,信息可以脫離開產(chǎn)生它的那個事物,從而可以實現(xiàn)信息的轉(zhuǎn)移、傳播和復制,達到信息的共享。人類生存與發(fā)展離不開信息。信息是人類進化和社會發(fā)展中一種不可缺少的前提和推動社會進步的重要因素,信息的根本作用在于消除人們認識的不確定性和增強世界的有序性。信息的運行環(huán)境,直接影響著人類利用信息的程度。隨著現(xiàn)代信息技術的不斷發(fā)展進步,先進的信息技術被廣泛應用,促使信息的運行環(huán)境、管理技術逐步現(xiàn)代化。計算機技術、電子技術、通信技術在信息的搜集、存儲、加工、傳遞、交換、管理等方面的普遍應用,從根本上改變了信息的存取與傳播方式。計算機、網(wǎng)絡已成為傳播文化知識,獲取信息資源的重要手段。1.1.2網(wǎng)絡信息1.互聯(lián)網(wǎng)的產(chǎn)生與發(fā)展互聯(lián)網(wǎng)的出現(xiàn)是20世紀最偉大的科學成就之一,其發(fā)展速度遠遠超過世界上其他科學技術的發(fā)展速度?;ヂ?lián)網(wǎng)與它所負載的海量信息,正在對社會經(jīng)濟生活、對人們的價值觀念和生存方式產(chǎn)生著強烈的沖擊?;ヂ?lián)網(wǎng)最初起源于ARPAnet(阿帕網(wǎng))。目的是通過該網(wǎng)絡把美國的幾個軍事及研究用計算機主機聯(lián)接起來,形成一個新的軍事指揮系統(tǒng)。1981年,美國全國科學基金會開發(fā)了有五個超級計算機中心相連的網(wǎng)絡。當時的全國許多大學和學術機構把已經(jīng)建成的一批地區(qū)性網(wǎng)絡與五個超級計算機中心相連,形成了一個新的大的網(wǎng)絡——NSFnet,該網(wǎng)絡上的成員之間可以互相進行通訊,從而開始了互聯(lián)網(wǎng)真正發(fā)展的階段。采用Internet的名稱是在MILnet(由ARPAnet分出來)實現(xiàn)和NSFnet連接后開始的。隨后,其他聯(lián)邦部門的計算機網(wǎng)相繼并入Internet,NSF巨型計算機中心則一直肩負著擴展Internet的使命。Internet在20世紀80年代的擴張不單有量的改變,也帶來質(zhì)的某些變化。由于多種學術團體、企業(yè)研究機構、甚至個人用戶的進入,Internet的使用者不再限于“純粹”的計算機專業(yè)人員。新的使用者逐步把Internet當作一種交流與信息傳遞的工具,而不僅僅只是共享NSF巨型計算機的運算能力。1991年,GeneralAtomics、PerformanceSystemsInternational、UUNetTechnologies等3家公司組成了“商用Internet協(xié)會”(CommercialInternetExchangeAssociation),宣布用戶可以把它們的Internet子網(wǎng)用于任何的商業(yè)用途。其它Internet的商業(yè)子網(wǎng)也看到了Internet用于商業(yè)用途的巨大潛力,紛紛做出類似的承諾,Internet商業(yè)化服務提供商的接連出現(xiàn),使工商企業(yè)可以真正地進入Internet。大量商業(yè)機構的進入帶來了Internet發(fā)展史上一次質(zhì)的飛躍。到1994年年底,Internet已通往全世界150個國家和地區(qū),聯(lián)接著3萬多個子網(wǎng),320多萬臺計算機主機,直接的用戶超過3500萬,成為世界最大的計算機網(wǎng)絡。數(shù)據(jù)庫技術的發(fā)展,特別是分布式數(shù)據(jù)庫技術的進步使得大量的信息內(nèi)容被放入計算機網(wǎng)絡,從而使得人們能夠迅速地從網(wǎng)絡上檢索和得到他們所需的信息。特別是環(huán)球網(wǎng)技術的出現(xiàn),人們可以使用超文本格式把文字、圖像等信息匯于一體,放入數(shù)據(jù)庫中,極大地豐富了互聯(lián)網(wǎng)中的信息資源。目前,互聯(lián)網(wǎng)上的信息涉及到現(xiàn)代社會生活的各個方面。通過信息在網(wǎng)上的傳播,人們可以方便地從互聯(lián)網(wǎng)上獲取各種不同需求的信息。對于企業(yè)來說,可以從互聯(lián)網(wǎng)上獲取市場信息,還可以通過創(chuàng)建本企業(yè)的主頁(Homepage),在網(wǎng)上發(fā)布企業(yè)信息,宣傳企業(yè)形象,推銷企業(yè)產(chǎn)品,進行技術支持和售后服務等。2.網(wǎng)絡信息的類型、特點與傳播方式信息可根據(jù)其載體形式和傳遞方式分為文獻信息和網(wǎng)絡信息兩大類型。文獻信息是指傳統(tǒng)的介質(zhì)(紙張)和現(xiàn)代介質(zhì)(如磁盤、光盤、縮微膠片等)記錄和存貯的知識信息。文獻信息的載體形式主要有圖書、報紙、期刊,政府報告、會議資料以及光盤資料和縮微資料等。文獻信息資源具有較強的系統(tǒng)性、連續(xù)性和穩(wěn)定性特點。網(wǎng)絡信息一般可以理解為“通過計算機網(wǎng)絡可以利用的各種信息”,即通過國際互聯(lián)網(wǎng)可以利用的各種信息,它包括:科技數(shù)據(jù)庫、時事評論、社會科學、文學藝術、歷史資源等方面豐富的文獻資料和一些公用軟件。網(wǎng)絡信息具有內(nèi)容的廣泛性、訪問的快捷性、搜索的網(wǎng)絡性和資源的動態(tài)性等特點。(1)網(wǎng)絡信息的類型1)按信息的時效分類:網(wǎng)上出版物。即在網(wǎng)上出版的報紙,期刊等。動態(tài)信息。如政府機構發(fā)布的消息、政策法規(guī)、會議消息,以及論文集、科研成果、產(chǎn)品目錄、新聞及廣告、交通、股市行情等。聯(lián)機館藏書目數(shù)據(jù)庫。在互聯(lián)網(wǎng)中,圖書館目錄正發(fā)展成為OPAC(OnlinePublicAccessCatalog,即聯(lián)機公共目錄檢索系統(tǒng))。已有上萬個電子圖書館的館藏機讀書目數(shù)據(jù)庫,包括大學圖書館、公共圖書館和專業(yè)圖書館的館藏。聯(lián)機數(shù)據(jù)庫。許多國際聯(lián)機檢索系統(tǒng)都開設了與互聯(lián)網(wǎng)的接口,用戶通過遠程登錄或互聯(lián)網(wǎng)均可進行檢索。2)按所對應的非網(wǎng)絡信息分類:館藏書目數(shù)據(jù)庫。電子書刊。即完全在網(wǎng)絡環(huán)境下編輯、出版、傳播的書刊,以及印刷型書刊的電子版。參考工具書。這是一些傳統(tǒng)的和現(xiàn)代的參考工具書的網(wǎng)絡版。如大不列顛百科全書、牛津大辭典等。數(shù)據(jù)庫。指聯(lián)入互聯(lián)網(wǎng)的數(shù)據(jù)庫,數(shù)據(jù)庫的內(nèi)容涉及不同領域和不同專業(yè)。其他類型。如個人主頁、電子郵件、電子公告、新聞組、用戶組等也成為信息交流的重要渠道,并成為網(wǎng)絡信息的重要組成部分之一。3)按人類信息交流的方式分類:非正式出版信息。如電子郵件、電子會議、專題組和論壇、電子公告板新聞等。半非正式出版物。一些無法從正式出版物查詢到的信息。如各種學術團體和教育機構、企業(yè)、國際組織和政府機構、行業(yè)協(xié)會等的網(wǎng)址或主頁上發(fā)布的信息。正式出版物。即用戶可以查詢到的各種數(shù)據(jù)庫、聯(lián)機雜志、電子版工具書、報紙、專利信息等。4)按信息存取方式分,可分為郵件型、揭示板型(如網(wǎng)絡新聞、匿名FTP等)、廣播型、圖書館型以及書目型。從網(wǎng)絡信息檢索角度,按信息查詢方式對網(wǎng)絡信息進行分類:1)互聯(lián)網(wǎng)(WWW)信息?;ヂ?lián)網(wǎng)上的信息是分布于網(wǎng)絡各處的文字、圖像、聲音和多媒體超文本信息。由于檢索方便、靈活、快捷,因此,發(fā)展迅速,已成為互聯(lián)網(wǎng)信息的主流。2)FTP信息。FTP以發(fā)布、傳遞軟件和長文件見長。3)Telnet信息。使用Telnet用戶可以使用遠程計算機上對外開放的信息資源,尤其是圖書館目錄系統(tǒng)。4)USENET/Newsgroup信息資源。USENET利用網(wǎng)絡環(huán)境,為用戶提供專題討論服務。5)USTSERV/MailingList信息。即電子郵件群和郵件列表。6)Gopher信息。是一種類似互聯(lián)網(wǎng)的分布式客戶機/服務器形式的信息資源體系。(2)網(wǎng)絡信息的特征1)數(shù)據(jù)量大,增長迅速。2)內(nèi)容豐富,形式多樣。互聯(lián)網(wǎng)已發(fā)展成為當代信息存儲與傳播的主要媒介之一,存儲著不同學科,不同領域、不同地域、不同語言的各種信息,是一個巨大的信息資源庫。3)變化快,質(zhì)量參差不齊?;ヂ?lián)網(wǎng)上的信息地址、信息連接、信息內(nèi)容均具有動態(tài)性,信息資源的更迭、消亡無法預測。4)信息分散、無序?;ヂ?lián)網(wǎng)是一個基于TCP/IP協(xié)議的聯(lián)結各國、各機構數(shù)以萬計的計算機網(wǎng)絡的通信網(wǎng),對網(wǎng)絡信息資源本身的組織管理無統(tǒng)一標準和規(guī)范,網(wǎng)絡信息分散于不同國家、不同地區(qū)服務器上,采用不同的操作系統(tǒng)及數(shù)據(jù)結構,字符界面、圖形界面、菜單方式、超文本方式等缺乏集中統(tǒng)一的管理機制。(3)網(wǎng)絡信息的傳播方式1)利用環(huán)球網(wǎng)傳播圖、文、音并茂的信息。2)利用電子郵件傳播信息。3)利用遠程登錄(Telnet)使用遠程計算機的有關信息資源。4)利用網(wǎng)絡論壇Usenet傳播信息。5)利用FTP傳播信息。3.中國網(wǎng)絡信息用戶使用分析到目前,全世界互聯(lián)網(wǎng)上的用戶已超過6.5億。20世紀90年代初,互聯(lián)網(wǎng)進入中國。從1997年到2002年,上網(wǎng)用戶總數(shù)已從62萬人達到5910萬人,增長了94.3倍。截止到2002年12月31日,中國WWW站點數(shù)為371600個,和2001年同期相比增長34.1%。在我國,網(wǎng)絡用戶的范圍十分廣泛,年齡和受教育程度有著很大的差別,知識結構、認知能力也不相同;上網(wǎng)的目的和利用網(wǎng)絡信息的種類也存在明顯的差異。年齡18歲以下18--2425--3031--3536--4041--5050歲以上比重(%)1997年10月5.60%36.30%29%13.20%4.3%6.80%4.80%比重(%)2003年1月17.5%10.2%14.9%16.5%14.4%16.7%9.8%(1)用戶年齡分布從1997年10月到2003年1月,中國互聯(lián)網(wǎng)用戶人數(shù)已從62萬發(fā)展到5910萬,其年齡分布如表1-1。表1-1中國互聯(lián)網(wǎng)用戶的年齡分布資料來源:中國互聯(lián)網(wǎng)絡中心.中國互聯(lián)網(wǎng)絡發(fā)展狀況統(tǒng)計報告,因特網(wǎng):http://
(2)用戶性別統(tǒng)計資料來源:中國互聯(lián)網(wǎng)絡中心.中國互聯(lián)網(wǎng)絡發(fā)展狀況統(tǒng)計報告,因特網(wǎng):http://
從右表可以看出,女性用戶1999年1月比1998年7月增長100%,而2003年1月已增至四成以上。中國女網(wǎng)民的增加非常明顯。一方面說明近幾年來中國女性對互聯(lián)網(wǎng)的關注在增多,另一方面也說明中國女性的知識層次和收入水平也在提高。充分利用這方面的信息,有利于女性市場的開拓。表1-2中國互聯(lián)網(wǎng)用戶的性別統(tǒng)計
(3)用戶文化程度在中國互聯(lián)網(wǎng)用戶的文化結構中,從1999年到2003年,大專、本科學歷的用戶占60%左右,且變化不大。這說明,在中國,上網(wǎng)用戶主要集中在學歷層次較高的人群中。另外在上網(wǎng)用戶中高中及高中以下學歷的占10%左右,它比高學歷人數(shù)(碩士、博士)還要高出5-10個百分點,原因是這部分人大多比較年輕,有很強的求知欲和接受能力。相比之下碩士、博士學歷的上網(wǎng)人數(shù)僅占到不足3%,可見,高學歷人才在我國數(shù)量還很少,這部分人是我國目前很缺乏的人才。他們大多是從事科研、教育的工作者,上網(wǎng)的目的也多是為了獲取科技、經(jīng)濟、教育等方面的信息。這也反映出網(wǎng)絡沒有為高層次人才提供足夠的有用信息,不能滿足他們的需求,這是網(wǎng)絡信息亟待解決的問題之一。(4)用戶行業(yè)分布情況分析表1-3用戶的行業(yè)分布(不包括軍人、學生和無業(yè)人員)資料來源:中國互聯(lián)網(wǎng)絡中心.中國互聯(lián)網(wǎng)絡發(fā)展狀況統(tǒng)計報告,因特網(wǎng):http://表1-4用戶的職業(yè)分布資料來源:中國互聯(lián)網(wǎng)絡中心.中國互聯(lián)網(wǎng)絡發(fā)展狀況統(tǒng)計報告,因特網(wǎng):http://
(5)用戶上網(wǎng)目的從CNNIC1999年7月~2003年1月以來的統(tǒng)計報告看,占用戶上網(wǎng)目的第一位的是查詢信息,占用戶的50%左右。之外主要是用于學習、工作需要及獲得各種免費資源等目的的占到了用戶總數(shù)的14%左右。所以,在網(wǎng)民中廣泛普及、推廣網(wǎng)絡信息查詢技術,最大限度地利用網(wǎng)絡信息資源,應當成為我國推進信息化建設的一項極為重要的工作。(6)用戶最常使用的網(wǎng)絡服務網(wǎng)絡服務主要是指互聯(lián)網(wǎng)提供的一些基本服務,如電子郵件,專題討論,遠程登錄,信息發(fā)布,文件傳輸和信息檢索等。在1999年7月~2003年1月CNNIC發(fā)布的統(tǒng)計報告中電子郵件始終排在第一位,2003年1月調(diào)查顯示為92.6%的用戶常用這一服務。搜索引擎排在第二位,有68.3%的上網(wǎng)用戶常用這一服務,排在第四位的是各類信息查詢,使用這項服務的用戶占42.2%。這說明,互聯(lián)網(wǎng)已經(jīng)成為繼報紙、廣播、電視之后,很重要的信息傳播媒體。(7)用戶在網(wǎng)絡上主要獲取哪方面信息表1-5用戶在網(wǎng)絡上主要獲取信息的比例資料來源:中國互聯(lián)網(wǎng)絡中心.中國互聯(lián)網(wǎng)絡發(fā)展狀況統(tǒng)計報告,因特網(wǎng):http://
1.1.3網(wǎng)絡信息與非網(wǎng)絡信息的比較1)信息的發(fā)布。與非網(wǎng)絡信息相比,網(wǎng)絡信息的數(shù)量多,質(zhì)量也較難控制。2)信息的傳播。隨著光纖技術、交換技術的發(fā)展和網(wǎng)絡的迅速普及,使通信速度迅速提高而通信費用顯著下降。這使得計算機網(wǎng)絡正在成為人們重要的通信工具,通信的快速、廉價使人們能夠獲得超地域的相互溝通能力,極大地擴大了人們的聯(lián)系。3)信息的變化頻率。網(wǎng)絡信息,包括信息地址、信息鏈接、信息內(nèi)容經(jīng)常處于變動之中,非網(wǎng)絡信息一般變化較慢。4)信息的擴充性。指已發(fā)布的信息的擴充性。非網(wǎng)絡信息一經(jīng)出版,就有了固定的樣式,一般較難加以擴展和擴充,而網(wǎng)絡信息則可以根據(jù)實際需要,隨時加以擴充。
5)形式多樣性。網(wǎng)絡信息在形式上包括了文本、超文本、圖像、聲音、軟件、數(shù)據(jù)等多種形式;在存取與利用方法上也具有多樣性。這也是與非網(wǎng)絡信息的一個很重要的區(qū)別。6)關聯(lián)程度。非網(wǎng)絡信息的關聯(lián)能力較差,主要通過參考文獻、引用文獻等方式來進行關聯(lián),而網(wǎng)絡信息可以利用超文本技術,通過鏈接方式直接指導用戶去查閱所引用的原始文獻。1.2網(wǎng)絡信息膨脹及其帶來的
負面影響1.2.1網(wǎng)絡信息膨脹的含義及表現(xiàn)1.2.2信息膨脹帶來的負面影響1.2.1網(wǎng)絡信息膨脹的含義及表現(xiàn)1.信息膨脹和網(wǎng)絡信息膨脹的含義信息量與信息價值存在著正比關系,即信息越多,從中獲得的價值越大。信息量與信息價值的正比關系存在著一個臨界點,到達臨界點之后,信息量越大,總體價值卻反而開始降低,這就是信息膨脹。信息膨脹問題已經(jīng)成為我們生活中難以避免的一個問題。網(wǎng)絡信息膨脹是指網(wǎng)絡信息隨著現(xiàn)代信息技術的發(fā)展急劇增加,過量的“垃圾”信息充斥網(wǎng)絡站點,網(wǎng)絡信息的檢索成本不斷上升,網(wǎng)絡信息自身的價值隨著網(wǎng)絡信息量的增加而貶值,二者呈現(xiàn)出反比關系。2.網(wǎng)絡信息膨脹的表現(xiàn)1)信息失實2)信息冗余3)信息超載4)信息過時5)淫穢信息6)電腦病毒1.2.2信息膨脹帶來的負面影響1.查詢時間延長2.經(jīng)濟損失嚴重3.查詢結果不理想1.3信息膨脹問題產(chǎn)生的原因分析1.3.1信息本身在急劇膨脹1.3.2網(wǎng)絡信息的傳播方式導致信息膨脹1.3.3網(wǎng)絡信息的發(fā)布方式導致信息膨脹1.3.4法律規(guī)范的滯后導致信息膨脹1.3.1信息本身在急劇膨脹世界各地的信息通過各種渠道快速的相互傳播,全球的各類信息量都在成數(shù)十倍數(shù)百倍甚至更多的數(shù)量增長。在這一過程中,大量冗余的、無價值的信息混雜在各類信息當中。在全球信息系統(tǒng)中,信息垃圾比例不低于50%,有的學科領域甚至占到80%!同時,由于科學技術飛速發(fā)展,知識更新速度不斷加快,知識老化現(xiàn)象明顯。此外,虛假信息傳播者有意識地傳遞的虛假錯誤信息,誤導、誘騙消費者;甚至還有一些無從證實的傳聞、流言、誹謗等惡意傳遞的污垢信息;所有這些都充斥在信息社會中,成為人們信息處理的負擔。1.3.2網(wǎng)絡信息的傳播方式
導致信息膨脹傳播速度快、范圍廣,是網(wǎng)絡傳播的最大特點,也是其最大的優(yōu)勢,然而,又反過來造成了信息的膨脹和過剩。信息作為一種產(chǎn)品,其最大特點是復制成本極低。并且在絕大多數(shù)情況下,信息產(chǎn)品具有非排他性,具有一定的公共產(chǎn)品的特征。另一方面,影響信息產(chǎn)品擴散的還有信息的傳播成本,互聯(lián)網(wǎng)的出現(xiàn)使信息的傳播成本也得到了大幅度的降低。
網(wǎng)絡外部性(NetworkExternalities)網(wǎng)絡外部性是指一件產(chǎn)品由于其他相同產(chǎn)品的使用而獲得額外的價值。在互聯(lián)網(wǎng)領域里,網(wǎng)絡的外部性表現(xiàn)的十分明顯,特別是在一些側重與交流的虛擬社區(qū)類的網(wǎng)站中:網(wǎng)站每“銷售”出一件信息產(chǎn)品,它就同時獲得了在未來“銷售”更多產(chǎn)品的可能。通過對網(wǎng)絡外部性的內(nèi)部化,使互聯(lián)網(wǎng)有可能表現(xiàn)出邊際收益遞增的特征。并且網(wǎng)站的交互性越強,這種邊際收益遞增就越明顯。邊際收益遞增的信息生產(chǎn)也導致了互聯(lián)網(wǎng)信息產(chǎn)品的生產(chǎn)過剩。信息過剩不僅僅是過剩,與之相伴隨的還有信息的質(zhì)量問題,信息的信用問題等等。這些對于互聯(lián)網(wǎng)的發(fā)展都帶來了不利的影響,又反過來對信息使用者帶來不便。1.3.3網(wǎng)絡信息的發(fā)布方式
導致信息膨脹互聯(lián)網(wǎng)可以使人人都成為出版人。一方面是在互聯(lián)網(wǎng)上發(fā)表一篇文章,由于占用的磁盤空間少,使發(fā)布信息的成本很低,這使得任何人都可以在網(wǎng)上發(fā)表自己的作品或資料,而不會有什么發(fā)布上和經(jīng)濟上的困難,這種信息發(fā)布的便利性使得網(wǎng)絡信息的數(shù)量迅速增加。另一方面,在互聯(lián)網(wǎng)上發(fā)表任何文章不需要經(jīng)過任何人或部門的審查和批準。由于這兩方面的原因,各種任意夸大、縮小、捏造、剪輯、畸彎、拼湊、克隆得到的信息,低水平重復、老化失效、無限泛濫和內(nèi)容不健康的無效信息都可以不受限制的在互聯(lián)網(wǎng)上發(fā)布,這就使得網(wǎng)絡信息的真實性和可靠性無法得到保障。1.3.4法律規(guī)范的滯后導致信息膨脹法制規(guī)范的滯后,使得各類網(wǎng)站的建設無法可依,信息發(fā)布處于無序狀態(tài),重復信息、無用信息充斥網(wǎng)絡,造成大量信息失實、冗余、超載,信息膨脹問題嚴重。一個健全的網(wǎng)絡法律體系應該包括通信與信息服務,電子商務和知識產(chǎn)權等各方面。在涉及的信息內(nèi)容方面,應包括信息采集、處理,互聯(lián)網(wǎng)信息、電子出版新聞等;在網(wǎng)絡信息安全方面,包括信息網(wǎng)絡安全、信息網(wǎng)絡保密、電子簽名與認證等;既要制訂管理性的法律法規(guī),又要制訂促進信息技術發(fā)展的法律法規(guī)。1.4解決信息膨脹問題的基本思路1.4.1加強網(wǎng)絡信息檢索新技術的開發(fā)1.4.2網(wǎng)絡信息檢索機制及應用的研究1.4.3本書網(wǎng)絡信息檢索的解決辦法1.4.4預期達到的效果1.4.1加強網(wǎng)絡信息檢索新技術的開發(fā)1.發(fā)展自然語言處理技術自然語言,是指作者的書面用語,采用自然語言。可以減少概念間轉(zhuǎn)換產(chǎn)主的誤差,檢索入口詞多,操作簡單、方便、靈活,也適合專業(yè)人員之外的廣大用戶群。對自然語言進行適當控制的方法有事先控制法和事后控制法。由于各種數(shù)據(jù)庫采用的檢索語言不同,試圖用一種檢索語言統(tǒng)一各種數(shù)據(jù)庫的不同分類體系及敘詞法是不現(xiàn)實的。采用中介語言來實現(xiàn)多種語言的兼容是一種新的嘗試。通過標準化手段實現(xiàn)各種檢索語言的兼容也是一種嘗試。標準化是檢索語言兼容的最高層次。2.大力發(fā)展智能化檢索技術智能化是網(wǎng)絡信息檢索工具的發(fā)展方向。實現(xiàn)檢索手段智能化的技術主要包括:蜘蛛(spiders)軟件的智能化。它可以對網(wǎng)頁上文獻的相關性及其所含鏈接的質(zhì)量作出判斷,篩掉不相關的網(wǎng)頁。智能搜索引擎技術(如AskJeeves)。其功能是:先通過模擬傳統(tǒng)檢索過程的咨詢協(xié)商,索取有關檢索數(shù)據(jù),再到大型知識庫中進行檢索。智能搜索引擎還具有推理能力、調(diào)整用戶檢索策略、提高檢索效率和提供用戶定制服務等功能。3.建立以用戶為核心的技術服務模式對現(xiàn)代信息技術的深層次開發(fā),創(chuàng)建和支持以用戶為核心的技術服務模式,是網(wǎng)絡檢索服務研究的重要內(nèi)容?!巴啤奔夹g,是指根據(jù)網(wǎng)上用戶個人需求的特征,運用“篩選”、“過濾”機制。將信息不斷、主動地提供給用戶的一系列軟件技術的總稱。網(wǎng)絡信息的查詢是一個設計、發(fā)現(xiàn)、歸納、總結的過程。信息的獲取,除了必要的技術條件外,還必需有相應的檢索方法與之配合。開展網(wǎng)絡環(huán)境下的信息檢索方法研究就成了一項非常的重要的工作。這項工作做好了,我們就可以建立一套從實際需要的角度出發(fā),以一定的查詢目的為起點,通過多種檢索途徑獲取所需資料的方法,更快、更多、更準確地在網(wǎng)絡上獲取信息,盡可能的減少或避免信息膨脹所帶累的負面影響。1.4.2網(wǎng)絡信息檢索機制及應用的研究針對WWW網(wǎng)站資源的組織過程與方式,理論界提出了檢索機制的三個組成部分,即采集標引機制、數(shù)據(jù)組織機制和用戶檢索機制。其中,以Robots為核心的網(wǎng)絡信息資源自動采集,旨在以HURL、HTTP為基礎,集中不同類型的信息產(chǎn)品,使全球范圍內(nèi)的各種信息資源能實時及時地進入信息系統(tǒng)。自動采集機制提供的網(wǎng)頁樣本,為網(wǎng)絡檢索工具的量化標引、量化評價提供理論根據(jù)。數(shù)據(jù)組織機制以數(shù)據(jù)采集為依據(jù),直接對網(wǎng)上索引數(shù)據(jù)庫系統(tǒng)的動態(tài)維護與管理產(chǎn)生影響。用戶檢索機制涉及用戶界面友好、檢索策略的合理程度、檢索執(zhí)行以及檢索結果的相關性處理等。目前,用戶可以直接使用的網(wǎng)絡檢索方法已有很多種類?,F(xiàn)有的檢索方法按照信息內(nèi)容組織方式可以劃分為分類范疇搜索引擎和詞語搜索引擎兩大類。按照專業(yè)范疇可以劃分為通用性和專業(yè)性查詢引擎兩類。按照檢索功能劃分為常規(guī)(或單一
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年浙江紹興市中醫(yī)院赴溫州醫(yī)科大學招聘應屆醫(yī)學類畢業(yè)生74人筆試備考題庫及答案解析
- 能級工資專項集體合同(2篇)
- 《孔乙己》說課稿10篇
- 南京工業(yè)大學浦江學院《招聘與培訓課程設計》2023-2024學年第一學期期末試卷
- 南京工業(yè)大學浦江學院《社會學概論》2021-2022學年第一學期期末試卷
- 分數(shù)的認識說課稿
- 內(nèi)蒙古自治區(qū)呼和浩特市蘭亭文苑C座住宅樓工程施工組織設計
- c語言維數(shù)組說課稿
- 南京工業(yè)大學浦江學院《計算機組成原理》2022-2023學年期末試卷
- 南京工業(yè)大學浦江學院《前廳運營與管理》2022-2023學年第一學期期末試卷
- 貨物供應、運輸、包裝說明方案
- 干部人事檔案查(借)閱審批表
- 離散數(shù)學-第三章:集合的基本概念和運算課件
- 藥物濫用知識培訓課件
- 四年級科學食物的消化課件
- 市人民醫(yī)院卒中防治中心培訓制度
- 中醫(yī)經(jīng)穴推拿模板課件
- “美麗醫(yī)院”建設工作匯報材料
- 鉆孔灌注樁鉆進成孔原始記錄表
- 小學綜合實踐二年級上冊第1單元《主題活動一:交通標志我會認》教案
- 壓力是否有利于成長辯論稿
評論
0/150
提交評論