下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
2022年中國互聯網絡信息資源數量調查報告信息資源數量調查報告主持單位:國務院信息辦推廣應用組承辦單位:中國互聯網絡信息中心完成時間:2022年2月〔本文圖均略〕目錄第一局部調查背景1第二局部調查表明2一、調查對象2二、調查內容2三、調查時間3四、有關概念3五、調查辦法4六、調查問卷7七、組織單位7第三局部調查結果9第一章域名、網站數及地辨別布9一、域名數9二、網站數10第
二章網站性質及效勞內容12一、網站按性質分類12二、網站的根本情況13三、各類型網站信息效勞內容及信息更新情況29第三章網頁數量及性質特征60一、全國網站的網頁情況60二、國內前100家大型網站的網頁情況63三、全國網站的網頁與國內前100家大型網站的網頁情況比擬65第四章在線數據庫數量及性質67一、在線數據庫數量及各類網站擁有在線數據庫情況67二、在線數據庫按內容和記錄數分類情況70第五章總結79一、域名統(tǒng)計79二、網站統(tǒng)計79三、網頁統(tǒng)計85四、在線數據庫統(tǒng)計86圖目錄圖1地區(qū)域名數量分布10圖2www站點性質分類10圖3地區(qū)網站數量分布11圖4不同性質類型網站分布圖-餅狀圖12圖5不同性質類型網站分布圖-柱狀圖〔〕13圖6平均每個網站每天的頁面訪問數13圖7網站每天的頁面訪問數-按類型分布14圖8企業(yè)網站每天的頁面訪問數-按行業(yè)分布〔〕15圖9制造業(yè)企業(yè)網站每天的頁面訪問數〔〕16圖10IT業(yè)企業(yè)網站每天的頁面訪問數〔〕16圖11各類網站的網站鏈接情況17圖12各網站鏈接數的網站比例18圖13各類網站的信息主要來源情況19圖14各類網站提供的語種/文字閱讀情況20圖15各類網站提供全站信息搜索的情況21圖16各類網站的網頁上提供網站地圖的情況21圖17各類網站的網頁上提供聯系方式的情況22圖18各類網站效勞器擁有情況22圖19擁有效勞器的網站比例23圖20各類網站擁有效勞器情況24圖21擁有效勞器的各類網站所采用的操作系統(tǒng)情況25圖22負責網站運營的全職員工人數情況26圖23各類網站負責運營的平均全職員工人數26圖24各類網站負責運營的全職員工人數擁有情況27圖25網站的成立時間-餅圖28圖26提供各類信息效勞的政府網站的比例30圖27政府網站交互性效勞31圖28政府新聞更新周期32圖29政府職能/業(yè)務介紹更新周期32圖30統(tǒng)計數據/資料查詢更新周期33圖31法律法規(guī)/政策/文件更新周期33圖32辦事指南/表明更新周期34圖33辦公/業(yè)務咨詢信息更新周期34圖34政府通知/公告更新周期35圖35辦事進程狀態(tài)查詢更新周期35圖36企業(yè)/行業(yè)經濟信息更新周期36圖37便民生活/住行信息更新周期36圖38表格下載更新周期37圖39政府公告、新聞、政策等信息通過網站發(fā)布情況37圖40政府日常辦公事務與網站相關效勞的結合程度38圖41提供下列信息效勞的企業(yè)網站的比例39圖42提供下列交互效勞的企業(yè)網站的比例40圖43企業(yè)網站信息總體更新情況41圖44企業(yè)介紹更新周期41圖45產品/效勞介紹更新周期42圖46行業(yè)新聞更新周期42圖47企業(yè)動態(tài)更新周期43圖48售后效勞/技術支持更新周期43圖49行業(yè)解決計劃更新周期44圖50行業(yè)報告更新周期44圖51電子期刊更新周期45圖52招聘信息更新周期45圖53企業(yè)網站的行業(yè)分布46圖54制造業(yè)中各類網站的分布47圖55IT業(yè)中各類網站的分布47圖56企業(yè)產品、效勞、企業(yè)新聞等信息通過網站發(fā)布情況48圖57企業(yè)業(yè)務與網站的結合程度48圖58提供各類效勞的商業(yè)網站的比例50圖59提供各類信息的商業(yè)網站的比例51圖60商業(yè)網站總體信息更新情況52圖61商業(yè)網站新聞更新周期52圖62商業(yè)網站產品信息更新周期53圖63商業(yè)網站貿易信息更新周期53圖64商業(yè)網站企業(yè)信息更新周期54圖65商業(yè)網站科技信息更新周期54圖66商業(yè)網站教育信息更新周期55圖67商業(yè)網站招聘信息更新周期55圖68商業(yè)網站金融財經信息更新周期56圖69商業(yè)網站房地產信息更新周期56圖70商業(yè)網站汽車信息更新周期57圖71商業(yè)網站休閑娛樂信息更新周期57圖72商業(yè)網站生活效勞信息更新周期58圖73商業(yè)網站體育信息更新周期58圖74商業(yè)網站醫(yī)療健康/保健信息更新周期59圖75商業(yè)網站文學藝術信息更新周期59圖76商業(yè)網站旅游交通信息更新周期60圖77商業(yè)網站交友征婚信息更新周期60圖78全國網站的靜動態(tài)網頁數61圖79網頁的更新周期62圖80全國前100家大型網站的動靜態(tài)網頁數63圖81全國前100家網站的網頁更新周期64圖82前100家大型網站與全國網站的網頁更新周期66圖83各類網站擁有的在線數據庫數和占全部在線數據庫的比例67圖84各類網站擁有在線數據庫的比例68圖85各類網站/平均每個網站擁有數據庫數量情況69圖86各類網站平均擁有在線數據庫數量情況69圖87擁有不同在線數據庫數的網站比例70圖88擁
有各類在線數據庫的網站比例情況71圖89各類在線數據庫平均擁有的記錄數72圖90各類在線數據庫的更新周期情況73圖91各類在線數據庫的每次更新比率情況75圖92各類網站在線數據庫具有其它載體情況76圖93各類網站在線數據庫具體載體形式76圖94在線數據庫收費情況77圖95在線數據庫面向對象情況78表目錄表1調查內容和指標2表2地區(qū)
域名數量分布9表3www站點性質分類10表4地區(qū)網站數量分布11表5各類網站的網站鏈接情況17表6各類網站的信息主要來源情況18表7各類網站提供的語種/文字閱讀情況20表8各類網站擁有效勞器情況23表9擁有效勞器的各類網站所采用的操作系統(tǒng)情況25表10各類網站負責運營的平均全職員工人數擁有情況27表11網頁數及網頁字節(jié)數情況61表12網頁的編碼情況62表13網頁的內容分類情況〔按多媒體形式〕62表14網頁的更新周期情況62表15前100家網站的網頁數及網頁字節(jié)數情況63表16前100家網站的網頁編碼情況63表17前100家網站的網頁內容分類情況〔按多媒體形式〕64表18前100家網站的網頁更新周期64表19在線數據庫數量及分布情況67表20各類網站擁有在線數據庫情況68表21擁有各類在線數據庫的網站比例情況70表22各類在線數據庫平均擁有的記錄數71表23各類在線數據庫的更新周期情況73表24在線數據庫的每次更新記錄比率情況74表25在線數據庫的載體情況75表26各類網站在線數據庫具體載體形式76表27在線數據庫收費情況77表28在線數據庫面向對象情況78第一局部調查背景信息資源是國家的戰(zhàn)略資源,它在國民經濟信息化中位于核心的地位。正確開發(fā)、利用信息資源對促進我國信息化的快速開展,導正我國信息化的開展方向,拉動國民經濟和社會開展,提高全民族的文化素質和創(chuàng)新能力,促進社會進步和繁榮,實施西部大開發(fā)戰(zhàn)略等方面有著十分重要的意義?;ヂ摼W絡信息資源是信息資源的重要組成局部,自從20世紀90年代中期開始,互聯網在我國迅猛開展,網上中文信息資源快速增長,到2022年12月31日,全國在線數據庫到達82929個,共15709萬個網頁,2744G數據量。網上政府信息、行業(yè)和企業(yè)信息、科技教育信息、文化娛樂信息、新聞信息、旅游信息、區(qū)域特色信息等均已形成一定規(guī)模。隨著互聯網絡的飛速開展,我國互聯網絡信息資源得到了很大的開展,但是我國互聯網絡信息資源不斷進展的同時,存在一些問題需要重視。示例,網絡和數據庫存在大量低水平重復建設,難以實現互聯共享;信息資源的開發(fā)滯后應用,存在大量信息孤島現象等。因此,加大對我國互聯網絡信息資源開發(fā)和利用的引導力度,迫在眉睫。為加深政府對我國互聯網絡信息資源開發(fā)和利用情況的把握,包括信息資源的存量、增量以及地區(qū)和行業(yè)分類特征等,為加快制定有關信息資源開展政策和措施提供重要參考依據,促進政府對信息資源開發(fā)的有力引導,促進我國互聯網絡信息資源的充沛利用,國務院信息化工作辦公室決定對我國各行、各業(yè)、各地區(qū)互聯網絡信息資源數量情況進行全面調查。本次調查是我國互聯網絡信息資源的第三次數量調查,開始于2022年12月,結束于2022年2月,歷時3個月。在保持與前二次調查有一定連續(xù)性、借鑒前二次調查成功經驗的根底上,在調查辦法、調查深度、結果分析等方面有所創(chuàng)新。本次調查初步探索了我國互聯網絡信息資源開展中的問題和規(guī)律,為我國政府進一步正確引導互聯網絡信息資源的開發(fā)利用提供了重要參考。第二局部調查表明一、調查對象所有域名注冊單位屬于中國〔不包括香港、澳門、臺灣〕的網站總和,包括.COM,.NET,.ORG和.CN域名(含ORG.CN,GOV.CN,EDU.CN等)下的所有網站。二、調查內容表1調查內容和指標指標數據來源備注域名數量CIC數據注冊商上報網站數量CIC數據注冊商上報網頁數量計算機自動搜索在線數據庫數量問卷調查域名各地區(qū)域名分布狀況CIC數據注冊商上報網站各地區(qū)網站分布狀況CIC數據注冊商上報按照省級行政區(qū)域劃分各種性質的網站分布狀況按照網站的域名特征劃分主要類型網站提供的效勞問卷調查政府、商業(yè)、企業(yè)各行業(yè)網站分布狀況按照規(guī)范行業(yè)分類法網站相關特征每天頁面訪問數效勞器擁有情況網站的鏈接數網站的員工數網站成立時間頻道數網站版本網站的可訪問性網站地圖等平安性防火墻、操作系統(tǒng)等網站效果指標信息發(fā)布可用性度量業(yè)務結合網頁網頁按內容形式分類比例計算機搜索包括圖像、音頻和視頻網頁按性質分類比例政府、企業(yè)、商業(yè)等網頁按地域分布比例省域及七大辨別布網頁長度以字節(jié)數計算網頁的更新周期網頁編碼狀況簡、繁體中文、英文等在線數據庫按性質分類比例問卷調查政府、企業(yè)、商業(yè)網站等按地域分布比例華北、華南等七大辨別布按內容分類比例產品、科技信息數據庫等按形式分類比例圖形文字數據綜合等按使用情況分類比例分自用和公用公用下分免費和收費收費下分收費方式按效勞方式分類比例面向終端用戶或中介在線數據庫更新狀況-數據庫容量物理存儲量〔G〕是否同時具有其它載體否、是〔光盤、紙質等〕三、調查時間調查時間:2022年12月-2022年2月;數據截至時間:2022年12月31日。四、有關概念1.在本次調查中,中國互聯網絡信息資源定義為:中國互聯網絡上公開發(fā)布的網頁和在線數據庫的總和。2.中國互聯網絡是指所有域名注冊單位屬于中國大陸的網站總和。3.在線數據庫是指以Web為界面,提供公共檢索的收費或免費的數據庫。4.網站是指有獨立域名的web站點,其中包括CN和通用頂級域名〔gTLD〕下的web站點。此處的獨立域名指的是每個域名最多只對應一個網站WWW.域名,如:對域名sina來說,它只有一個網站www.sina,并非它有news.sina、mail.sina……等多個網站。5.商業(yè)網站指業(yè)務主要在網上進行的電子商業(yè)網站,如新浪、搜狐、網易等網站;企業(yè)網站是相對于商業(yè)網站而言,指業(yè)務主要在網下進行的企業(yè)所建立的網站,如聯想集團的網站www.lenovo。6.網頁搜索是指對抽取的網站從其首頁〔WWW域名〕開始搜索,通過網頁上的層層鏈接,抓取所有屬于該網站的網頁的特征及其文本內容。7.靜態(tài)網頁是指URL中不含?和輸入參數的網頁,包括:*.htm、*.html、*.shtml、*.txt、*.xml等。8.動態(tài)網頁是指URL中含?或輸入參數的網頁,包括:A,PHP,PERL,CGI等在Server方進行處理的網頁。9.網頁的編碼形式:是根據網頁本身的信息通過分析得到的,不是通過一篇網頁在HTML中的聲明來判斷的。因為大量國內的英文網頁在其HTML聲明中都是簡體中文。10.網頁的內容形式:是通過文件后綴獲得的。關于圖像、音頻、視頻的文件后綴定義規(guī)范參考MIME規(guī)范。11.網頁的更新情況:網頁的更新時間是指搜索到該網頁的當日日期與該網頁的最后更新日期之間的時間段。五、調查辦法〔一〕數據獲取方式和渠道域名和網站的總量數據通過國內各國際域名注冊商和CIC聯合獲得。網頁的特征數據由百度公司利用搜索技術對全國網站進行搜索獲得。搜索時通過URL判斷同一網頁是否有多個鏈接指向,防止了對這類網頁的重復計算,通過判斷不同網站的IP地址和首頁字節(jié)數是否相同,排除了不同域名指向同一網站的情況。網站的特征數據及在線數據庫的特征數據通過CallCenter問卷調查的方式獲得。〔二〕調查問卷的抽樣辦法1.總體界定按照對中國互聯網絡信息資源的定義〔中國互聯網絡上公開發(fā)布的網頁、在線數據庫的總和〕,同時考慮到未注冊域名而提供效勞的網站數量較少以及調查的難度,本次調查中所指的總體為:中國〔不包括香港、澳門、臺灣地區(qū)〕所有已注冊域名的網站,包括.COM,.NET,.ORG和.CN域名(含ORG.CN,GOV.CN等)下的所有網站。2.抽樣框關于抽樣框,最直接的作法是選擇抽樣框為全國有域名的網站名錄。由于保密性的原因,抽樣過程需要委托各域名注冊/代理商完成,從方便實施并提高數據精度的角度考慮選擇抽樣框為全國〔不含港、澳、臺〕范圍內的域名名錄。由于一個網站可能會有兩個或兩個以上域名,而有的域名沒有建立網站。這樣對于總體而言,就出現了抽樣框單位沒有對應的抽樣單位、抽樣框單位和抽樣單位不一一對應等問題。對此,考慮采用排除、事后加權等辦法來解決。3.抽樣辦法本次調查的抽樣辦法采用分層按比例抽樣:考慮到各域名類別下網站特征的差異,首先按域名類別分層;之后在每個類別內采用定距抽樣的辦法來抽取樣本,最后對調查結果進行事后加權處理以估計全國范圍的估計量。下面分階段表達抽樣辦法:第一階段:將樣本量分到各層因為到目前〔2022年11月〕為止只有截止2022年6月30日的全國范圍的域名數的情況;同時考慮到我們主要是利用各類別域名數之間的比例關系來確定樣本量在各層的分配,而這種關系應該不會有較大的變化。因此本計劃按照截止2022年6月30日的各類別域名數占全國域名總數的比例將樣本總量分配到各域名類別。第二階段:將樣本量分配到各域名注冊/代理商抽樣過程由域名注冊/代理商按照抽樣方法〔由中國互聯網絡信息中心提供〕抽取指定數量的域名作為樣本。樣本按照各域名注冊/代理商所注冊擁有的域名數的比例進行分配。具體計算方法如下:Mij=Mj×〔Nij/Nj〕其中:Mij表示第i家域名注冊/代理商所應抽取第j類的域名數,Mj表示第j類應抽取的域名樣本數,Nij表示第i家域名注冊/代理商所擁有第j類的域名總數,Nj表示第j類的域名總數。第三階段:各家域名注冊/代理商抽取域名樣本考慮到盡可能簡化各域名注冊/代理商抽取樣本的工作量和保證抽樣的精度,要求各域名注冊/代理商在整理了域名名錄〔抽樣框〕后采用等距抽樣,抽取樣本步驟如下:步驟1:分組以域名的類別為單位對域名名錄進行分組。步驟2:排序由域名注冊/代理商對其抽樣框〔域名名錄及相關信息〕內各組域名首先按照域名注冊單位所屬省份排序,進而在域名注冊單位所屬省份下按域名注冊先后時間進行排序。步驟3:編號對各組內完成排序的域名進行編號。域名注冊單位所屬省份排序和編號規(guī)那么規(guī)定如下:序號省市區(qū)序號省市區(qū)序號省市區(qū)序號省市區(qū)1北京9上海17湖北25云南2天津10江蘇18湖南26--3河北11浙江19廣東27陜西4山西12安徽20廣西28甘肅5內蒙古13福建21海南29青海6遼寧14江西22重慶30寧夏7吉林15山東23四川31--8黑龍江16河南24貴州步驟4:抽取樣本以第i個域名注冊/代理商、抽取第j類樣本的過程為例表達如下。第i個域名注冊/代理商在第j組域名列表中抽取出
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 智慧城市建設中工業(yè)互聯網平臺的應用與發(fā)展
- 課題申報參考:教育元宇宙與生成式人工智能相結合的研究教育技術學的理論與方法研究
- 2025年個人一般貨物買賣合同(4篇)
- 二零二五年度知識產權質押融資合同原告代理詞4篇
- 2025年度珠寶行業(yè)專業(yè)展會組織與管理合同3篇
- 二零二五版木地板原材料采購與庫存管理合同8篇
- 二零二五版生態(tài)修復項目工程建議書編制合同2篇
- 2025年現代學徒制校企合作教學資源共享協(xié)議3篇
- 2025版小區(qū)快遞柜場地租賃與快遞配送服務協(xié)議3篇
- 二零二五年度彩鋼瓦屋頂安裝施工服務協(xié)議3篇
- 四川省成都市武侯區(qū)2023-2024學年九年級上學期期末考試化學試題
- 初一到初三英語單詞表2182個帶音標打印版
- 2024年秋季人教版七年級上冊生物全冊教學課件(2024年秋季新版教材)
- 環(huán)境衛(wèi)生學及消毒滅菌效果監(jiān)測
- 2024年共青團入團積極分子考試題庫(含答案)
- 碎屑巖油藏注水水質指標及分析方法
- 【S洲際酒店婚禮策劃方案設計6800字(論文)】
- 鐵路項目征地拆遷工作體會課件
- 醫(yī)院死亡報告年終分析報告
- 中國教育史(第四版)全套教學課件
- 2023年11月英語二級筆譯真題及答案(筆譯實務)
評論
0/150
提交評論