NatureDNS--一種自然語言式域名尋址系統(tǒng).cas.201208.v4.from.cas_第1頁
NatureDNS--一種自然語言式域名尋址系統(tǒng).cas.201208.v4.from.cas_第2頁
NatureDNS--一種自然語言式域名尋址系統(tǒng).cas.201208.v4.from.cas_第3頁
NatureDNS--一種自然語言式域名尋址系統(tǒng).cas.201208.v4.from.cas_第4頁
NatureDNS--一種自然語言式域名尋址系統(tǒng).cas.201208.v4.from.cas_第5頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、收稿日期: 2012-08-07。劉振興,碩士研究生,網(wǎng)絡技術研究員,主要研究領域為IP網(wǎng)絡通信協(xié)議、互聯(lián)網(wǎng)后臺支撐技術、網(wǎng)絡架構與安全等。NatureDNS: 一種自然語言式域名尋址系統(tǒng)劉振興(人民網(wǎng)股份有限公司 人民網(wǎng)研究院, 北京 中國 100733)摘要 本文探討一種使用自然語言進行域名注冊登記、解析和尋址的方法?,F(xiàn)行的域名系統(tǒng)(Domain Name System,DNS)采用層級式的命名空間,點分多段表達式,域名與IP的對應關系維護在一個分布式的數(shù)據(jù)庫系統(tǒng)中。隨著網(wǎng)絡發(fā)展這種體系面臨:1)越來越多的人們被迫接受一種點分字符串作為訪問對象的標記,2)隨著新頂級域名的增多和國際化域名的

2、啟用,點分字符串的域名變得進一步復雜多變。在深入分析這一體系及其他相關改進型探索的基礎上,本文提出一種以“-”(hyphen)為起始和分級標記使用自然語言式字符串進行網(wǎng)絡尋址的新方法(“-xxxx”),取名為NatureDNS,即“自然語言式DNS系統(tǒng)”。關鍵詞 網(wǎng)絡地址;域名;域名系統(tǒng);網(wǎng)絡尋址;自然語言;國際化域名中圖分類號 TP3 文獻標識碼 ADOI: NatureDNS: an Approach to DNS Using Natural LanguagesLiu Zhenxing1 1(Institute of People Daily Online, People Daily On

3、line, Beijing 100733, China) Abstract This paper proposes a new approach to rebuilding the DNS using natural languages to register and resolve a domain name. The current DNS is a hierarchical naming system where a domain is expressed by a dot-delimited string and the mapping of domain names and IP a

4、ddresses are stored in a distributed database system. With the development of Internet, the DNS encounters: 1) more people are compelled to remember the ever-growing dot-delimited strings as resources addresses; 2) with new gTLD and the IDN are introduced, domain names become more complex than ever.

5、 Based on a deep investigation with the DNS and other refining works, the article presents a new method (“-xxxx”) that expresses a domain name with natural languages starting/separating with a hyphen (-) tag, named as “NatureDNS”, i.e., “express domain names in natural languages”. Keywords Network A

6、ddresses; Domain Name; Domain Name System (DNS); IP Addresses Lookup; Natural Languages; Internationalized Domain Names0 研究背景域名系統(tǒng)(Domain Name System, DNS)是互聯(lián)網(wǎng)關鍵性基礎服務之一,解決的問題是減省了人們需要記住數(shù)字IP地址的負擔,避免了因為IP地址變化導致域名所代表服務不可用,提供了多地址對應一個主機的可能 1 。IPv6作為IPv4的繼承者和替代者,正逐漸向人們走來。IPv6顯著的、首要的功能就是解決了IPv4地址短缺的問題 2 。地址空

7、間的增大,也帶來了地址表達式長度的增長,現(xiàn)行的IPv6地址的表達式為分號間隔16進制法,是IPv4的點分十進制表達式長度的39/15 =2.6倍。IP地址表達式的復雜,導致在應用中直接引用IP地址變得更加困難。因此,在可見的未來,直接使用IP地址的地方越來越少,取而代之的是使用易于理解和記憶的域名作為IP尋址手段,這會引起人們對域名系統(tǒng)更加依賴和重視。另一方面,域名系統(tǒng)也在不斷的發(fā)展,根據(jù)ICANN的數(shù)據(jù) 3 ,目前已經(jīng)有頂級域名326個,主要分為三類:通用頂級域名(gTLD)、國家代碼頂級域名(ccTLD)和贊助類頂級域名(sponsored)。2012年1月,經(jīng)過 ICANN第41屆新加坡

8、會議確定開放新頂級域名的申請,任何法人組織可以申請任意未被搶注的新頂級域名。根據(jù)2012年6月披露的首批新頂級域名的申請情況,共1930個新頂級域名申請通過初步審查 4 。與此同時,國際化域名從另一個視角來延展域名表達的豐富性在域名中引入非ASCII語言符號,也即國際化域名(Internationalized Domain Name, IDN)。多種頂級域名極大的豐富了域名的表達形式,但也可能會商標或者品牌保護帶來不利。更多的頂級域名意味著品牌擁有者需要注冊更多的域名來求得全面保護所持有品牌。以上兩個方面反映出,隨著IPv6的臨近,域名系統(tǒng)正變得日益重要;隨著新頂級域名和國際化域名的推行,域名

9、的表達變得豐富而“雜亂”。這些舉措會給域名系統(tǒng)帶來哪些變化,這些變化對于人們使用互聯(lián)網(wǎng)有哪些影響?有沒有一種更好的方法來解決這些問題?帶著這些思考和想法,本文深入分析了現(xiàn)有的域名系統(tǒng)以及與之相關的其他研究,提出一種使用自然語言來直接表達域名的新方法,并取名為“NatureDNS”。下面的章節(jié)內(nèi)容順序為:在第1章論述了現(xiàn)有DNS面臨的問題;第2章列舉和分析了目前對上述問題進行改進和補充的方式方法;第3章詳細闡述了NatureDNS域名系統(tǒng),分定義、注冊與解析過程、實例與應用場景、對比分析等小節(jié);第4章提出由現(xiàn)行DNS系統(tǒng)向NatureDNS過渡的方法;第5章進行總結;第6章補充了進一步的研究工作

10、。1 DNS系統(tǒng)面臨的問題1.1 DNS系統(tǒng)自身現(xiàn)行的DNS系統(tǒng)是1983年由美國兩位計算機科學家發(fā)明,起初的目標是取代維護在單機上的“主機表(host table)”5 。近30年后的今天看來這個系統(tǒng)仍在可靠地運行中,并可能將繼續(xù)為互聯(lián)網(wǎng)的發(fā)展作出貢獻。然而,今天的互聯(lián)網(wǎng)技術水平和發(fā)展規(guī)模,與幾十年前畢竟有很大不同,若以現(xiàn)在的條件來審視這一域名系統(tǒng),并結合該域名面臨的一些改革,有如下幾點不足可供改進。(1) 點分多級不均等域DNS要表達“域”的概念,將一個整體的互聯(lián)網(wǎng)劃分成.COM域,.NET域等,然后有了地區(qū)的.US域,.CN域等,之后才是每個域上的二級域。這種分法在理論是可靠的,也是可行

11、的,但卻不是最優(yōu)的,一個明顯的地方是,這種設計不是從人的角度去認識和區(qū)分互聯(lián)網(wǎng)。最早將網(wǎng)絡簡單的劃分為.COM/NET/ORG等有限的幾個域,顯然是過于簡略了,后期啟用了國家代碼頂級域名緩解了一下,目前的任意字符的頂級域名才更接近人的思維。不均等的.COM/NET/ORG等域帶來的問題是,域的擁有者都想擁有一個.COM的二級域,而網(wǎng)絡使用者則會首選.COM域去訪問(Error! Reference source not found.)。研究 6 發(fā)現(xiàn)大部分網(wǎng)絡用戶只用了很少一小部分DNS服務器。Figure 1 前五通用頂級域名的注冊量及百分比 7如果大多數(shù)二級域都在一個域里,那么這個域的分法

12、就值得商榷,最大的域就非常擁擠,資源也相對稀缺,有進一步細分的必要。DNS首要使命是解決人們難以記住IP數(shù)字地址,采用點分多級表達法降低了記憶難度,而沒有真正的解決這個問題。(2) 非自然語言點分多級的表達式強加給了人們另外一種語法,為了使用互聯(lián)網(wǎng),人們不得不像學習信件地址格式一樣再學習一種“網(wǎng)絡地址格式”。如果有可能,改成人們似乎用的自然語言來表達網(wǎng)址,就像信件的地址一樣,無疑會減省人們學習的網(wǎng)絡地址格式的繁瑣。(3) 受限的LDH表達式技術上看,DNS的域名可以使用任何八進制的字符,但實際被允許使用的字符集只是ASCII字符集的一個子集,也即字母a-z, A-Z、數(shù)字0-9和連字符“-”,

13、又由于域名不區(qū)分大小寫,所以實際使用的字符只有26個字母,10個數(shù)字,1個連字符共37個符號,這就是LDH規(guī)則(Letters, Digits and Hyphen)。就連使用其他ASCII符號做域名都不被允許,這從根本上否定了使用其他語言來注冊域名的可能性。如此小的字符集合,全世界的網(wǎng)絡使用者來搶注域名,這可能也是ICANN不斷探索新的域名表達式的原因之一。(4) 過度設計的127-253與現(xiàn)行的DNS狹小的表達空間相比,對域名長度的設計可謂綽綽有余。DNS設計成每個Label(每級域的名稱)的長度可以有63個字符,可以劃分成127級,總長度可以允許253個字符。統(tǒng)計數(shù)據(jù)顯示,目前注冊登記的

14、域名,平均長度只有11個字符(Error! Reference source not found.)。Figure 2 已注冊域名的長度分布 8如果在網(wǎng)絡上檢索,也能發(fā)現(xiàn)發(fā)現(xiàn)超長至63字符的域名,但多數(shù)是驗證域名的這條規(guī)則或者是另外一種噱頭,如9 。與IP地址的預留空間越大越好,設計給人類使用的域名,是越簡單越好,試圖挑戰(zhàn)人類的臨時記憶極限的方法可以再改進。(5) 其他問題也有其他學者指出 10,現(xiàn)行的DNS系統(tǒng)除了上述域名設計上的不足之外,還存在著記錄更新速度慢、服務模式單一、資源描述能力不夠強、配置易出錯等缺點。1.2 IPv6帶來的新需求如在“研究背景”一節(jié)所述,IPv6正向我們走來,其

15、中的一個顯著的變化是IPv6地址表達式長度增長到39字節(jié) 11,如,2001:0DB8:0000:2F3B:02AA:00FF:FE28:9C5A如果說在IPv4時代,還能夠將形如“”直接應用在程序中,那么在IPv6時代這種可能性變得更小。取而代之的,越來越多的應用選擇比以往更加頻繁地使用DNS系統(tǒng)進行尋址。隨著而來的還有互聯(lián)網(wǎng)的進一步滲透發(fā)展物聯(lián)網(wǎng),更多智能終端設備接入互聯(lián)網(wǎng)絡。這一方面會加重DNS服務器的負擔,另一方面會迫使用戶不得不在短域名之外尋找相對復雜難記的長域名來用,只要這個域名看起來比IPv6地址稍微好些就可以。谷歌2012年2月份宣稱其提供的Public DNS成

16、為世界上最大的DNS服務提供商,每天處理超過700億次查詢 12。這也帶來了一個新的契機,或籍此解決互聯(lián)網(wǎng)發(fā)展中的IP地址語義過載的問題 10,由于IPv6地址的復雜化,迫使應用層不再試圖使用網(wǎng)絡層的標識,把設備的身份標志和位置標志分離開來。2 DNS改進的方式方法2.1 關鍵詞尋址技術網(wǎng)絡技術從實驗室走出來之后,其絕大多數(shù)多用戶就由科研技術人員變成了普通民眾。人們在使用互聯(lián)網(wǎng)的時候更希望是使用已知的語言和方式進行相關操作,這催生了一種新的尋址方式的產(chǎn)生網(wǎng)絡關鍵詞(Internet Keyword)技術 13。網(wǎng)絡關鍵詞技術通過建立關鍵詞與網(wǎng)絡資源地址對應關系,來實現(xiàn)通過輸入某一特定關鍵詞直達

17、對應網(wǎng)絡資源地址的實現(xiàn)方式。網(wǎng)絡關鍵詞允許用戶直接使用企事業(yè)單位名稱、簡稱,商品、產(chǎn)品的全稱或者簡稱,網(wǎng)站的中文名稱等直接到達網(wǎng)站,對本地用戶來說,是非常接近自然語言的一種網(wǎng)絡資源定位方式,符合用戶的使用習慣。比如去清華大學的網(wǎng)站,使用“-清華大學”比“TSINGHUA.EDU.CN”更容易。然而,這種方式本質不是域名到IP地址的轉換,而是關鍵詞到URL地址的映射,因此不是真正意義上的域名系統(tǒng),而且域名系統(tǒng)相關的問題都沒有觸及。盡管十分好用,但需要單獨安裝額外的客戶端和沒有分層級的扁平結構阻礙了其進一步的發(fā)展。2.2 國際化/多語種域名與關鍵詞尋址技術不同,國際化域名(Internationa

18、lized Domain Name, IDN)是實實在在的要在域名中引入非ASCII字符,也即向使用本地語言來表達域名的方向努力。如前所述,之前的DNS中,受LDH規(guī)則限制,域名的表達方式只有37個ASCII字符,IDN將使用Unicode字符集內(nèi)的絕大多數(shù)字符,通過NamePrep(Name Preparation),ACE(ASCII-Compatible Encoding)等處理方式,把非ASCII字符轉換成ASCII的表達形式 14。Figure 3 中文域名如在已經(jīng)支持IDN技術的瀏覽器里輸入“導航.中國” ,瀏覽器將地址轉換為“”,同時加載“中文域名網(wǎng)址大全”的頁面,如Error!

19、 Reference source not found.所示。這是最接近自然語言的一種方式,如果去掉了中間的點號分隔符的話。它的不足在于只是對DNS改良,將非ASCII字符處理成ASCII字符,因為這個提供了其與現(xiàn)行DNS兼容的可行性,也因為這一點導致其無法再往前一步。另外,地址欄內(nèi)的Punycode代碼 15 對用戶也顯得不友好。如Error! Reference source not found.所示。Figure 4 地址欄內(nèi)的Punycode2.3 新頂級域名國際化域名解決的問題是使用非ASCII來表達域名,這一問題對英語國家來說是不存在的,可能也因為這一點,以說英語國家為主的互聯(lián)網(wǎng)管

20、理協(xié)調機構解決域名稀缺的問題角度也就不同。與非英語國家積極探索使用本地語言來表達域名的解決辦法不同,互聯(lián)網(wǎng)協(xié)調與管理機構ICANN最近幾年運作的對頂級域名擴增的部分日益加快 16。Figure 5 新頂級域名 17國際化域名與新頂級域名不是對立的舉措,在新頂級域名的申請中,也可以遞交非LDH的字符作為新頂級域名。根據(jù)ICANN的描述,ICANN 理事會于 2011 年 6 月通過決議,決定實施新 gTLD 計劃。2012年6月第一批1930個 “新頂級域名”通過初步審查,在此之前,已經(jīng)有22個“通用頂級域名 (gTLD)”和280個“國家頂級域名 (ccTLD)”。這一舉措緩解了DNS設計之初

21、簡單的.COM域劃分導致的域名稀缺,并且形成一套規(guī)則,隨著以后逐步推進頂級域可以無限多。然而,新頂級域名也為域名系統(tǒng)帶來負面影響,其中之一就是不利于企事業(yè)單位的品牌保護。理論上,設若有N種頂級域名,M種國家代碼頂級域名和K種國際化語言,那么一個公司要保全所有的注冊商標,需要注冊的域名個數(shù)為:T(域名總數(shù))= N(頂級域名)× M(國家代碼頂級域名)× K(國際化語言)根據(jù)已知的數(shù)據(jù)N=22, M=280,國際化語言版本在IDN實踐18中顯示,有98種.COM的語言版本,因此,以保護這個品牌UFQI為例,需要注冊的全部域名為:T = 22 × 280 ×

22、98 = 603,680 (個域名)若以每域名每年費用100元人民幣計,則企事業(yè)單位年度域名注冊費為:603,680 × 100 = 60,368,000 (元人民幣)如果再加上申請中的1930個“新頂級域名”,則是一筆更大的開支。有統(tǒng)計數(shù)據(jù)顯示19 ,截至2011年8月Google已經(jīng)注冊了9591個域名。其次,從另外一個角度來看,如果“域”可以隨意劃分和定義,那么“域”就沒有存在的意義了。再次,如此多的頂級域名,對普通用戶來說會因為選擇太多而顯得雜亂和無所適從,適得其反地使用戶對新頂級域名有抵觸感情。從而導致對用戶、對企業(yè)雙輸?shù)木置妗?.4 通用搜索引擎搜索引擎是廣義上的“關鍵詞

23、尋址技術”,解決了“關鍵詞”到網(wǎng)絡資源的定位,所不同的是,關鍵詞定位技術提供了直接跳轉,而搜索引擎提供的是與之相關的網(wǎng)絡資源列表。相比較之下,對普通用戶而言,搜索引擎對“找東西”的人來說,有更大的選擇和更友好的用戶體驗。和關鍵詞尋址技術一樣,搜索引擎也沒有解決DNS的核心任務解析域名到數(shù)字IP地址,隔離應用層和網(wǎng)絡層。也許普通用戶可以忘記DNS的存在,但應用層卻不能。2.5 其他對DNS的補充和改進如上所述,在域名設計層面對DNS系統(tǒng)做了一些改進的嘗試。除此之外,在其他層面上,對IP地址與域名的混用,對DNS的一些缺陷也做了許多補充,主要有HIP(Host Identity Protocol)

24、,PeerNet,URN(Uniform Resource Names),INS(International Naming System)和CoDoNS(Cooperative Domain Name System)等10。3 NatureDNS3.1 NatureDNS(1) NatureDNS的定義NatureDNS是一種以自然語言為域名表達形式,通過將自然語言編碼后的字符串與IP數(shù)字地址建立對應關系,實現(xiàn)網(wǎng)絡域名尋址的技術系統(tǒng)。它采用通過語義本身來隱式地定義域,使用符合本地語言語法的詞組或者句子的表達方式來定位網(wǎng)絡資源。NatureDNS域名由連續(xù)的實義字符組成,定義連字符“-”(hyp

25、hen)作為下一級子域的開始,或者稱之為NatureDNS的根域 (“-”) 。NatureDNS的域名必須以連字符開始,而不能以連字符結尾,可以有多個子級域,其正則表達式為:-(-+)(-)(-+)$連字符(hyphen)“-”在這里可以理解為“連接/前往(Connect/to)”某個主機/域,或者理解成就是一根可以連接任何網(wǎng)絡的網(wǎng)線,與在電話號碼前加“+”類似。下列NatureDNS域名表達式是合法的:Table 1 NatureDNS域名樣例No.NatureDNS域名現(xiàn)行DNS域名1-WeiboW2-我愛你禮品網(wǎng)3-新浪新聞N4-人民網(wǎng)-財經(jīng)F5-IBM-Redbooks-WEB下列N

26、atureDNS域名是不合法的:中國導航-People-其中兩個以上連續(xù)的連字符會被等同視為一個。域從大到小從左至右排列,域級之間使用連接符隔開,如:-live-mail-bay146-bay146w()上面的域名可以理解成從當前連接到live域的子域mail,再從mail的子域bay146中查找bay146w所代表的主機IP地址。由于“-人民網(wǎng)財經(jīng)”比“-人民網(wǎng)-財經(jīng)”更符合人們使用習慣,因此前者可以單獨注冊一個獨立域名以區(qū)別于后者“-財經(jīng)”作為“-人民網(wǎng)”的子域。(2) 注冊與解析NatureDNS與現(xiàn)行的DNS結構 2 相似,由4個部分構成:1)客戶端解析器,2)本地DNS服務器,3)授

27、權DNS服務器,4)根和頂級域DNS服務器。如Figure 6所示,其中的gTLD可能包含多層。Figure 6 DNS組成部分 6Figure 7 NatureDNS解析流程 NatureDNS解析過程除了在客戶端做編碼外,其余的與現(xiàn)有的DNS解析處理過程 20 一致,主要步驟如Error! Reference source not found.所示。NatureDNS域名的注冊過程與現(xiàn)有DNS注冊基本一致,除了在注冊時,生成域名的Punycode并同時以Punycode為索引來存儲和管理。為正確顯示和處理國際化語言,注冊系統(tǒng)要支持UTF-8等國際化語言顯示字符編碼。(3) NatureDN

28、S輪詢系統(tǒng)Figure 8 NatureDNS層級查詢樹NatureDNS的輪詢結構采用分層樹狀結構(如Error! Reference source not found.)。在最頂層根服務器(Root-A, B, C等)。每個Root后面對應著一組頂級域查詢服務器群,標記為“a”的負責進一步的解析NatureDNS域名Punycode編碼以字母a開頭的頂級域名,以“b”處理以字母b開頭的Punycode編碼的域名,循此直到z開頭、0-9開頭的頂級域名。頂級數(shù)據(jù)表中,視所查詢域名的情況,如果存在以連字符連接的二級域,則進一步按此形如“9a”, “9b”, “9c”開頭的形式做進一步的查找;如果

29、只有此一頂級域名,則從“a”獲得該域名的授權DNS服務器IP,請求被進一步的前轉到所查詢域名的授權DNS服務器,在那里獲知當前域名對應的IP數(shù)字地址。(4) 分析比較與評估NatureDNS系統(tǒng)使用一些新方法來實現(xiàn)使用自然語言進行扁平化的方式來表達域名地址。Unicode,是國際組織制定的試圖包括世界上所有文字和符號的字符編碼方案,目標定位于滿足用戶在計算機輸入的任何字符都能夠使用Unicode表示出來。盡管Unicode本身也在發(fā)展進化中,但比起使用某一種語言的某個字符集而言,其穩(wěn)定性相對較好。Unicode的實現(xiàn)方式之一UTF-8在互聯(lián)網(wǎng)上得到廣泛的使用。ACE Punycode,這種算法

30、滿足了將Unicode 表示的多語種域名編碼成ASCII 表示的域名,如此一來可以在不改變現(xiàn)有ASCII 域名協(xié)議的情況下,實現(xiàn)對國際化域名的支持,同時可以兼容舊的不支持Unicode的主機系統(tǒng),為并行和過渡系統(tǒng)提供了可能。Punycode提供了較好的Unicode與ASCII互轉的算法,除此,還可以考慮使用Base62x,實現(xiàn)類似功能 21 。層級式,與現(xiàn)行DNS系統(tǒng)一樣,NatureDNS繼承了這一優(yōu)點,發(fā)展和運行經(jīng)驗表明,這是一個穩(wěn)定的結構,在負載分發(fā)、可用性和部署方式上都表現(xiàn)不錯 6。另外一點需要考量的是性能。NatureDNS對比現(xiàn)行DNS系統(tǒng),在客戶端增加了將非ASCII字符轉為P

31、unycode代碼的開銷,在服務器端增加對非ASCII字符的存儲空間。在客戶端進行字符串進行轉碼的操作是運行在每個獨立的終端上,多一個轉碼步驟不會對DNS系統(tǒng)造成任何性能影響,一是運算處理是分布式地在每一臺終端進行,二是Punycode代碼是經(jīng)過優(yōu)選的算法,經(jīng)過這一轉碼操作之后進入DNS輪詢系統(tǒng)的只有Punycode。在NatureDNS的服務器端,在DNS記錄集上,多增加一個數(shù)據(jù)字段,這對于目前的計算處理能力和存儲空間來說,都是可以實現(xiàn)的。后期,在下文中會提到過渡方案,待到全部系統(tǒng)都支持Unicode(UTF-8)之后,Punycode轉碼就可以省略,服務器端的DNS記錄也可以減去一個字段,

32、整個DNS系統(tǒng)恢復到NatureDNS變更以前的狀態(tài)。因此在NatureDNS開始部署及從DNS向NatureDNS過渡期間,客戶端和服務器端可能會輕微地增加一些運算和存儲,理論上推算增加一步Punycode轉碼或增加一列字段,都不會對系統(tǒng)造成嚴重影響。3.2 實例及應用場景(1) 實例域名注冊與解析過程如下以“-有福氣網(wǎng)-科技”()的為例說明NatureDNS注冊與解析流程的運行機制。在注冊前端系統(tǒng)收集數(shù)據(jù),獲得“有福氣網(wǎng)”和“科技”的Punycode為“8ov35i1wnrsf”和“2qux23c” ,則在生成的DNS數(shù)據(jù)文件(“8ov35i1wnrsf.zone”和“有福氣網(wǎng).zone”

33、)里形成的對應記錄為:科技 2qux23c IN A 記錄格式為:UTF-8字符串 Punycode碼 Class RRType DataFigure 9 實例域名解析過程 該域名的解析過程如Error! Reference source not found.所示,每個步驟執(zhí)行內(nèi)容:S1. 客戶機發(fā)出“-有福氣網(wǎng)-科技”(8ov35i1wnrsf)的域名解析請求; S2. 本地DNS在本地緩存找到則直接返回給客戶機,如果沒有找到,則向根域“-”發(fā)出“-有福氣網(wǎng)-科技”(8ov35i1wnrsf)地址的請求;S3. 根域“-”根據(jù)其Punycode碼獲知是以“8”開頭的,遂將“8”

34、子域的參考信息(IP地址)返回給本地DNS;S4. 本地DNS訪問“8”DNS, 請求8ov35i1wnrsf域名的IP地址;S5. “8”DNS根據(jù)自己的記錄,將8ov35i1wnrsf對應的該域名的參考信息(授權DNS的IP地址)返回給本地DNS;S6. 本地DNS根據(jù)收到的IP地址,向授權DNS發(fā)出請求解析8ov35i1wnrsf域名的IP地址;S7. 8ov35i1wnrsf域名的授權DNS根據(jù)自己的記錄信息,返回8ov35i1wnrsf域名對應的IP地址給本地DNS;S8. 本地DNS將該域名和IP對應關系緩存后,將IP地址傳給客戶機。(2) 應用場景HTTP, EmailNatur

35、eDNS在實際應用場景中的情形如下, 如用NatureDNS域名在瀏覽器里訪問一個網(wǎng)站,有如下例子網(wǎng)址:http:/-有福氣網(wǎng)-科技/http:/-IBMhttp:/-BankofEnglandftp:/-大連大學如用在Email地址里,則用NatureDNS域名的email地址形如:張三-中國計算機學會JohnWang-NewYorkTimes在已知的語境下,如果當前位置期望的是一個主機IP或者域名,則根域(“-”)可以省略,變成http:/有福氣網(wǎng)-科技/劉振興有福氣網(wǎng)如用在命令行下,因為與參數(shù)標志符沖突,需要轉義操作,如:Shell> telnet -有福氣網(wǎng) 223.3 Natu

36、reDNS的優(yōu)點與現(xiàn)行的DNS系統(tǒng)相比,NatureDNS有如下幾點優(yōu)勢。(1) 使用本地化自然語言標記,易懂易記易用使用本地化自然語言既有利于品牌保護,將訪問域名設置成與商標、商品名稱相一致;也避開了非英文國家的人們在普及互聯(lián)網(wǎng)過程中遇到的障礙,本地化語言或能加速互聯(lián)網(wǎng)在非英語國家的推廣和普及,改進人們使用互聯(lián)網(wǎng)的方式。比如在中文環(huán)境中,每一個網(wǎng)站有個英文的網(wǎng)址,然后推廣的時候又需要取一個符合中文文化的名稱,使用NatureDNS就可以合二為一。無需去記憶“新華網(wǎng)”、“凱迪網(wǎng)”對應的域名“”和“”,當然也不會有兩個開心網(wǎng)“”和“”22 。(2) 自由的表達格式,寬松的表達空間以“.”為根域,

37、然后依次擴展頂級域,二級域等表達方式,以及僅用LDH字符等,不符合常規(guī)的英語語法,更不符合非英語國家的人們語言習慣。NatureDNS域名除了“-”字符外,不限定表達方式。與之相比,極大的豐富了表達式多樣性,從一個極小的37個字符的集合,擴大到所有Unicode字符,而且對語法也不作過多限制。(3) 避免過多頂級域名帶來的混亂現(xiàn)行DNS最早只劃分少數(shù)幾個.COM/NET/ORG頂級域,導致域名資源緊缺,現(xiàn)在推行任意頂級域名和國際化域名,或將引發(fā)域名注冊的混亂,使域名保護變得困難。如此前所述,在沒有推行新頂級域名之前,一個域名品牌要注冊603,680個域名才能保全所有頂級域和二級域,新增1930

38、個頂級域名之后,域名品牌保護將變得更加困難。NatureDNS沒有類別頂級域和地區(qū)頂級域,而是從語義上區(qū)分歸屬和類別,避免了這種可能的混亂局面。(4) 繼承并改進了層級結構NatureDNS繼承了現(xiàn)行DNS的層級樹狀輪詢系統(tǒng),并對其進行了改進。而且使用域名本身的特征碼,如首位字符將查詢量均分到所有服務器群。(5) 推進解決IP地址語義過載問題IP地址語義過載是IPv4時代就有的問題,如果沒有解決好域名緊缺和域名混亂相交互的局面,這個問題可能也要帶入到IPv6時代。NatureDNS域名因其易用性將有助于推進在應用層盡可能少地使用網(wǎng)絡層的設備標志IP地址。4 過渡方案過渡方案遵循的原則是與現(xiàn)有D

39、NS系統(tǒng)并行,同時使用UTF-8和Punycode記錄域名,對只支持ASCII的系統(tǒng),只使用Punycode定位;待所有DNS系統(tǒng)都支持UTF-8之后,減去Punycode編碼環(huán)節(jié)。在現(xiàn)行的DNS中并列運行一套新的NatureDNS系統(tǒng),根據(jù)先后順序并行情況可分為三期:i)前向兼容:在現(xiàn)行DNS中建立“.-”頂級域;ii)反轉切換:使用根域“-”替代現(xiàn)行的DNS中的“.”根域;iii)后向兼容:在NatureDNS頂級域中建立“-.”頂級域。4.1 前向兼容NatureDNS的切入點分DNS客戶端端升級和服務器升級。在客戶端,允許所有“-xxxx”命名的域名,并轉換成形如“xxxx.-”的現(xiàn)行

40、DNS系統(tǒng)格式,進入現(xiàn)行DNS解析系統(tǒng)。在服務器端,現(xiàn)行的DNS中寫入一個“.-”(dot hyphen)頂級域,接管發(fā)向現(xiàn)行DNS系統(tǒng)根DNS對“-xxxx”的解析請求。由新運行的“.-”域負責對NatureDNS新域名的解析,如Error! Reference source not found.所示。 Figure 10 增加新頂級域hyphen4.2 反轉切換啟用前向兼容后,引導企事業(yè)單位和個人將現(xiàn)行的DNS域名轉換為新的NatureDNS域名,待“.-”頂級域的使用量超過50%或更高占比之后,將現(xiàn)行DNS頂級的根域由“.”切換成“-”。此前這一時期之前是兩個DNS系統(tǒng)并行,實際上是在現(xiàn)

41、行DNS系統(tǒng)模擬運行NatureDNS系統(tǒng);此后全面啟用NatureDNS系統(tǒng),如Error! Reference source not found.所示。Figure 11 切換成hyphen為根域 4.3 后向兼容在全面啟用NatureDNS系統(tǒng)的同時,在“-”根域中寫入“-.”(hyphen dot) 頂級域,負責解析現(xiàn)行DNS的原域名如“”。與此同時升級客戶端解析,增加功能將“”的域名轉為“-”發(fā)給在NatureDNS中頂級域“-.”負責解析,也即在NatureDNS中模擬運行原DNS系統(tǒng),如Error! Reference source not found.所示。Figure 12

42、在hyphen根域中增加dot頂級域 此時,在“-”根域中模擬解析“.”根域的域名,待到“”的歷史DNS域名流量逐漸減少到一個極小的量級后,設定一個緩沖期,然后永久性關閉“-.”頂級域,DNS系統(tǒng)全面地、單一地使用全新的NatureDNS系統(tǒng)。5 結 論本文提出了一種新的域名系統(tǒng)方法,由使用以hyphen為起始和分級標記的域名表示方法(“-xxxx”)和基于這種域名的注冊、解析系統(tǒng)組成,被命名為NatureDNS,即“自然語言式域名尋址系統(tǒng)”?,F(xiàn)行DNS在域名設計層面存在一些問題,如點分多級不均等域、只有LDH表達字符等,這些問題阻礙了DNS系統(tǒng)進一步發(fā)展。針對這些問題技術專家們從未停止探索的

43、腳步,提出各種改進和補充的方式方法,如上文所列舉的關鍵詞尋址、國際化域名、新頂級域名,以及其他學者提出相關改進措施。由于域名系統(tǒng)的基礎性與關鍵性,雖有改進但主要問題依然存在。本文提出一種新的方法,將域名重新定義為以hyphen開頭任意實義字符組成的連續(xù)字符串格式(“-xxxx”),極大地擴展了域名表達的多樣性和豐富性。并在上文章節(jié)中給出了詳細的闡述,對其注冊與解析過程、實例與應用場景、過渡方案等環(huán)節(jié)做了詳細分析。相比較而言,NatureDNS優(yōu)勢在于:ü使用本地化自然語言標記,易懂易記易用ü自由的表達格式,寬松的表達空間ü避免過多頂級域名帶來的混亂ü繼承

44、并改進了層級結構ü推進解決IP地址語義過載問題對NatureDNS這個新事物而言,還有一些研究工作要做,隨后一章列舉了二點:一個實體名的多個變體和Unicode的進化對NatureDNS的影響。我們相信NatureDNS域名系統(tǒng)會給全球網(wǎng)絡系統(tǒng)帶來一些思考和改進,使得DNS系統(tǒng)不再是阻礙互聯(lián)網(wǎng)發(fā)展的因素,而是促進互聯(lián)網(wǎng)更快更好地惠及全球,讓人類的生活變得更加美好。6 進一步的研究6.1 一個實體名的多個變體使用自然語言來表示域名為域名的表達提供了極大的豐富性和多樣性。NatureDNS除了占用了“-”(hyphen)作為標志符和分節(jié)符,其余所有的語法形式和可打印的字符形式都是被允許的

45、。這可能面臨一個問題是,具體到一個實體名,可能有多種表達方式,如同一個人有全名、昵稱、俗稱、簡稱一樣,到底使用哪個來注冊,還是全部都要注冊需要制定的相應的規(guī)則。6.2 Unicode進化帶來的影響由于兼容國際化語言,經(jīng)過權衡我們選擇了Unicode統(tǒng)一編碼字符集,并推薦了Punycode和Base62x兩個將Unicode字符ASCII化的編碼方案。然而,Unicode本身也在進化中,這種進化盡管幅度很小、步子很慢,但可能因此影響到NatureDNS的穩(wěn)定性作為互聯(lián)網(wǎng)基礎核心服務,DNS對穩(wěn)定性的要求無論多么苛刻都不為過。對此,隨著Unicode的日趨成熟,其變化頻次逐漸減少;另外只要Natu

46、reDNS有相應的更新修正機制即可應對。參考文獻 1 J. Klensin. IETF RFC3467, , 2012.06.15.2 Z. Liu., L. Liu., et al, "Dot-base62x: A Compact Textual Representation of IPv6 Address for Clouds," in UCC '11 Proceedings of the 2011 Fourth IEEE International Conference on Utility and Cloud Computing, Melbourne, 20

47、11.3 Root Zone Database, , 2012.06.15.4 New gTLD Reveal Day - Applied-for Strings, , 2012.06.15.5 P. Mockapetris. IETF RFC882, , 2012.06.15.6 J. Pang., J. Hendricks. and et. al, "Availability, usage, and deployment characteristics of the domain name system," in IMC '04 Proceedings of t

48、he 4th ACM SIGCOMM conference on Internet measurement, Sicily, Italy, 2004.7 Global Domain Registry Statistics, , 2012.06.15.8 Domain Name Length Allocation, , 2012.06.159 The Worlds Longest Domain Name, , 2012.06.1510 D. Liu., Y. Chen., K. Xie. and J. Wu, "Research on the Structures and Resolu

49、tions of Internet Namespaces," Journal of Software, vol. 16, no. 8, pp. 1445-1455, 2005.11 B. Stockbrand, IPv6 in Practice - A Unixer's Guide to the Next Generation Internet, Verlag Berlin Heidelberg: Springer, 2007, pp. 22-29.12 Google Public DNS: worlds largest DNS service, , 2012.06.1513

50、 W. Mao.;Y. Wang., F. Wang., "The New Generation Technologies of Internet Resources Naming and Addressing," Application Research of Computers, vol. 21(4), pp. 233-235,250, 2004.14 H. Zhang., X. Deng. and H. Qian., "Analysis of Internationalized Domain Name System," Journal of Com

51、puter Applications, vol. 22(10), pp. 9-11, 2002.15 IETF RFC 3492, “Punycode: A Bootstring encoding of Unicode for IDNA”, , 2012.06.1516 ICANN, “New Generic Top-Level Domains”, , 2012.06.1517 NetC, “New gTLD”, , 2012.06.1518 IANA, “Repository of IDN Practices”, , 2012.06.1519 Tuwang, “Google一共有多少個域名”

52、, , 2012.06.2020 J. Gan. and L. Huang., "The Research on Translating of Domain name and Practice of Server Configuration," JOURNAL OF YULIN NORMAL UNIVERSITY (Natural Science), vol. 28, no. 5, pp. 136-141, 2007.21 Z. Liu, L. Liu, R. Hill and Y. Zhan, "Base62x: An alternative approach

53、to Base64 for non-alphanumeric characters," in Fuzzy Systems and Knowledge Discovery (FSKD), 2011 Eighth International Conference, Shanghai, 2011.22 人民網(wǎng),“兩個開心網(wǎng)之爭”,, 2012.06.15-作者簡介及聯(lián)系方式-第一作者:劉振興電話:手機:139 1190 1921Email:作者簡介:劉振興,人民網(wǎng)研究院網(wǎng)絡技術研究員,碩士研究生學位,主要研究領域為IP網(wǎng)絡通信協(xié)議、互聯(lián)網(wǎng)后臺支撐技術、網(wǎng)絡安全與架構等,在上述領域發(fā)表過一些

54、中英文論文。本文研究背景:This paper makes a deep investigation into the Domain Name System (DNS). DNS is regarded as one of the core and critical infrastructures of Internet. It transfers human-readable names into IP addresses under the networks, and vice versa.Due to its design of domain names which only allow

55、 LDH (letters, digits and hyphen) characters to be used in, the DNS cannot cope with the increasing demand for more domain names arising by more devices are connected to Internet, especially to mobile Internet. Another reason to encourage scholars to look for improvements to the DNS is IP overload i

56、n semantics. Some other issues are also found with the DNS, e.g. unique service model, slow update speed and weak capacity in resource description.Thus, lots of efforts have made to improve the DNS. The list may include IKA (Internet Keyword Addressing), IDN (Internationalized Domain Name), new gTLD

57、, HIP (Host Identity Protocol), PeerNet, URN (Uniform Resource Names) and INS (International Naming System). The second group is from IETF where there is a long list of RFC amendments for the DNS. More or less, they have matured the DNS in some way or bring new features to it. However, the DNS still has a few issues which hold back the progress of Internet to a certain extent. This paper proposes a new me

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論