拓爾思語義智能領(lǐng)軍者大數(shù)據(jù)+AI雙輪驅(qū)動打開公司廣闊空間_第1頁
拓爾思語義智能領(lǐng)軍者大數(shù)據(jù)+AI雙輪驅(qū)動打開公司廣闊空間_第2頁
拓爾思語義智能領(lǐng)軍者大數(shù)據(jù)+AI雙輪驅(qū)動打開公司廣闊空間_第3頁
拓爾思語義智能領(lǐng)軍者大數(shù)據(jù)+AI雙輪驅(qū)動打開公司廣闊空間_第4頁
拓爾思語義智能領(lǐng)軍者大數(shù)據(jù)+AI雙輪驅(qū)動打開公司廣闊空間_第5頁
已閱讀5頁,還剩17頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

拓爾思-語義智能領(lǐng)軍者大數(shù)據(jù)+AI雙輪驅(qū)動打開公司廣闊空間1對標(biāo)Elasticsearch,公司搜索引擎數(shù)據(jù)庫有望加速國產(chǎn)替代1.1大數(shù)據(jù)時代,搜索引擎數(shù)據(jù)庫邁入快速發(fā)展階段1.1.1搜索引擎數(shù)據(jù)庫專注信息檢索,解決大數(shù)據(jù)時代信息復(fù)雜關(guān)聯(lián)問題搜索引擎數(shù)據(jù)庫是一類專門用于數(shù)據(jù)內(nèi)容搜索的非關(guān)系數(shù)據(jù)庫。搜索引擎數(shù)據(jù)庫使用索引對數(shù)據(jù)中的相似特征進(jìn)行歸類,并提高搜索能力。搜索引擎數(shù)據(jù)庫經(jīng)過優(yōu)化,以處理可能很長、半結(jié)構(gòu)化或非結(jié)構(gòu)化的數(shù)據(jù),它們通常提供專業(yè)的方法,例如全文搜索、復(fù)雜搜索表達(dá)式和搜索結(jié)果排名。搜索引擎的本質(zhì)是根據(jù)用戶的輸入完成分詞匹配。搜索是以token詞為最基本的搜索單元,一個搜索語句經(jīng)過搜索引擎的分詞器會產(chǎn)生幾個token,利用分詞去構(gòu)建對應(yīng)的倒排索引,在用戶搜索的時候,搜索對應(yīng)的分詞器分出的一個token時和索引中所存儲的一個分詞找到需要的文檔。這種索引方式不需要去遍歷所有的文檔,而只需要遍歷索引詞,即可以滿足對應(yīng)的效果,大大提高了搜索速度。目前國外廠商占據(jù)搜索引擎引擎數(shù)據(jù)庫行業(yè)領(lǐng)先地位。目前全球范圍內(nèi)主要全文搜索引擎有:Lucene、Elasticsearch、Splunk、Solr。其中Lucene是一個開放源代碼的全文檢索引擎工具包,不是一個完整的全文檢索引擎,而是一個全文檢索引擎的架構(gòu),ES和Solr均基于此架構(gòu)。根據(jù)DB-Engines的排名顯示,Elasticsearch自2016年至今始終是最受歡迎的企業(yè)搜索引擎,其次是Splunk和Solr。1.1.2搜索引擎以全文檢索技術(shù)為核心,未來滿足多樣化應(yīng)用需求全文檢索技術(shù)是搜索引擎數(shù)據(jù)庫的技術(shù)源頭。計算機(jī)的索引程序通過掃描源文本中的每一個詞,對每個詞構(gòu)建索引,并指出該詞在源文本中出現(xiàn)的次數(shù)和出現(xiàn)的位置,當(dāng)用戶檢索數(shù)據(jù)時,計算機(jī)檢索程序?qū)︻A(yù)先構(gòu)建好的索引文件來進(jìn)行查找,并把檢索的結(jié)果反饋給用戶的檢索方式。全文檢索的核心技術(shù)通常包括索引建立和索引檢索兩個功能:

(1)索引建立:索引是指掃描源文檔后建立索引文件。首先將不同格式的文檔數(shù)據(jù)進(jìn)行格式化,抽取其中的文本文件,然后把每一個不同的字符都保存為一個字表,并且記錄下相同的字在文檔中出現(xiàn)的所有位置。(2)檢索檢索:指基于預(yù)先構(gòu)建的索引文件的位置匹配。全文搜索引擎通常由五部分組成:數(shù)據(jù)采集、數(shù)據(jù)處理、數(shù)據(jù)索引、數(shù)據(jù)搜索和用戶接口。在結(jié)構(gòu)方面,全文檢索系統(tǒng)的核心應(yīng)該具備文本分析引擎、索引引擎、查詢引擎、對外接口和外層應(yīng)用系統(tǒng)。在功能方面,全文檢索系統(tǒng)應(yīng)該具備索引建立、增量索引、索引優(yōu)化、查詢結(jié)果返回等功能,外層則應(yīng)有各種不同的應(yīng)用。目前全文檢索技術(shù)主要發(fā)展方向體現(xiàn)在以下幾個方面:

(1)智能檢索:傳統(tǒng)的全文檢索是基于關(guān)鍵詞進(jìn)行匹配,常出現(xiàn)查全率和查準(zhǔn)率不高的問題。在信息量呈爆炸式增長的大數(shù)據(jù)時代,利用關(guān)鍵詞匹配的全文檢索存在很大的局限性。智能檢索技術(shù)中,除了分詞詞典外還包括同音詞典、同義詞典、相關(guān)級詞典等,能夠形成一個較完整的概念網(wǎng)絡(luò)和知識體系,提供較為智能的知識提示。(2)數(shù)據(jù)挖掘同信息檢索技術(shù)相結(jié)合:數(shù)據(jù)挖掘則主要包括分類、聚類自動摘要和相似性查詢等方面,幫助用戶更好地發(fā)現(xiàn)、組織和表示信息,通過提取知識來滿足更高層次的檢索需求。自動摘要技術(shù)可自動地從原始文獻(xiàn)中摘取文章摘要,幫助用戶快速對檢索結(jié)果進(jìn)行相關(guān)度評價;相似性檢索根據(jù)文檔內(nèi)容特征來對與之相關(guān)或者相似的文檔進(jìn)行檢索,可用于去重分析和用戶個性化反饋。(3)垂直領(lǐng)域數(shù)據(jù)庫:目前通用搜索引擎很難收集全所有主題的網(wǎng)絡(luò)信息且成本較高,對于專業(yè)性要求更高的主題難以做到精確搜索。因此垂直主題的搜索引擎以其高度的目標(biāo)化和專業(yè)化在各類搜索引擎中占據(jù)了一席之地。(4)分布式全文檢索技術(shù):分布式系統(tǒng)的本質(zhì)就是網(wǎng)絡(luò)互連的多個服務(wù)器共同處理某些任務(wù)。傳統(tǒng)的集中式全文檢索系統(tǒng)已經(jīng)不能滿足大容量數(shù)據(jù)的存儲需求,數(shù)據(jù)量和訪問量的爆發(fā)式增長對系統(tǒng)的高效率和擴(kuò)展性提出了更高的要求,僅僅依靠單臺服務(wù)器運行的檢索服務(wù)已經(jīng)很難滿足要求。因此,為了提高檢索效率,企業(yè)為了節(jié)省成本普遍選擇通過機(jī)器組成分布式集群來滿足服務(wù)器的性能要求。搜索引擎數(shù)據(jù)庫潛在市場規(guī)模約450億美元,發(fā)展空間廣闊。根據(jù)IDC測算,2022年全球搜索引擎數(shù)據(jù)庫的市場規(guī)模約為450億美元,其中搜索系統(tǒng)、內(nèi)容分析和認(rèn)知/AI軟件平臺的市場規(guī)模約80億美元;IT運營管理約90億美元;大數(shù)據(jù)和分析軟件(高級預(yù)測分析、空間和位置分析、非關(guān)系分析數(shù)據(jù)存儲、分析數(shù)據(jù)的集成和完整性)約230億美元;

安全分析(安全信息和事件管理、政策和合規(guī)、取證和事件調(diào)查)約50億美元。1.2美國Elasticsearch為搜索引擎數(shù)據(jù)庫龍頭,應(yīng)用場景豐富Elasticsearch

(ES)是一個伴隨著大數(shù)據(jù)存儲以及快速檢索的需求所產(chǎn)生的分布式、可擴(kuò)展、實時的搜索與數(shù)據(jù)分析引擎。ES使用Lucene搜索庫作為其核心,又同時避免了Lucene復(fù)雜的操作方式,能夠存儲結(jié)構(gòu)化和非結(jié)構(gòu)化的大數(shù)據(jù),并且實現(xiàn)對其存儲數(shù)據(jù)的全文檢索,速度達(dá)到毫秒級。它還包括了結(jié)構(gòu)化搜索、數(shù)據(jù)分析、復(fù)雜語言處理、對象間關(guān)聯(lián)關(guān)系等內(nèi)容,可以通過數(shù)據(jù)建模在生產(chǎn)環(huán)境中配置和監(jiān)視大數(shù)據(jù)集群。其特色包括:1)分布式的文件實時存儲工具,并且保證每個字段都能被索引和檢索;

2)分布式的實時搜索引擎,并具備數(shù)據(jù)實時分析功能;3)可拓展到上百臺服務(wù)器,處理PB級別的結(jié)構(gòu)化或非結(jié)構(gòu)化數(shù)據(jù)。非結(jié)構(gòu)化數(shù)據(jù)量的爆發(fā)式成長,疊加信息檢索準(zhǔn)確度需求增加,驅(qū)動Elasticsearch業(yè)務(wù)快速成長。從數(shù)據(jù)結(jié)構(gòu)角度看,web2.0時代非結(jié)構(gòu)化數(shù)據(jù)量的爆發(fā)拉動了對非關(guān)系型數(shù)據(jù)庫需求,極大提高了系統(tǒng)對數(shù)據(jù)庫高并發(fā)讀寫、可擴(kuò)展性和高可用性的要求。此外,在對海量數(shù)據(jù)存儲和訪問效率上方面,傳統(tǒng)的關(guān)系型數(shù)據(jù)庫也難以滿足需求。根據(jù)浪潮信息

數(shù)據(jù),非結(jié)構(gòu)化數(shù)據(jù)自2015年開始呈幾何倍數(shù)增長,包括HTML、JSON、文檔、圖片、音視頻等形式,預(yù)計未來還將加速爆發(fā)。Elasticsearch在信息檢索性能上相比數(shù)據(jù)庫自身的搜索功能優(yōu)勢顯著。功能上,數(shù)據(jù)庫的首要目的是存儲數(shù)據(jù),其自身的模糊搜索功能沒有索引,無法實現(xiàn)對搜索詞的邏輯及范圍搜索,因此無法對查詢條件進(jìn)行延伸分析。而對于搜索引擎和搜索引擎數(shù)據(jù)庫來說,全文檢索才是目的,因此其更關(guān)注信息搜集和關(guān)聯(lián)等能力,靈活度也更高,在檢索時無需精確的數(shù)據(jù)結(jié)構(gòu),可以對查詢條件進(jìn)行延伸解析,比如近義詞和聯(lián)想等功能。目前,Elasticsearch實時全文搜索引擎框架已經(jīng)被廣泛使用。GitHub使用Elasticsearch對超過1300億行的源碼進(jìn)行檢索,并且用戶量和數(shù)據(jù)量還在持續(xù)增長;維基百科使用Elasticsearch對PB級數(shù)據(jù)實現(xiàn)了全文檢索、高亮展示關(guān)鍵詞、針對輸入的關(guān)鍵詞進(jìn)行搜索建議等功能;英國衛(wèi)報使用Elasticsearch來處理海量訪客日志,并實時把公眾對文章的看法反饋給編輯;StackOverflow通過使用Elasticsearch把全文搜索、地理位置和其他相關(guān)信息進(jìn)行結(jié)合,實現(xiàn)more-like-this功能。1.3搜索引擎數(shù)據(jù)庫國產(chǎn)替代進(jìn)程加速,公司行業(yè)積累深厚產(chǎn)品優(yōu)勢顯著1.3.1數(shù)據(jù)安全要求加速數(shù)據(jù)庫國產(chǎn)替代,公司G端客戶比例較高有望率先受益數(shù)據(jù)庫是我國信創(chuàng)重點,數(shù)字安全法出臺將加速國產(chǎn)替代。2021年是我國數(shù)據(jù)安全的政策元年,2021年9月我國第一部數(shù)據(jù)安全的專門立法《數(shù)據(jù)安全法》正式出臺,《個人信息保護(hù)法》于同年11月起正式施行。從國家層面,未來各監(jiān)管部門將加大對數(shù)據(jù)安全監(jiān)管力度。從企業(yè)層面,數(shù)據(jù)安全責(zé)任也將從過去被動地接受機(jī)構(gòu)風(fēng)險監(jiān)督,逐漸轉(zhuǎn)向主動合規(guī)建設(shè)。根據(jù)Gartner報告,數(shù)據(jù)庫的高技術(shù)壁壘導(dǎo)致Oracle、IBM、微軟等海外大廠長期霸占數(shù)據(jù)庫市占率排行的前幾名,我國數(shù)據(jù)庫產(chǎn)品的市占率雖然在過去十幾年間有了大幅提升,但仍然于海外大廠產(chǎn)品有著較大差異,國產(chǎn)化率相對較低,屬于重點關(guān)注領(lǐng)域。公司政府客戶比例高且信息敏感度高,有望率先受益于國產(chǎn)化需求。從1985年開始,公司前身依托自身在中文檢索領(lǐng)域的專業(yè)優(yōu)勢便開始為人民日報社提供新聞資料檢索系統(tǒng)服務(wù);公司于1995年搭建了數(shù)據(jù)庫服務(wù)器并開始為新華社服務(wù)。公司的檢索產(chǎn)品很早完成了政府客戶的驗證流程,具備了先發(fā)優(yōu)勢。公司自04年開始,陸續(xù)為國家知識產(chǎn)權(quán)局、國寶局等優(yōu)質(zhì)國家機(jī)構(gòu)提供企業(yè)搜索服務(wù),并且開始覆蓋金融、能源、公共安全等涉密領(lǐng)域,涉及公安、軍工客戶。2021年公司政府及公共安全業(yè)務(wù)收入占比達(dá)到58.81%。公司深耕語義智能賽道,處于行業(yè)領(lǐng)先者地位。根據(jù)IDC數(shù)據(jù)顯示,2021年我國語音語義市場規(guī)模達(dá)21.7億美元,其中科大訊飛占據(jù)13.7%的市場規(guī)模位居第一。公司以2.9%的市場份額占比位居第四,考慮語義智能相比于語音智能,結(jié)合了語言理解、知識獲取等更高級別的人工智能技術(shù),未來發(fā)展空間廣闊。自然語言處理市場預(yù)計未來幾年內(nèi)保持高增長速度,到2030年是市場規(guī)模有望突破2000億。隨著NLP技術(shù)在金融、政務(wù)、教育、醫(yī)療等諸多行業(yè)應(yīng)用落地的加速,預(yù)計未來中國NLP市場規(guī)模將加速成長。根據(jù)賽迪研究院預(yù)測,2022年相關(guān)市場規(guī)模約為174.5億元,并在未來幾年內(nèi)保持約36.5%的復(fù)合增長率,預(yù)計到2030年,我國NLP市場規(guī)模將突破2000億,達(dá)到2105億元。1.3.2公司實現(xiàn)搜索引擎數(shù)據(jù)庫核心技術(shù)自主可控,滿足信創(chuàng)和國產(chǎn)化替換需求公司信創(chuàng)生態(tài)完備,數(shù)據(jù)庫核心技術(shù)自主可控。公司多次被大數(shù)據(jù)相關(guān)產(chǎn)業(yè)聯(lián)盟評為領(lǐng)軍企業(yè),深度參與到中國數(shù)據(jù)庫標(biāo)準(zhǔn)制定。產(chǎn)品方面,公司海貝數(shù)據(jù)庫是目前國內(nèi)少有從底層數(shù)據(jù)收集,到分詞和索引算法,以及儲存技術(shù)的國產(chǎn)數(shù)據(jù)庫引擎。其核心代碼自主率達(dá)到100%,且通過多家國家機(jī)構(gòu)認(rèn)證,可徹底擺脫對Elasticsearch和Lucene等國外數(shù)據(jù)庫的技術(shù)依賴。在大數(shù)據(jù)領(lǐng)域,拓爾思突破異構(gòu)數(shù)據(jù)對大數(shù)據(jù)搜索引擎的限制,為索引數(shù)據(jù)加密提供全方位安全保障,實現(xiàn)了文本、圖像特征、二進(jìn)制的統(tǒng)一索引和跨數(shù)據(jù)類型跨語言的檢索,并采取最新的集群技術(shù)提高了可支持的數(shù)據(jù)規(guī)模和多用戶并發(fā)檢索性能,為數(shù)據(jù)安全和信創(chuàng)領(lǐng)域應(yīng)用提供全面保障。2021年公司基于技術(shù)突破迭代創(chuàng)新推出了TRS海貝大數(shù)據(jù)管理系統(tǒng)V9.0、TRS數(shù)據(jù)中臺等核心產(chǎn)品。同時公司研發(fā)完成了面向云原生支撐的技術(shù)中臺和AI驅(qū)動的數(shù)據(jù)中臺,推出了TRS數(shù)星智能風(fēng)控大數(shù)據(jù)平臺、TRS數(shù)家開放服務(wù)平臺、TRS網(wǎng)察大數(shù)據(jù)分析平臺等SasS數(shù)據(jù)智能服務(wù)平臺產(chǎn)品。公司海貝大數(shù)據(jù)搜索引擎產(chǎn)品在自主可控、數(shù)據(jù)安全、綜合能力等層面均具備顯著優(yōu)勢。產(chǎn)品支持所有數(shù)據(jù)類型,功能完備,安全可靠,兼容ES常用接口,對接主流生態(tài),具備良好的產(chǎn)品力,未來有望在信創(chuàng)浪潮下實現(xiàn)國產(chǎn)化平滑替代。1.4公司持續(xù)延伸大數(shù)據(jù)業(yè)務(wù)新場景,知識產(chǎn)權(quán)業(yè)務(wù)有望貢獻(xiàn)新增量1.4.1專利處理需求快速成長創(chuàng)造專利代理市場廣闊空間,NLP技術(shù)應(yīng)用前景可期國家政策層面支持發(fā)展知識產(chǎn)權(quán)行業(yè),中國專利申請量持續(xù)成長。2021年國家提出

“知識產(chǎn)權(quán)強(qiáng)國戰(zhàn)略”,力圖實現(xiàn)從“中國制造”到“中國創(chuàng)造”的創(chuàng)新驅(qū)動轉(zhuǎn)型。通過

《知識產(chǎn)權(quán)強(qiáng)國建設(shè)綱要(2021-2035)》以及《“十四五”國家知識產(chǎn)權(quán)保護(hù)和運用規(guī)劃》等綱領(lǐng)性文件,未來中國知識產(chǎn)權(quán)發(fā)展將致力于實現(xiàn)知識產(chǎn)權(quán)“得到更好保護(hù)”、“形成更好市場價值”、“發(fā)揮更強(qiáng)經(jīng)濟(jì)支撐”、“具備更強(qiáng)影響力”的發(fā)展目標(biāo),成為真正的“知識產(chǎn)權(quán)強(qiáng)國”。中國專利申請量于2011年躍居全球第一,并在近幾年內(nèi)保持快速增長態(tài)勢,2021年中國專利申請量達(dá)到495.7萬件,2008-2021年間復(fù)合增長率達(dá)到18%。根據(jù)世界知識產(chǎn)權(quán)組織數(shù)據(jù),中國2020年發(fā)明、實用新型和外觀這三項專利的申請總量分別達(dá)到149.71萬件、292.7萬件和77.0萬件,同比增長6.9%、29.0%和8.3%,均顯著高于全球增速。預(yù)計未來幾年中國專利數(shù)量仍將保持快速增長,并將成為拉動經(jīng)濟(jì)增長不可或缺的力量。專利申請數(shù)量快速成長拉動知識產(chǎn)權(quán)代理市場需求。知識產(chǎn)權(quán)代理是指代理當(dāng)事人處理知識產(chǎn)權(quán)事務(wù)的行為,主要包括國內(nèi)外專利代理和商標(biāo)代理、版權(quán)登記代理。專利代理的業(yè)務(wù)范圍包括專利申請、專利訴訟、專利戰(zhàn)略布局、專利咨詢等方面的業(yè)務(wù)內(nèi)容。國家政策支持疊加制度不斷完善,知識產(chǎn)權(quán)代理業(yè)務(wù)迅速發(fā)展。根據(jù)共研網(wǎng)數(shù)據(jù)統(tǒng)計顯示,2021年中國支持產(chǎn)權(quán)代理行業(yè)市場規(guī)模約為511.89億元,并預(yù)計2022年市場規(guī)模將超過600億元,未來將伴隨著知識產(chǎn)權(quán)市場的成長而保持較快增長態(tài)勢。專利代理機(jī)構(gòu)數(shù)量快速增長。國家知識產(chǎn)權(quán)局?jǐn)?shù)據(jù)統(tǒng)計顯示,截至2021年底,我國專利代理機(jī)構(gòu)數(shù)量達(dá)到3934家(不含港澳臺地區(qū)),執(zhí)業(yè)專利代理師達(dá)26840人,行業(yè)發(fā)展勢頭迅猛。專利為各科技創(chuàng)新賽道提供高情報價值,專利信息檢索查詢創(chuàng)造新需求。在生物、新材料、新能源等高新科技領(lǐng)域,企業(yè)依賴專利情報所提供的重要價值,專利工作支撐企業(yè)研發(fā)創(chuàng)新成為近年來專利工作的重要價值探索。對于專利代理機(jī)構(gòu)來說,專利服務(wù)涉及專利信息的檢索、匹配等工作,NLP技術(shù)可講傳統(tǒng)專利數(shù)據(jù)庫中的非結(jié)構(gòu)化信息轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),可大幅提升知識產(chǎn)權(quán)服務(wù)的效率提升和質(zhì)量提高。1.4.2公司布局專利搜索引擎賽道,基因?qū)@麢z索云服務(wù)平臺有望賦能行業(yè)效率提升公司自主研發(fā)基因?qū)@麢z索云服務(wù)平臺,為生物技術(shù)發(fā)展創(chuàng)新提供有力支撐。公司聯(lián)合知識產(chǎn)權(quán)出版社,基于生物技術(shù)領(lǐng)域產(chǎn)業(yè)發(fā)展及用戶需求,在強(qiáng)化搜索引擎技術(shù)與數(shù)據(jù)

資源優(yōu)勢基礎(chǔ)上,研發(fā)能夠提供序列檢索與基因?qū)@麢z索的SaaS云服務(wù)系統(tǒng)。平臺涵蓋全球40多個國家和組織的生物序列相關(guān)專利數(shù)據(jù)及32個公共資源庫,通過對區(qū)域創(chuàng)新趨勢和區(qū)域頭部專利申請人的分析,幫助用戶識別潛在的創(chuàng)新者和未來可能合作的重要伙伴。公司可實現(xiàn)基因?qū)@畔⒌慕Y(jié)構(gòu)化處理和檢索結(jié)果呈現(xiàn),大幅提升專利服務(wù)效率。公司基因?qū)@麢z索云服務(wù)平臺可實現(xiàn)基因序列檢索、專利檢索、序列檢索結(jié)果、序列比對等多項功能,支持融合檢索及圖形展示,在幫助用戶分析行業(yè)發(fā)展趨勢、輔助生物醫(yī)學(xué)技術(shù)創(chuàng)新、領(lǐng)域研究新方向研判等場景均具備廣闊應(yīng)用前景。公司基于NLP核心技術(shù)積累,未來有望向?qū)@麢z索領(lǐng)域更多細(xì)分場景延伸。除基因之外,高端制造、新能源、新材料等領(lǐng)域?qū)@畔z索均存在信息非結(jié)構(gòu)化、專業(yè)程度高,數(shù)據(jù)挖掘和分析難度大的特征,公司在自然語言處理領(lǐng)域具備技術(shù)優(yōu)勢,未來有望基于在基因領(lǐng)域的產(chǎn)品研發(fā)經(jīng)驗積累,向更多細(xì)分場景延伸。2知識圖譜引導(dǎo)認(rèn)知智能發(fā)展,對標(biāo)Palantir公司成長空間廣闊2.1堅持“語義智能+”為核心戰(zhàn)略,公司AI產(chǎn)品應(yīng)用空間廣闊AI正處于弱人工智能向強(qiáng)人工智能發(fā)展階段,核心為認(rèn)知和理解能力的提升,NLP和CV為兩大發(fā)展方向。目前AI發(fā)展處于弱人工智能階段,在設(shè)計的程序范圍內(nèi)決策并采取行動,不具備獨立意志且應(yīng)用場景延伸性較差,代表性的有AlphaGo(圍棋領(lǐng)域)、Siri

(語音對話)等;強(qiáng)人工智能則是指具有獨立意志,能在設(shè)計的程序范圍外自主決策并采取行動的人工智能,能幫助人們綜合多方信息進(jìn)行判斷決策,真正提升人類的工作效率,代表性的有通用機(jī)器人、高級別自動駕駛等。語言和感知是人類思維認(rèn)知的基礎(chǔ),也是AI發(fā)展的兩大核心內(nèi)容。目前AI發(fā)展有五大核心內(nèi)容,即計算機(jī)視覺、機(jī)器學(xué)習(xí)、自然語言處理、機(jī)器人和語音識別,分別對標(biāo)人類的感知、思維、語言理解、運動控制和交互這五大維度。目前國內(nèi)外廠商在AI各方向上均取得持續(xù)進(jìn)展,未來有望打開商業(yè)化空間。公司專攻語義智能賽道,是國內(nèi)最早從事自然語言處理(NLP)研發(fā)的企業(yè)之一,核心競爭力顯著。公司所專注的語義智能位于人工智能中的認(rèn)知智能領(lǐng)域,即讓計算機(jī)來理解人類語言或其他符號表面數(shù)據(jù)內(nèi)含的確切意義,提取出信息或知識,進(jìn)而進(jìn)行推理、分析、決策,達(dá)到、接近或者超過人類的智慧水平。2.2對標(biāo)美國Palantir,從市場規(guī)模和產(chǎn)品邊際貢獻(xiàn)率出發(fā)看公司成長空間2.2.1業(yè)務(wù)從G端向B端延伸,穩(wěn)步發(fā)展成為知識圖譜領(lǐng)域獨角獸美國Palantir(帕蘭提爾)公司,專注于大數(shù)據(jù)分析,客戶從G端政府部門延伸到B端企業(yè),逐步成長為細(xì)分賽道巨頭。Palantir成立于2003年,專注于大數(shù)據(jù)分析并以此為核心,通過深入分析用戶業(yè)務(wù)結(jié)構(gòu),將海量數(shù)據(jù)有機(jī)結(jié)合并挖掘數(shù)據(jù)中的價值,為決策者提供決策依據(jù)。公司分別于2008年和2016年,發(fā)布數(shù)據(jù)平臺PalantirGotham和PalantirFoundry,分別面向公司的政府端客戶和商業(yè)客戶提供圖分析服務(wù)。公司發(fā)展路線清晰,“G端-大B-小B”戰(zhàn)略成效顯著。Palantir最初為美國情報部門開發(fā)軟件,以協(xié)助反恐調(diào)查和行動,客戶主要為國土安全部、國家安全局、聯(lián)邦調(diào)查局等政府部門,而后公司逐步從TOG向TOB拓展,客戶涵蓋金融、醫(yī)療、傳媒等眾多行業(yè),其中不乏空中客車、可口可樂、摩根大通等全球行業(yè)巨頭。公司以Gotham和Foundry兩大平臺為核心,持續(xù)完善行業(yè)解決方案,構(gòu)建完整業(yè)務(wù)生態(tài)版圖。公司基于Gotham和Foundry兩大產(chǎn)品線擁有十余種解決方案,且兩大平臺分工明確,Gotham面向政府客戶,而Foundry以商業(yè)客戶為主。Gotham大數(shù)據(jù)分析平臺建立真實世界事物特征及彼此聯(lián)系,深度應(yīng)用到國防、安保、反恐等政府端事物領(lǐng)域。Gotham的運行以多源數(shù)據(jù)為起點,包括結(jié)構(gòu)化的數(shù)據(jù)(日志、財務(wù)數(shù)據(jù)報表、電子表格等)和非結(jié)構(gòu)化數(shù)據(jù)(視頻、郵件、文件、圖片等)。Gotham可以對這些源數(shù)據(jù)進(jìn)行建模,將多個數(shù)據(jù)源整合成簡潔、一致的數(shù)據(jù)。傳統(tǒng)數(shù)據(jù)建模通常圍繞表單中靜態(tài)的行和列展開,這種做法其實對于操作人員對數(shù)據(jù)在實際場景中的理解和應(yīng)用并不友好。Gotham的厲害之處在于它在建模時已經(jīng)運用了真實世界的現(xiàn)實事物的特征和彼此間的聯(lián)系,如“人群”、“組織”等,這便大大提高了建模的靈活性,使模型有了實際意義。Gotham可以將用戶數(shù)據(jù)更新實時同步,將用戶行為自動記錄、歸因分析并存儲,形成“動態(tài)本體”。PalantirFoundry起步于金融欺詐識別服務(wù),功能模塊不斷擴(kuò)展,應(yīng)用場景日漸豐富。PalantirFoundry前身為PalantirMetropolis,最初面向企業(yè)客戶尤其是金融行業(yè)的欺詐行為識別需求,后續(xù)業(yè)務(wù)逐漸拓展至36個行業(yè),可以連接到企業(yè)數(shù)據(jù)、專業(yè)數(shù)據(jù)和公共數(shù)據(jù)集,實現(xiàn)數(shù)據(jù)集成、信息管理和定量分析,并發(fā)現(xiàn)趨勢、關(guān)系和異常情況并進(jìn)行預(yù)測。在后端平臺,F(xiàn)oundry將多個來源的結(jié)構(gòu)化數(shù)據(jù)整合到連貫的模型中,并對模型執(zhí)行復(fù)雜計算,同時共享和迭代分析產(chǎn)品;在前端應(yīng)用程序,它提供了一套集成的應(yīng)用程序,讓用戶可以建立交互。從Palantir的產(chǎn)品可以歸納出,公司的核心優(yōu)勢在于對實際業(yè)務(wù)場景和數(shù)據(jù)(包含結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù))邏輯的理解更深入,公司用過底層的數(shù)據(jù)關(guān)聯(lián)推理和知識圖譜構(gòu)建,突破了人工智能在垂直領(lǐng)域間的壁壘,真正意義上打通了數(shù)據(jù)“上下游”之間的關(guān)系。2.2.2營收規(guī)模持續(xù)成長,邊際貢獻(xiàn)率升高彰顯產(chǎn)品化能力Palantir年營收能力持續(xù)成長,毛利率穩(wěn)中有升,支撐百億美元市值。Palantir在2022年H1實現(xiàn)營業(yè)收入9.19億美元,2018~2021年營業(yè)收入實現(xiàn)約37.23%的復(fù)合增長率,公司在業(yè)務(wù)成長的過程中毛利率穩(wěn)中有升,2022年上半年毛利率達(dá)到78.61%,截至2022年11月18日,公司總市值達(dá)185億美元。邊際貢獻(xiàn)率持續(xù)提升,Palantir公司產(chǎn)品化能力不斷提升。Palantir在歷次公司財報中將“邊際貢獻(xiàn)率”(ContributionMargin)作為公司的重要經(jīng)營指標(biāo)。邊際貢獻(xiàn)率定義為

“收入減去收入成本(CostofRevenue)、營銷費用(剔除股權(quán)激勵后)之后與收入的比值”。邊際貢獻(xiàn)率的提升反映出公司軟件產(chǎn)品的前期部署流程的優(yōu)化,客戶的使用門檻也將降低,這將極大地有利于公司軟件產(chǎn)品規(guī)?;瘮U(kuò)張的能力。Palantir業(yè)務(wù)邊際貢獻(xiàn)率接近60%,公司產(chǎn)品化能力優(yōu)勢顯著。Palantir產(chǎn)品邊際貢獻(xiàn)率在2019Q3至2020Q4實現(xiàn)快速增長,從15%提升至61%。公司產(chǎn)品化能力不斷提升,有助于降低產(chǎn)品部署的可變成本,利于新客戶拓展及公司業(yè)務(wù)向新垂直行業(yè)場景滲透。對比Palantir,拓爾思產(chǎn)品化仍有成長空間。由于Palantir與拓爾思財務(wù)準(zhǔn)則上存在不一致,我們選擇營業(yè)收入減去營業(yè)成本及銷售費用后的余值再除以營業(yè)收入作為參考指標(biāo)。經(jīng)計算,公司2018-2021年這一指標(biāo)從41.00%上升至50.62%,考慮往年第四季度屬于公司業(yè)績集中確認(rèn)期,預(yù)計2022該指標(biāo)較去年仍有提升。我們認(rèn)為隨著公司產(chǎn)品SaaS化的持續(xù)推進(jìn),公司產(chǎn)品的規(guī)?;芰⒉粩嘣鰪?qiáng)。2.2.3業(yè)務(wù)潛在規(guī)模廣闊,政府+商業(yè)端客戶雙輪驅(qū)動打開成長空間產(chǎn)品潛在市場規(guī)模超千億,政府與商業(yè)客戶發(fā)展并駕齊驅(qū)。據(jù)Palantir估計,2020年公司軟件在全球商業(yè)領(lǐng)域和政府部門的總潛在市場規(guī)模(TAM)約為1190億美元,其中商業(yè)領(lǐng)域的TAM約為560億美元,政府部門領(lǐng)域的TAM約為630億美元,而在政府部門領(lǐng)域,公司預(yù)計美國政府部門和國際政府部門的TAM分別約為260億美元和370億美元。在商業(yè)領(lǐng)域Palantir產(chǎn)品涵蓋數(shù)據(jù)管理、集成和編制、應(yīng)用程序開發(fā)、安全、系統(tǒng)和服務(wù)管理、分析和人工智能、供應(yīng)鏈管理、企業(yè)資源管理以及內(nèi)容和工作流管理領(lǐng)域。政府部門方面,公司客戶包括美國陸軍、海軍和空軍、美國特種作戰(zhàn)司令部疾病控制中心等眾多政府部門。標(biāo)準(zhǔn)化產(chǎn)品+定制化服務(wù)有望成為行業(yè)未來理想解決方案,多源數(shù)據(jù)將成為賽道玩家核心競爭力。在發(fā)展早期,Palantir也采用項目制針對每個客戶提供定制化產(chǎn)品,后續(xù)逐漸轉(zhuǎn)向構(gòu)建通用軟件平臺,并將可復(fù)用的功能構(gòu)建成為應(yīng)用程序,Gotham和Foundry兩大產(chǎn)品便是這一思想的體現(xiàn)。在數(shù)據(jù)處理層面,Palantir產(chǎn)品融合了各種不同類型的數(shù)據(jù)源,其中GothamVideo產(chǎn)品融合了視頻數(shù)據(jù)、時間序列數(shù)據(jù)與其他標(biāo)記數(shù)據(jù),GothamGraph產(chǎn)品則融合調(diào)查報告、統(tǒng)計信息、視頻、操作數(shù)據(jù)等,并最終構(gòu)建成為知識圖譜。2.3知識圖譜應(yīng)用領(lǐng)域廣泛,有助于公司提高核心競爭力2.3.1知識圖譜應(yīng)用前景廣闊,市場有望迎來加速發(fā)展知識圖譜是新一代的知識工程技術(shù),以NLP為底層技術(shù),捕捉數(shù)據(jù)、信息等內(nèi)容并梳理,組合成圖譜形式,為AI提供知識儲備。除了前文提到的專業(yè)搜索引擎外,知識圖譜的主流產(chǎn)品形態(tài)可按通用型與垂直行業(yè)型劃分,通用知識圖譜強(qiáng)調(diào)知識廣度,逐漸演變?yōu)橥ㄓ没ヂ?lián)網(wǎng)知識圖譜,包含搜索引擎、智能推薦、智能問答等。垂直行業(yè)知識圖譜強(qiáng)調(diào)知識深度,用于問答、輔助決策與業(yè)務(wù)分析,是支持Al大腦深度思考的知識庫基礎(chǔ)。知識圖譜技術(shù)應(yīng)用受行業(yè)信息化成熟度及需求影響較大,整體規(guī)模處于起步階段,未來產(chǎn)品專業(yè)化和場景化趨勢明確。目前知識圖譜的應(yīng)用逐漸從搜索引擎向各細(xì)分行業(yè)滲透,但應(yīng)用受行業(yè)信息化與數(shù)字化基礎(chǔ)、數(shù)據(jù)質(zhì)量、場景明確程度、客戶方需求等多因素影響,在各細(xì)分行業(yè)的滲透進(jìn)程不一?;ヂ?lián)網(wǎng)與金融為主要應(yīng)用場景,在信創(chuàng)浪潮下政務(wù)、公安等有望提供市場推力,國內(nèi)知識圖譜市場規(guī)模有望加速成長。據(jù)艾瑞咨詢數(shù)據(jù)統(tǒng)計,在2021年知識圖譜核心市場中,金融和互聯(lián)網(wǎng)行業(yè)占總市場的35.6%。我們認(rèn)為,隨著政務(wù)數(shù)字化建設(shè)的完善疊加信創(chuàng)浪潮,政務(wù)、公安等行業(yè)對知識圖譜的業(yè)務(wù)需求會進(jìn)一步擴(kuò)大。根據(jù)艾瑞咨詢數(shù)據(jù),2021年中國知識圖譜核心市場規(guī)模為107億元,預(yù)計到2026年達(dá)到296億元,2021-2026年CAGR約為22.5%。公安、金融成為知識圖譜商業(yè)化應(yīng)用先頭陣地,公司長期布局具備先發(fā)優(yōu)勢。艾瑞咨詢數(shù)據(jù)統(tǒng)計顯示,公安、金融、互聯(lián)網(wǎng)等細(xì)分行業(yè)未來幾年均有望迎來知識圖譜商業(yè)化應(yīng)用的加速發(fā)展期,其中,由于公安、金融領(lǐng)域數(shù)字化和信息化程度較高,且數(shù)據(jù)挖掘需求較大,短期內(nèi)有望成為知識圖譜應(yīng)用的先頭陣地。2.3.2公司人工智能產(chǎn)品持續(xù)迭代提升,成為政府、金融等多行業(yè)決策大腦AI進(jìn)入大數(shù)據(jù)時代,行業(yè)數(shù)據(jù)作為知識圖譜的核心壁壘,公司競爭優(yōu)勢明顯。公司從2010年開始便自主投資建設(shè)大數(shù)據(jù)中心,目前已具備數(shù)千億數(shù)據(jù)量的數(shù)據(jù)索引、標(biāo)記、查詢、挖掘分析能力,萬億級數(shù)據(jù)總量的秒級檢索能力,日均億級數(shù)據(jù)獲取能力。業(yè)內(nèi)領(lǐng)先的數(shù)據(jù)分析能力支撐公司多個專業(yè)化的數(shù)據(jù)智能服務(wù),支撐政府、媒體、金融、公安、商業(yè)等多行業(yè)用戶的智能分析需求。公司安拓知識圖譜平臺融合大數(shù)據(jù)等核心技術(shù),構(gòu)建大規(guī)模領(lǐng)域知識圖譜。安拓知識圖譜平臺融合了大數(shù)據(jù)、可視化和知識圖譜相關(guān)技術(shù),能夠構(gòu)建形成大規(guī)模領(lǐng)域知識圖譜,實現(xiàn)知識構(gòu)建管理、知識語義檢索、智能文本提取、智能問答與推薦、圖譜關(guān)系分析、地理空間分析等,在知識構(gòu)建、知識圖譜應(yīng)用、領(lǐng)域知識圖譜覆蓋等方面均具有優(yōu)勢。目前產(chǎn)品已應(yīng)用于政府、國家安全、公安、軍事和企業(yè)等多個領(lǐng)域。水晶球分析師平臺面向各業(yè)務(wù)領(lǐng)域?qū)I(yè)分析師,支撐專項研究工作。通過TRS水晶球分析師平臺,分析師可以通過平臺釆集多源異構(gòu)數(shù)據(jù),形成業(yè)務(wù)領(lǐng)域?qū)ο蠼Y(jié)構(gòu)化知識。平臺提供知識瀏覽和編輯、對象檢索、關(guān)系圖分析、地圖分析、統(tǒng)計分析等功能,可以結(jié)合時間軸、對象瀏覽、直方圖、數(shù)據(jù)流等方式多角度探查數(shù)據(jù)。3公司業(yè)務(wù)場景持續(xù)延伸,產(chǎn)品SaaS化進(jìn)程推動業(yè)務(wù)成長3.1虛擬人作為元宇宙核心角色,公司深度布局虛擬人“靈魂”2022年全國出臺各項元宇宙政策,虛擬現(xiàn)實產(chǎn)業(yè)發(fā)展進(jìn)入快車道。戰(zhàn)新元宇宙統(tǒng)計數(shù)據(jù)顯示,今年全國各地相繼出臺市級、區(qū)級元宇宙發(fā)展專項政策,對元宇宙產(chǎn)業(yè)發(fā)展提出針對性的指導(dǎo)和鼓勵政策,旨在未來3~5年內(nèi)構(gòu)建完善的元宇宙產(chǎn)業(yè)生態(tài),推動數(shù)字經(jīng)濟(jì)

發(fā)展,加快虛擬現(xiàn)實技術(shù)在各行業(yè)和場景下的商業(yè)化應(yīng)用。數(shù)字虛擬人的廣義定義為數(shù)字化外形的虛擬人物,其核心價值在于打破物理界限提供擬人服務(wù)與體驗。隨著人工智能技術(shù)不斷迭代,數(shù)字虛擬人將成為虛擬世界中人機(jī)互動、人際互動的重要橋梁,解決用戶虛擬環(huán)境下工作、娛樂等需求。虛擬人應(yīng)用場景不斷拓展,可賦能多行業(yè)領(lǐng)域。隨著虛擬人技術(shù)結(jié)合實際應(yīng)用場并形成行業(yè)應(yīng)用解決方案,目前已經(jīng)出現(xiàn)了娛樂型虛擬人、教育型虛擬人、助手型虛擬人、影視虛擬人等,虛擬人已覆蓋影視、傳媒、游戲、金融、文旅等領(lǐng)域,且可以根據(jù)用戶實際需求提供定制化服務(wù)。數(shù)字虛擬人應(yīng)用向多元化發(fā)展,潛在市場規(guī)模超千億。目前虛擬人應(yīng)用逐漸從娛樂化,向工具化、基建化的形式滲透,應(yīng)用場景的豐富度和深度均不斷提升。根據(jù)速途元宇宙研究院預(yù)測,2022年我國虛擬人整體市場規(guī)模將達(dá)到約242.3億元,到2030年這一市場規(guī)模有望超3000億元。我們預(yù)計未來幾年內(nèi),隨著NLP等人工智能技術(shù)的不斷迭代,數(shù)字虛擬人經(jīng)濟(jì)將從目前的IP經(jīng)濟(jì)向人機(jī)交互發(fā)展,行業(yè)有望迎來爆發(fā)。公司依托自然語言處理與行業(yè)知識圖譜技術(shù)積累,積極布局虛擬人賽道,為數(shù)字虛擬人提供“大腦”。公司與騰訊等國內(nèi)頂級數(shù)字人形象團(tuán)隊簽訂戰(zhàn)略合作協(xié)議,實現(xiàn)虛擬人形象與大腦的有機(jī)結(jié)合。公司虛擬數(shù)字人SaaS平臺已成為客戶訂購虛擬數(shù)字人的全鏈服務(wù)平臺。公司已成功注冊“拓宇宙”商標(biāo),未來持續(xù)深入元宇宙領(lǐng)域的實踐與探索。公司服務(wù)型虛擬人產(chǎn)品已在部分行業(yè)成功實踐,未來有望滲透更多垂直應(yīng)用場景。目前公司已落地了一批服務(wù)型虛擬人項目,覆蓋了直播帶貨、智能播報、智能問答等領(lǐng)域,其中與廣東省共建“南方鄉(xiāng)村振興新農(nóng)人AI數(shù)智賦能平臺”,定位在農(nóng)產(chǎn)品直播內(nèi)容智能創(chuàng)作的AIGC在線服務(wù)平臺,面向農(nóng)產(chǎn)品電商主播提供直播腳本智能創(chuàng)作、帶貨虛擬人全鏈租用等知識賦能服務(wù)。2022年北京冬奧會期間,公司發(fā)布虛擬人“小思”,實現(xiàn)自動采編、智能寫稿、虛擬播報等全自動功能,通過自然語言處理、知識圖譜、機(jī)器學(xué)習(xí)和音視頻分析等技術(shù),在“虛擬人代替人”進(jìn)程中邁出了重要一步。簽約藍(lán)色光標(biāo),服務(wù)虛擬人率先落地。2022年2月,公司與藍(lán)色光標(biāo)達(dá)成戰(zhàn)略合作,依托在虛擬主播、智能問答機(jī)器人、智能創(chuàng)作、專業(yè)領(lǐng)域虛擬人等方面的成功經(jīng)驗,結(jié)合藍(lán)色光標(biāo)在虛擬及混合現(xiàn)實空間營銷、智能虛擬人領(lǐng)域的業(yè)務(wù)基礎(chǔ),雙方將大力推動元宇宙相關(guān)業(yè)務(wù)開拓。公司將以“虛擬人+”場景為突破口,首先落地服務(wù)虛擬人,應(yīng)用布局將優(yōu)先面向金融、傳媒、政府、營銷等行業(yè)的專業(yè)服務(wù)場景。3.2人形機(jī)器人風(fēng)起,公司聯(lián)手賽道頭部玩家入局有望受益行業(yè)發(fā)展全球“機(jī)器換人”進(jìn)程加速,服務(wù)機(jī)器人市場規(guī)模穩(wěn)定增長,未來人形機(jī)器人有望深入各細(xì)分消費端場景。人口老齡化趨勢下全球醫(yī)療和公共衛(wèi)生需求持續(xù)旺盛,疊加疫情期間大量面對面場景被無接觸服務(wù)替代,接待機(jī)器人、遞送機(jī)器人、測溫機(jī)器人和新零售機(jī)器人等需求增加,服務(wù)機(jī)器人市場潛力巨大。全球服務(wù)型機(jī)器人潛在市場規(guī)模超200億美元,國內(nèi)市場有望迎來加速發(fā)展階段。根據(jù)中國電子學(xué)會統(tǒng)計數(shù)據(jù),預(yù)計到2023年全球服務(wù)型機(jī)器人市場規(guī)模將達(dá)到201.8億美元,2016~2023年CAGR約為24.72%;預(yù)計到2023年我國服務(wù)型機(jī)器人市場規(guī)模將突破600億,達(dá)613.5億元人民幣,2016~2023年CAGR約為37.87%。語音語義分析作為人機(jī)交互核心途徑,幫助機(jī)器人具備聽、說、理解和思考的能力。語音語義模塊包含了語音識別和語義分析兩部分,涉及聲學(xué)信號(聲源定位、語音增強(qiáng)等)、模式識別(聲紋識別、語音識別等)、自然語言處理(自然語言理解、自然語言生成等)和語音合成等技術(shù)。小米、特斯拉相繼發(fā)布商用人形機(jī)器人產(chǎn)品,國內(nèi)外科技大廠加速布局,行業(yè)有望加速發(fā)展。2022年8月小米發(fā)布人形機(jī)器人CyberOne,搭載自研MiAI環(huán)境語義識別引擎和MiAI語音情緒識別引擎,能夠?qū)崿F(xiàn)85種環(huán)境音識別和6大類45種人類情緒識別。特斯拉發(fā)布的人形機(jī)器人擎天柱Optimus,承接自動駕駛技術(shù),AI智能的核心Transformer架構(gòu)同樣是NLP領(lǐng)域的標(biāo)志性研究成果。公司深耕NLP賽道,語義智能技術(shù)優(yōu)勢顯著。公司在NLP、知識圖譜、OCR、圖像視頻結(jié)構(gòu)化領(lǐng)域均具備自主可控的底層技術(shù)并處于行業(yè)領(lǐng)先地位,公司未來有望依托語音語義智能交互,尤其是中文交互領(lǐng)域的技術(shù)優(yōu)勢,賦能人形機(jī)器人在知識儲備、智能交互、自主決策等方面的能力提升。公司自研面向中文的智能問答云服務(wù)系統(tǒng)“TRS小思智能問答機(jī)器人”。公司該產(chǎn)品綜合運用NLP、知識表示與推理等技術(shù),通過語法語義分析、問題分類與解析等一系列處理流程,實現(xiàn)問題解答與人機(jī)交互,目前廣泛應(yīng)用于政務(wù)智能問答、企業(yè)智能客服以及金融、醫(yī)療、教育等領(lǐng)域的知識百科問答。公司加強(qiáng)與AI及機(jī)器人廠商深度合作,未來有望成為人形機(jī)器人語義智能賽道領(lǐng)軍者。在與AI廠商合作方面,公司和北京一流科技等AI廠商共同合作研究人形機(jī)器人軟件技術(shù)以及推廣應(yīng)用。一流科技立足于通用性深度學(xué)習(xí)標(biāo)準(zhǔn)框架的研發(fā)和推廣使用,獨創(chuàng)了自動數(shù)據(jù)模型混合并行、靜態(tài)調(diào)度、去中心化和全鏈路異步流式執(zhí)行四大核心技術(shù),力爭打造人工智能深度學(xué)習(xí)框架產(chǎn)品的引領(lǐng)者和事實工業(yè)標(biāo)準(zhǔn)。公司通過與AI廠商的深度合作,可將在自身在自然語言處理、知識圖譜領(lǐng)域深厚的積淀與AI廠商在深度學(xué)習(xí)引擎領(lǐng)域的技術(shù)優(yōu)勢結(jié)合起來,構(gòu)建機(jī)器人軟件大腦,研發(fā)云端協(xié)同的AI算法框架以及面向特定領(lǐng)域的知識圖譜技術(shù),培育AI算法集市,設(shè)計算法模塊共享、交易、分成機(jī)制,為機(jī)器人廠商提供中立、開放的軟件生態(tài)并延伸應(yīng)用場景。公司持續(xù)加強(qiáng)與國內(nèi)頭部機(jī)器人廠商合作。公司數(shù)字經(jīng)濟(jì)研究院成立機(jī)器人研究中心,和優(yōu)必選、小鵬等企業(yè)進(jìn)行研究和探索。優(yōu)必選作為國內(nèi)外領(lǐng)先的機(jī)器人廠商,產(chǎn)品在兒童陪伴、教育等領(lǐng)域均具備顯著優(yōu)勢,拓爾思基于多年NLP的深厚積淀,能夠進(jìn)一步機(jī)器人的思考和交互能力,為用戶提供更擬人化的陪伴和交互體驗。3.3云和數(shù)據(jù)服務(wù)轉(zhuǎn)型加速,SaaS化進(jìn)程加速有望助力公司提升盈利能力公司多款產(chǎn)品實現(xiàn)全面SaaS化,云和數(shù)據(jù)業(yè)務(wù)加速發(fā)展為公司提供充足動力。2022年上半年,公司的“數(shù)家-資訊大數(shù)據(jù)平臺”、“數(shù)星-智能風(fēng)控平臺”、“金融風(fēng)險監(jiān)測平臺”、“網(wǎng)察-輿情大數(shù)據(jù)分析平臺”以及“開源情報分析平臺”等均已經(jīng)實現(xiàn)了產(chǎn)品的全面SaaS化,未來隨著公司大數(shù)據(jù)、人工智能業(yè)務(wù)在應(yīng)用場景上的延伸,預(yù)計將推出更多SaaS產(chǎn)品,進(jìn)一步提升SaaS產(chǎn)品收入比例。公司堅持優(yōu)先發(fā)展云和數(shù)據(jù)智能服務(wù)戰(zhàn)略,云和數(shù)據(jù)服務(wù)收入持續(xù)增長。公司2018~2021年云和數(shù)據(jù)業(yè)務(wù)收入高速增長,2021年相關(guān)收入達(dá)3.78億元,占營業(yè)收入比例達(dá)到36.84%。在2022年經(jīng)營計劃中,公司明確提出支持優(yōu)先發(fā)展云和數(shù)據(jù)智能服務(wù)戰(zhàn)略,預(yù)計未來將持續(xù)保持較快增長態(tài)勢。SaaS商業(yè)模式優(yōu)勢突出,國內(nèi)市場空間廣闊,公司業(yè)務(wù)轉(zhuǎn)型有望打開成長空間。根據(jù)艾媒咨詢統(tǒng)計數(shù)據(jù),2021年中國SaaS行業(yè)市場規(guī)模達(dá)322.6億元,預(yù)計到2023年將達(dá)到約555億元,近幾年保持約30%的復(fù)合增長率。與美國對比,頭豹研究院數(shù)據(jù)顯示,2020年中國SaaS行業(yè)占IT整體支出比例為1.3%,相比于2011年的0.1%大幅增長,但相對于美國2020年的5.4%仍有很大提升空間??紤]美國SaaS產(chǎn)業(yè)起步較早,企業(yè)數(shù)字化程度更高,未來中國企業(yè)SaaS有望加速滲透,市場規(guī)模前景可期。SaaS商業(yè)模式具備多重優(yōu)勢,公司加速轉(zhuǎn)型有望進(jìn)一步提升核心競爭力。公司加速業(yè)務(wù)云轉(zhuǎn)型,整個商業(yè)模式正由銷售解決方案、軟件產(chǎn)品全面轉(zhuǎn)向SaaS服務(wù)模式。傳統(tǒng)的數(shù)字政府、融媒體等行業(yè)解決方案的生產(chǎn)由重建設(shè)轉(zhuǎn)向重運營、重增值服務(wù),通過疊加專業(yè)領(lǐng)域的數(shù)據(jù)服務(wù),進(jìn)一步深化服務(wù)能力。我們預(yù)計未來公司在專利、虛擬人、機(jī)器人等新領(lǐng)域業(yè)務(wù)開拓中也將采用SaaS服務(wù)模式,提升公司SaaS營收占比的同時,進(jìn)一步完善業(yè)務(wù)生態(tài),提升行業(yè)競爭力。4拓爾思,三十年耕耘成就語義智能領(lǐng)軍者4.1深耕語義智能賽道,打造完整業(yè)務(wù)版圖深耕NLP領(lǐng)域30年,公司發(fā)展成為國內(nèi)政務(wù)領(lǐng)域NLP龍頭廠商。公司以“語義智能+”為發(fā)展戰(zhàn)略深耕多年,主要業(yè)務(wù)覆蓋內(nèi)容安全和互聯(lián)網(wǎng)空間治理、數(shù)字政府和數(shù)據(jù)智能三大板塊,向以黨政機(jī)關(guān)及企事業(yè)單位為主的下游客戶提供大數(shù)據(jù)檢索、智能風(fēng)控營銷、輿情監(jiān)控等服務(wù)。在數(shù)據(jù)安全領(lǐng)域,子公司天行網(wǎng)安提供數(shù)據(jù)安全傳輸和交換產(chǎn)品及服務(wù)。公司以深耕多年的大數(shù)據(jù)積累與行業(yè)領(lǐng)先的NLP技術(shù)成為國內(nèi)政府政務(wù)領(lǐng)域NLP龍頭,多年以來一直保持行業(yè)領(lǐng)先的市場地位。公司人工智能和大數(shù)據(jù)核心技術(shù)具有跨行業(yè)/領(lǐng)域的通用普適性,因此公司技術(shù)產(chǎn)品和服務(wù)所支持的業(yè)務(wù)應(yīng)用落地場景眾多,涵蓋多個行業(yè)/領(lǐng)域,大型或頭部企業(yè)級客戶超過8000家。在具體客戶應(yīng)用中,公司技術(shù)產(chǎn)品的交付部署模式包括私有云、混合云和公有云等模式或多模式的融合,滿足客戶從通用到個性的完整需求。公司深耕NLP賽道三十余年,持續(xù)迭代構(gòu)建牢固護(hù)城河。公司于1993年成立,堅持圍繞自然語言處理技術(shù),積極自主研發(fā)大數(shù)據(jù)和人工智能技術(shù),具備自然語言處理領(lǐng)域自主可控的全產(chǎn)業(yè)鏈能力。目前公司及全資/控股子公司擁有600余項軟件著作權(quán)。4.2公司股權(quán)結(jié)構(gòu)穩(wěn)定,核心團(tuán)隊經(jīng)驗優(yōu)勢豐富,研發(fā)實力雄厚公司股權(quán)結(jié)構(gòu)穩(wěn)定,通過收購方式進(jìn)一步完善業(yè)務(wù)矩陣。公司實控人為董事長李渝勤,公司前五大股東持股比例達(dá)47.79%,其中第一大股東為信科互動科技發(fā)展有限公司,持股比例為33%,整體股權(quán)結(jié)構(gòu)保持穩(wěn)定。公司通過并購業(yè)務(wù)完善公司業(yè)務(wù)版圖。公司于2014年收購天行網(wǎng)安100%股權(quán),后者是國內(nèi)最早從事網(wǎng)絡(luò)信息安全的企業(yè),產(chǎn)品應(yīng)用場景覆蓋公安、政府和教育等行業(yè),此舉使公司擁有行業(yè)級產(chǎn)品應(yīng)用,為公司產(chǎn)品近公安領(lǐng)域打下了堅實基礎(chǔ);公司自2013年持續(xù)參股并至2018年持有廣州科韻86.4%股權(quán),后者的大數(shù)據(jù)一體化平臺聚焦于公共安全和政府領(lǐng)域的應(yīng)用。公司目前有天行網(wǎng)安、廣拓公司、金新網(wǎng)銀等子公司,各子公司業(yè)務(wù)布局各有側(cè)重,支撐公司構(gòu)建了完善的業(yè)務(wù)生態(tài),未來有望持續(xù)賦能公司主營業(yè)務(wù)向更多垂直行業(yè)的細(xì)分場景延伸。公司技術(shù)人員儲備豐富,研發(fā)能力突出。截至2021年末,公司在職員工合計1631人,其中技術(shù)人員達(dá)1458人,占比達(dá)89.39%。學(xué)歷為大學(xué)本科及以上的員工數(shù)量達(dá)到1348人,占比達(dá)82.65%,預(yù)計公司未來通過儲備高學(xué)歷技術(shù)人才,進(jìn)一步提升產(chǎn)品研發(fā)實力,推動業(yè)務(wù)向更多應(yīng)用場景延伸。4.3公司營收穩(wěn)健成長,費用結(jié)構(gòu)合理,發(fā)展步伐堅定公司主營業(yè)務(wù)收入持續(xù)增長,未來業(yè)務(wù)擴(kuò)張有望持續(xù)提升盈利能力。公司2021年實現(xiàn)營業(yè)收入10.29億元,同比均有所下降,系2021年公司營業(yè)收入不再包含程度子公司2020年配套商業(yè)房產(chǎn)項目收入和原控股子公司奈特康賽的互聯(lián)網(wǎng)營銷收入所致,剔除上述影響后2021年主營業(yè)務(wù)收入實現(xiàn)同比增長31.83%,保持穩(wěn)健成長。公司2022H1實現(xiàn)營業(yè)總收入4.25億元,歸母凈利潤0.74億元,同比分別增長8.53%和36.19%。公司產(chǎn)品SaaS化轉(zhuǎn)型有望驅(qū)動業(yè)務(wù)盈利能力進(jìn)一步增強(qiáng),基于公司在專利、虛擬人、機(jī)器人等領(lǐng)域的持續(xù)探索和布局,看好公司未來打開成長空間。公司各項費用結(jié)構(gòu)穩(wěn)定,毛利率與凈利率有望進(jìn)一步提升。2021年公司銷售、研發(fā)和管理費用率分別為11.50%、9.53%和14.83%,2018至2021年各項費率保持穩(wěn)定。公司2021年毛利率和凈利率分別為62.13%和24.12%,近年來穩(wěn)中有升,公司未來通過云及SaaS產(chǎn)品收入比重的持續(xù)加大,毛利率及凈利率有望繼續(xù)提升。4.4公司覆蓋多行業(yè)優(yōu)質(zhì)客戶,現(xiàn)金流保持健康公司客戶優(yōu)質(zhì)且粘性高,行業(yè)覆蓋度持續(xù)提升。公司目技術(shù)產(chǎn)品和服務(wù)所支持的業(yè)務(wù)應(yīng)用落地場景眾多,涵蓋多個行業(yè)/領(lǐng)域,目前服務(wù)大型或頭部企業(yè)級客戶超過8000家。在具體客戶應(yīng)用中,公司技術(shù)產(chǎn)品的交付部署模式包括私有云、混合云和公有云等模式或多模式的融合,滿足客戶從通用到個性的完整需求,并且企業(yè)復(fù)購率高,客戶粘性好。貨幣資金儲備充足,公司已為新業(yè)務(wù)布局做好準(zhǔn)備。2022Q3,公司現(xiàn)金儲備達(dá)3.85億元,現(xiàn)金儲備維持健康狀態(tài)??紤]公司收入集中在第四季度,且未來將持續(xù)投入開拓新業(yè)務(wù)場景,看好公司基于現(xiàn)金儲備優(yōu)勢,加速新業(yè)務(wù)方面的拓展并保持良好運營狀態(tài)。5盈利預(yù)測營業(yè)收入:公司是國內(nèi)最早從事自然語言處理(NLP)技術(shù)研發(fā)的企業(yè)之一,主營業(yè)務(wù)包括人工智能產(chǎn)品及服務(wù)、大數(shù)據(jù)產(chǎn)品及服務(wù)和數(shù)據(jù)安全產(chǎn)品及服務(wù)等。公司近年來穩(wěn)步發(fā)展,產(chǎn)品服務(wù)在政府、公安、金融、傳媒等領(lǐng)域均具備競爭優(yōu)勢,2021年營業(yè)收入達(dá)10.29億元。公司持續(xù)開辟新業(yè)務(wù)場景,未來有望將產(chǎn)品服務(wù)應(yīng)用到知識產(chǎn)權(quán)、虛擬人、機(jī)器人等新賽道,我們預(yù)測公司2022-2024年營收持續(xù)提升,增長率分別為27.41%、25.48%和24.02%,對應(yīng)營收為13.11億元、16.45億元和20.40億元。大數(shù)據(jù)服務(wù):根據(jù)中國信息通信研究院數(shù)據(jù)顯示,2021年中國數(shù)字經(jīng)濟(jì)規(guī)模達(dá)到7.1萬億美元,同比增加約15.42%,且在未來幾年將保持增長態(tài)勢。數(shù)字化轉(zhuǎn)型正由效率變革向價值變革、由企業(yè)內(nèi)向產(chǎn)業(yè)鏈價值鏈拓展,面向?qū)嶓w經(jīng)濟(jì)的工業(yè)/產(chǎn)業(yè)互聯(lián)網(wǎng)平臺快速發(fā)展。公司基于自主建設(shè)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論