MOSS企業(yè)搜索解決方案深度挖掘_第1頁
MOSS企業(yè)搜索解決方案深度挖掘_第2頁
MOSS企業(yè)搜索解決方案深度挖掘_第3頁
MOSS企業(yè)搜索解決方案深度挖掘_第4頁
MOSS企業(yè)搜索解決方案深度挖掘_第5頁
已閱讀5頁,還剩29頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

MOSS企業(yè)搜索深度挖掘李劼

商務(wù)解決方案技術(shù)專家微軟中國蘇永銳SharePoint技術(shù)解決方案專家微軟中國日程微軟企業(yè)搜索解決方案概述搜索更多的文件格式和內(nèi)容源類型互聯(lián)網(wǎng)網(wǎng)站搜索與搜索結(jié)果整合條條大路通羅馬:搜索管理的多樣化我知道你不知道我知道:優(yōu)化搜索結(jié)果的相關(guān)性搜索增強(qiáng)十全大補(bǔ)貼MicrosoftSearchServer2008微軟企業(yè)搜索解決方案概述企業(yè)搜索和互聯(lián)網(wǎng)搜索有什么不同??jī)?nèi)容源不同內(nèi)部門戶網(wǎng)頁文件共享效勞器SharePoint站點(diǎn),LotusDomino數(shù)據(jù)庫,Exchange公用文件夾關(guān)系型數(shù)據(jù)庫:SQLServer,Oracle,DB2,MySQL…平安性要求不同誰能看,誰不能看?搜索到達(dá)的深度不同各種類型文檔的全文索引需求IT管理角度的需求不同可管理爬網(wǎng)時(shí)段,可定制最正確匹配微軟企業(yè)搜索解決方案概述基于MOSS2007的企業(yè)搜索解決方案技術(shù)架構(gòu)〔I〕索引器負(fù)載均衡爬網(wǎng)用戶搜索請(qǐng)求Web前端索引內(nèi)容傳輸查詢服務(wù)器各種內(nèi)容源微軟企業(yè)搜索解決方案概述基于MOSS2007的企業(yè)搜索解決方案技術(shù)架構(gòu)〔II〕搜索更多的文件格式和內(nèi)容源類型默認(rèn)的文件格式就足夠了嗎?文件格式:MOSS預(yù)裝支持Office文檔等格式內(nèi)容源:預(yù)裝支持文件共享、SharePoint、網(wǎng)站、數(shù)據(jù)庫、ExchangePF、LotusNotes怎么可能足夠?我要全文搜索CAD文檔,我要提取元數(shù)據(jù)!我有太多的PDF文檔和RAR、ZIP壓縮過的文檔,你能全文搜索嗎?我還想搜MP3的ID3Tag,還想搜JPG的元數(shù)據(jù)……搜索更多的文件格式和內(nèi)容源類型MSSEARCH架構(gòu)微軟一直以來沿用的企業(yè)搜索架構(gòu)SQLServer2000,SQLServer2005,SQLServer2021WindowsDesktopSearchv1,v2,v3,v4(future)WindowsServerIndexingServiceWindowsVista,Windows7SharePoint2001,SharePoint2003,SharePoint2007,WSS1/2/3,SharePoint14…對(duì)于文件格式和內(nèi)容源的擴(kuò)展性iFilterProtocolHandler搜索更多的文件格式和內(nèi)容源類型基于MSSEARCH架構(gòu)進(jìn)行擴(kuò)展通過iFilter擴(kuò)展支持全文搜索的文件格式MOSS內(nèi)置iFilter支持118種常用文件格式,加上各種網(wǎng)頁后綴名可達(dá)數(shù)百種第三方iFilter數(shù)量眾多RAR,ZIP,CAB,EXE,DWG,DWF,PDF,Visio…將會(huì)推出MicrosoftiFilterPack,包括TIFOCR方式搜索安裝在MOSS上的時(shí)候注意注冊(cè)表項(xiàng)通過ProtocolHandler擴(kuò)展支持的內(nèi)容源如果我不想通過BDC搜索數(shù)據(jù)庫如果我的某個(gè)應(yīng)用,要有自己獨(dú)特的架構(gòu)注意GetSecurityDescriptor,有它就有平安想要自己編?沒問題!Windows2003PlatformSDKMOSSSDK(v1.2)演示CAD文檔搜索及展現(xiàn)李劼商務(wù)解決方案技術(shù)專家微軟中國截圖演示互聯(lián)網(wǎng)網(wǎng)站搜索與搜索結(jié)果整合互聯(lián)網(wǎng)網(wǎng)站技術(shù)的復(fù)雜性現(xiàn)在很多網(wǎng)站都是基于各自的Forms驗(yàn)證,通過Cookie保存驗(yàn)證信息,該如何爬?。坑泻芏嗑W(wǎng)站在基于Forms根底上還提供了數(shù)字圖片認(rèn)證方式,由該如何爬?。坑泻芏嗑W(wǎng)站為了提供各種動(dòng)態(tài)效果使用了Ajax技術(shù),這又該如何爬取?網(wǎng)站有大量鏈接都是通過JavaScript生成的,如何爬取呢?應(yīng)用場(chǎng)景舉例基于Forms認(rèn)證及圖片數(shù)字認(rèn)證的網(wǎng)站基于Ajax技術(shù)的網(wǎng)站關(guān)鍵技術(shù)爬網(wǎng)模塊WinForm+.NET2.0WebbrowserControl+MSHTMLControl使用基于WinForm能充分利用windows的消息循環(huán)及其多線程機(jī)制。使用.NET2.0WebbrowserControl獲取網(wǎng)頁,可以利用IE內(nèi)核快速實(shí)現(xiàn)高效爬網(wǎng)網(wǎng)頁分析基于IE內(nèi)核的MSHTML控件數(shù)字圖片認(rèn)證模塊采用“Otsu閾值算法”二值化圖片預(yù)處理采用“歐氏最小距離法”聚類分析識(shí)別圖片數(shù)字爬網(wǎng)配置模塊WebPart開發(fā)及數(shù)據(jù)庫的讀取使用WebPart開發(fā)模板控件,快速開發(fā)WebPart使用MenuTemplate、SPGridView類實(shí)現(xiàn)與SharePointSearchService的無縫集成在wss_minimaltrust.config文件中添加節(jié)點(diǎn)<SecurityClassName="SqlClientPermission"Description="System.Data.SqlClient.SqlClientPermission,System.Data,Version=1.0.5000.0,Culture=neutral,PublicKeyToken=b77a5c561934e089"/>實(shí)現(xiàn)對(duì)數(shù)據(jù)庫的讀寫模板控件下載地址:/Lists/List2/Attachments/24/VSeWSS-new%20version.zip演示GrabberX蘇永銳SharePoint技術(shù)解決方案專家微軟中國截圖演示搜索管理的多樣化條條大路通羅馬并不是只有用SharePoint那個(gè)Web界面才能管理爬網(wǎng)!如果你是IT管理人員,你想要什么?用命令行方式管理爬網(wǎng),使其更自動(dòng)化我討厭Web緩慢的響應(yīng)速度和Javascript,我要MMC或者Windows程序方式的管理我要批量添加LotusNotes數(shù)據(jù)庫作為爬網(wǎng)內(nèi)容源MOM能不能監(jiān)視SharePoint的爬網(wǎng)搜索狀態(tài)?如果你是開發(fā)人員,你想要什么?我要把爬網(wǎng)的管理集成進(jìn)自己的應(yīng)用中我要更方便的調(diào)試管理爬網(wǎng)的方法搜索管理的多樣化五湖四海來相會(huì)PowerShell:下一代的萬金油、大力丸MOM–SharePointManageabilityKit:你太有才了MOSSSearchAdmin:符合人類使用習(xí)慣的開源搜索管理WindowsForm程序調(diào)用WebService:想怎么搞,就怎么搞搜索管理ObjectModelNamespace: BestBet ContentSource CrawlRule Schedule Scope Ranking Mapping Keyword ……演示搜索管理李劼商務(wù)解決方案技術(shù)專家微軟中國截圖演示優(yōu)化搜索結(jié)果的相關(guān)性我知道你不知道我知道你不知道我知道你不知道漢語分詞:搜索引擎要懂中文WordBreaker〔分詞器〕擴(kuò)展錯(cuò)別字?你是不是要找……開源的中文的Didyoumean功能噪聲詞:你別想找到我C:\ProgramFiles\MicrosoftOfficeServers\12.0\Data\Config\noisechs.txt最正確匹配!企業(yè)內(nèi)自己的“競(jìng)價(jià)排名〞紅薯白薯地瓜皆是番薯:關(guān)鍵詞的同義詞、近義詞C:\ProgramFiles\MicrosoftOfficeServers\12.0\Data\Config\tschs.xml截圖演示優(yōu)化搜索結(jié)果的相關(guān)性只有想不到,沒有做不到你自己的高級(jí)搜索Webpart把MOSS搜索嵌入你自己的企業(yè)應(yīng)用:WebService、OMEnterpriseSearchQuerySyntaxKeyword+/-雙引號(hào)Scope:TECHEDAuthor:JieLiURLk=,v=,s=,start=,a=SQLSyntaxCONTAINS,LIKE,FREETEXTORDERBYSCOPEMetadata,Property,托管屬性演示企業(yè)搜索查詢語法李劼商務(wù)解決方案技術(shù)專家微軟中國截圖演示搜索增強(qiáng)十全大補(bǔ)貼堅(jiān)持拿來主義一百年不變中文版“你是不是要找〞GrabberX,互聯(lián)網(wǎng)網(wǎng)站抓取好幫手MOSSSearchAdmin,用OM管理搜索FacetedSearch,搜索結(jié)果分類HotSearch,用戶熱門搜索指南預(yù)定義搜索,給用戶一個(gè)推薦選擇大量的例如!EnterpriseSearchJumpstartKit1.0iFilter,ProtocolHandler,CustomSecurityTrimmer…MicrosoftSearchServer2021你們是第一批公開看到功能演示的人!專業(yè)的企業(yè)搜索效勞器,只做搜索整合其他搜索引擎,包括你自己的應(yīng)用Express:要的就是免費(fèi)比MicrosoftOfficeSharePointServer2007forSearchEnterpriseEdition/StandardEdition要好念太多了!MicrosoftSearchServer2021第一時(shí)間帶給你……可以單一效勞器部署,也可以做效勞器場(chǎng)〔Express版本限制為單一效勞器部署〕數(shù)據(jù)庫可以使用SQLServer或SQLServerExpress如果用SQLExpress,由于4G的數(shù)據(jù)庫限制導(dǎo)致能爬的文檔數(shù)為十五萬~三十萬用完全版本的SQL沒有限制,但每一個(gè)Index不要超過五千萬文檔數(shù)需要Windows2003SP1以上,或Windows2021多語言支持x86/x64架構(gòu)MicrosoftSearchServer2021第一時(shí)間帶給你……安裝速度超快,裝好一個(gè)MOSSfS要一小時(shí),MSS最簡(jiǎn)單裝只要20分鐘全新的管理界面,搜索專注增強(qiáng)的索引格式,更高的壓縮比優(yōu)化的SQL訪問,提高爬網(wǎng)、查詢效率穩(wěn)定性更好完整索引PowerPoint格式文件MicrosoftSearchServer2021第一時(shí)間帶給你……整合!整合!只要外部應(yīng)用搜索結(jié)果返回編碼符合標(biāo)準(zhǔn)的XML,就可以在MSS上用XSLT轉(zhuǎn)換后展現(xiàn)非常簡(jiǎn)單的定義方式已經(jīng)有很多定義可以使用:通用搜索引擎:LiveSearch,YahooSearch新聞搜索:LiveNews,YahooNews,GoogleNews圖像、視頻搜索:YahooImageSearch,Flickr,Youtube專項(xiàng)搜索:MSDN,Technet,GoogleBlog,LinkedIn,WikiPedia…MicrosoftSearchServer2021功能比照數(shù)據(jù)庫搜索MSS:不具備BDC,但可整合企業(yè)內(nèi)其他應(yīng)用的搜索結(jié)果,也可通過PH擴(kuò)展MOSS:用BDC或者CustomPH搜索數(shù)據(jù)庫MOSSUpdatein2021:同時(shí)具備BDC與搜索整合功能部署形式MSSExpress:獨(dú)立效勞器部署MSS/MOSS:支持效勞器場(chǎng)部署索引文檔數(shù)量MSS/MSSExpress:沒有限制MOSS/MOSSfSEE:沒有限制MOSSfSSE:五十萬演示Microso

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論