- 相關(guān)推薦
搜索引擎技術(shù)中人工智能的引入研究
在全球經(jīng)濟(jì)的不斷發(fā)展下,在搜索引擎中引入人工智能技術(shù),可以有效提高互聯(lián)網(wǎng)中的資源利用率,下面是小編搜集整理的一篇相關(guān)論文范文,歡迎閱讀借鑒。
Internet 網(wǎng)絡(luò)技術(shù)的快速發(fā)展 ,使網(wǎng)絡(luò)已經(jīng)成為了人們?nèi)粘I畈豢苫蛉钡囊徊糠?,它作為信息發(fā)布、傳播的主要方式 ,Web 擁有幾億頁面的分布式信息空間 ,目前仍然以 130~200d 翻一番的速度增加。Internet 信息廣泛 ,涵蓋量很大 ,要從中迅速找出自己需要的信息 ,有一定難度。因此 ,人們研究開發(fā)了多種檢索工具 ,以便自可以快速方便的找出自己想要的內(nèi)容。
隨著科學(xué)技術(shù)的不斷發(fā)展與成熟 ,網(wǎng)絡(luò)搜索引擎得到了快速發(fā)展 ,它是以一定的策略在互聯(lián)網(wǎng)中搜集、發(fā)現(xiàn)、提取、處理信息的過程 ,通過為用戶提供檢索服務(wù) ,發(fā)揮其信息導(dǎo)航的作用。
1、搜索引擎技術(shù)
1.1 分類
①目錄式搜索引擎。其特點(diǎn)主要是用人工方式或者半自動(dòng)的方式搜集相關(guān)信息 ,編輯人員通過訪問 Web 站點(diǎn) ,等信息摘要形成之后便會(huì)根據(jù)站點(diǎn)的內(nèi)容將其歸類在預(yù)先設(shè)置的分類中 ,將站點(diǎn)的描述、URL 置于此類別中 ,若用戶需要查詢某個(gè)關(guān)鍵詞 ,搜索軟件便會(huì)在預(yù)先存儲(chǔ)的描述中搜索。部分目錄也會(huì)接受用戶提交的描述 ,當(dāng)編輯人員認(rèn)可此描述后 ,便會(huì)將其歸類在相關(guān)類別當(dāng)中 ,以供其他用戶查詢。此搜索引擎的優(yōu)點(diǎn)是導(dǎo)航質(zhì)量可靠 ,準(zhǔn)確性高 ,如 Yahoo ;缺點(diǎn)則是人工介入過多 ,維護(hù)量及維修費(fèi)用大 ,信息無法及時(shí)更新。
②基于 Robot 的搜索引擎。其特點(diǎn)是由稱為 Robot 的機(jī)器人程序用某種策略自動(dòng)發(fā)現(xiàn)并搜集互聯(lián)網(wǎng)中的有關(guān)信息 ,通過索引系統(tǒng)自動(dòng)建立信息索引 ,由查詢接口按照用戶輸入信息檢索索引庫 ,然后將查詢結(jié)果反饋給用戶。其較為顯著的一個(gè)特點(diǎn)是需要定期訪問曾經(jīng)搜集的網(wǎng)頁,并刷新索引,去除無用鏈接,網(wǎng)頁內(nèi)容的變化也會(huì)出現(xiàn)在用戶查詢結(jié)果中。其優(yōu)點(diǎn)是更新及時(shí)、不需要人工干預(yù)、信息齊全 ,如 Google,缺點(diǎn)則是返回信息較多 ,且無用信息多 ,用戶要在搜索結(jié)果中仔細(xì)篩選。
③Meta搜索引擎。其特點(diǎn)是自身無存放網(wǎng)頁信息的數(shù)據(jù)庫,用戶查詢某個(gè)關(guān)鍵詞時(shí) ,它可以將其查詢請(qǐng)求轉(zhuǎn)化為其他搜索引擎可以接受的形式 ,通過訪問多個(gè)搜索引擎查詢關(guān)鍵詞 ,并對(duì)查詢的相同結(jié)果進(jìn)行排除 ,之后返回給用戶。優(yōu)點(diǎn)是覆蓋面比較大 ,搜索效果好 ,缺點(diǎn)是具有局限性 ,無法充分發(fā)揮搜索引擎的功能。
1.2 工作原理及相關(guān)技術(shù)
搜索引擎的工作原理是通過一個(gè) Robot 最大限度的收集 WWW的網(wǎng)頁 ,根據(jù)網(wǎng)頁內(nèi)容建立反向索引 ,用戶想查詢有關(guān)內(nèi)容時(shí) ,輸入關(guān)鍵字作為查詢條件 ,搜索引擎根據(jù)預(yù)先建立的單詞索引或者網(wǎng)頁庫 ,檢索符合要求的網(wǎng)頁反饋給用戶。通常情況下 ,搜索引擎由三部分組織 ,如下圖所示(圖 1)!1】
、傩畔⑺鸭到y(tǒng)。主要以 Robot 自動(dòng)完成 Robot 在互聯(lián)網(wǎng)中漫游時(shí)能夠搜集大量的、多類型的新信息;ヂ(lián)網(wǎng)上信息含量大 ,更新速度快。為了確保搜索引擎信息具備一定的時(shí)效性與準(zhǔn)確性 ,就要提高 Robot 的搜索效率 ,完善其搜索策略。搜索策略主要有兩個(gè)內(nèi)容 ,一是從 URL 集合開始 ,根據(jù)其超鏈接 ,以深度或者寬度優(yōu)先的方法重復(fù)搜索互聯(lián)網(wǎng)中的有關(guān)信息 ,URL可以是任何 URL,但經(jīng)常會(huì)包括很多鏈接站點(diǎn) ;二是將 Web 空間根據(jù) IP 地址、域名劃分 ,搜索器需要對(duì)每個(gè)子空間進(jìn)行不斷搜索。
②索引系統(tǒng)。Robot 完成信息搜集后 ,要用索引系統(tǒng)程序?qū)ζ涫占木W(wǎng)頁進(jìn)行分析 ,并提取網(wǎng)頁 URL、頁面內(nèi)容包含的關(guān)鍵詞等信息 ,采用有關(guān)算法對(duì)其進(jìn)行計(jì)算 ,然后獲得網(wǎng)頁針對(duì)頁面文字及關(guān)鍵詞的相關(guān)度 ,用相關(guān)信息建立網(wǎng)頁索引數(shù)據(jù)庫。
、鄄樵兘涌。用戶做出查詢操作時(shí) ,搜索引擎根據(jù)查詢內(nèi)容迅速檢出相關(guān)文檔 ,并對(duì)查詢和文檔的相關(guān)度進(jìn)行分析 ,根據(jù)相關(guān)度大小對(duì)輸出結(jié)果進(jìn)行排序 ,反饋給用戶。其目的在于方便用戶獲得更加及時(shí)、有效的信息。而查詢接口的設(shè)計(jì) ,能夠適應(yīng)人類思維方式。
2、人工智能技術(shù)在搜索引擎中的應(yīng)用
現(xiàn)有搜索引擎效率較低 ,將人工智能技術(shù)引入搜索引擎中 ,不僅可以支持用戶的搜索及瀏覽操作 ,還可以提供獨(dú)立搜索的功能。
2.1 Robot 的人工智能化
基于 Robot 的搜索引擎使用人工智能技術(shù) ,其目的在于獲得互聯(lián)網(wǎng)中的信息資源 ,利用主頁的超文本鏈接 Web,然后通過 URL 引用一個(gè) HTML 文檔爬行到另一個(gè)文檔。其算法采用深度優(yōu)先、廣度優(yōu)先的搜索策略 ,廣度優(yōu)先能夠跟蹤頁面中的任何URL,覆蓋網(wǎng)頁范圍較廣 ;深度優(yōu)先則是輕松發(fā)現(xiàn)文檔結(jié)構(gòu) ,并進(jìn)行交叉引用。兩種算法雖然可以檢索出用戶需要的內(nèi)容 ,但無法對(duì)檢索出的信息進(jìn)行再分析。為有效提高其搜索效率 ,采用啟發(fā)式學(xué)習(xí)采取有效的搜索策略 ,可在互聯(lián)網(wǎng)上自動(dòng)整理信息。
2.2 智能代理技術(shù)的應(yīng)用
智能代理技術(shù)是人工智能研究的成果 ,可以對(duì)用戶知識(shí)進(jìn)行搜集、過濾 ,根據(jù)用戶需求的變化 ,將用戶可能感興趣的內(nèi)容主動(dòng)提交給用戶 ,此外 ,還可以根據(jù)用戶的相關(guān)要求 ,代替用戶完成某些任務(wù)。其特點(diǎn)是不斷學(xué)習(xí) ,積極、主動(dòng)的適應(yīng)用戶興趣的動(dòng)態(tài)變化 ,從而實(shí)現(xiàn)個(gè)性化服務(wù) ,因此 ,其具備智能性、主動(dòng)性、代理性及協(xié)作性等優(yōu)勢(shì)。
2.3 查詢接口的智能化
一是根據(jù)關(guān)鍵詞進(jìn)行搜索。用戶有查詢需求時(shí) ,搜索技術(shù)可以將其查詢需求分解為多個(gè)關(guān)鍵詞 ,根據(jù)關(guān)鍵詞計(jì)算 Web 文檔和用戶要求是否符合 ,從而選出合適的文檔。二是自然語言查詢。好的檢索語言可以提高搜索引擎對(duì)用戶查詢要求的理解 ,自然語言理解計(jì)算可以實(shí)現(xiàn)自然語言智能答詢。它可以將信息檢索從關(guān)鍵詞查詢提升到知識(shí)層面 ,通過理解、處理有關(guān)知識(shí) ,實(shí)現(xiàn)分詞技術(shù)、翻譯技術(shù)、短語識(shí)別等。因此,其服務(wù)更加人性化、智能化。
3、結(jié)束語
在全球經(jīng)濟(jì)的不斷發(fā)展下 ,互聯(lián)網(wǎng)已經(jīng)發(fā)展成全球最大的信息庫 ,成為傳播信息的主要途徑 ,并且擁有大量分散的信息內(nèi)容。在搜索引擎中引入人工智能技術(shù) ,可以有效提高互聯(lián)網(wǎng)中的資源利用率 ,實(shí)現(xiàn)資源共享充分發(fā)揮信息資源的作用。
參考文獻(xiàn)
[1]張曉剛,李明樹。智能搜索引擎技術(shù)的研究與發(fā)展[J].計(jì)算機(jī)工程與應(yīng)用,2011(24)。
[2]張明遠(yuǎn);诹S(jì)算的智能搜索引擎技術(shù)研究[D].武漢理工大學(xué):計(jì)算機(jī)應(yīng)用技術(shù),2010.
[3]王挺。智能搜索引擎在企業(yè)人力資源管理決策支持系統(tǒng)中的應(yīng)用[J].電腦知識(shí)與技術(shù),2010(24)。
【搜索引擎技術(shù)中人工智能的引入研究】相關(guān)文章:
TD—LTE關(guān)鍵技術(shù)和引入策略研究06-17
搜索引擎中的網(wǎng)絡(luò)蜘蛛技術(shù)探析09-21
在大學(xué)英語課堂中引入演講的研究與實(shí)踐09-01
搜索引擎技術(shù)及趨勢(shì)09-04
英語教學(xué)中的文化引入10-22
GPRS技術(shù)在ITS中的應(yīng)用研究08-29
論人工智能的研究與發(fā)展05-24