您當(dāng)前的位置:首頁(yè) >> SEO知識(shí) >> 網(wǎng)站幫助
網(wǎng)絡(luò)信息挖掘技術(shù)可以提高搜索引擎獲取信息的準(zhǔn)確性,并可以對(duì)用戶搜索結(jié)果進(jìn)行相關(guān)處理,提高查準(zhǔn)率和查全率。網(wǎng)絡(luò)信息挖掘技術(shù)在搜索引擎中的應(yīng)用包括:
(1)文檔的自動(dòng)分類。Web頁(yè)面與一般的純文本文件不同,它是HTML格式的超文本,頁(yè)面中有
(2)自動(dòng)文摘的形成。搜索引擎向用戶返回檢索結(jié)果時(shí),通常要給出每個(gè)文檔的簡(jiǎn)單摘要,目前,大部分搜索引擎是機(jī)械地截取文檔的前幾句。而通過(guò)Web文本挖掘中的文本總結(jié)技術(shù),可以從Web頁(yè)面中提煉出重要的信息,形成文檔摘要,使用戶能較全面地了解文檔的內(nèi)容。
(3)檢索結(jié)果的聚類。搜索引擎的檢索結(jié)果常包含大量信息,且其中大部分是與檢索無(wú)關(guān)的信息。我們可以通過(guò)網(wǎng)絡(luò)信息挖掘技術(shù)對(duì)檢索結(jié)果的文檔進(jìn)行聚類,把結(jié)果信息用超鏈接方法以可視化方式提供給用戶,由用戶選擇自己感興趣的一簇,將大大減少瀏覽的頁(yè)面數(shù)量。
(4)查詢結(jié)果的相關(guān)度排序。Web頁(yè)面中包含了許多超鏈接,有指向其他網(wǎng)頁(yè)的,也有其他網(wǎng)頁(yè)指向本網(wǎng)頁(yè)的。因此,指向該網(wǎng)頁(yè)的鏈接體現(xiàn)了該網(wǎng)頁(yè)的引用情況??捎镁W(wǎng)絡(luò)信息挖掘技術(shù)對(duì)網(wǎng)頁(yè)引用的頻率統(tǒng)計(jì)確定它的重要性和相關(guān)性,從而有助于對(duì)搜索引擎返回結(jié)果進(jìn)行相關(guān)度排序。
(5)實(shí)現(xiàn)個(gè)性化的搜索引擎。目前,不同的人使用同一搜索引擎和同一檢索詞得到的結(jié)果相同,也就是說(shuō)搜索引擎沒(méi)有實(shí)現(xiàn)個(gè)性化檢索,即沒(méi)有考慮到人的地域、年齡、工作性質(zhì)等方面的差別。但是,用戶在使用搜索引擎搜索信息時(shí),在網(wǎng)站服務(wù)器上留下了大量的有用信息,通過(guò)對(duì)這些信息的挖掘,可以發(fā)現(xiàn)一些與用戶檢索的關(guān)鍵詞密切相關(guān)的網(wǎng)頁(yè),實(shí)現(xiàn)個(gè)性化檢索。
綜上所述,這是一個(gè)基本的搜索引擎工作流程,有助于大家加深對(duì)搜索引擎工作的認(rèn)識(shí)。搜索引擎只有一個(gè)目的,就是提供最相關(guān)的搜索結(jié)果給用戶。從搜索引擎優(yōu)化的角度而言,我們也應(yīng)該提供好的網(wǎng)頁(yè)給搜索引擎。