|
|
7認(rèn)識(shí)搜索引擎的原理更好地推廣你的網(wǎng)站-武漢百度搜索排名靠前優(yōu)化網(wǎng)站?
- 發(fā)布日期:2010-08-17 10:19
- 有效期至:長(zhǎng)期有效
- 瀏覽次數(shù):5
- 如果您對(duì) “ 7認(rèn)識(shí)搜索引擎的原理更好地推廣你的網(wǎng)站-武漢百度搜索排名靠前優(yōu)化網(wǎng)站? ” 這個(gè)招商項(xiàng)目感興趣,您可以留言咨詢,或者直接撥打右側(cè)的聯(lián)系電話。
|
搜索引擎并不真正搜索互聯(lián)網(wǎng),它搜索的實(shí)際上是預(yù)先整理好的網(wǎng)頁(yè)索引數(shù)據(jù)庫(kù)。搜索引擎,也不能真正理解網(wǎng)頁(yè)上的內(nèi)容,它只能機(jī)械的匹配網(wǎng)頁(yè)上的文字。 真正意義上的搜索引擎,通常指的是收集了互聯(lián)網(wǎng)上幾千萬(wàn)到幾十億個(gè)網(wǎng)頁(yè)并對(duì)網(wǎng)頁(yè)中的每一個(gè)文字(即關(guān)鍵詞)進(jìn)行索引,建立索引數(shù)據(jù)庫(kù)的全文搜索引擎。當(dāng)用戶查找某個(gè)關(guān)鍵詞的時(shí)候,所有在頁(yè)面內(nèi)容中包含了該關(guān)鍵詞的網(wǎng)頁(yè)都將作為搜索結(jié)果被搜出來(lái)。在經(jīng)過復(fù)雜的算法進(jìn)行排序后,這些結(jié)果將按照與搜索關(guān)鍵詞的相關(guān)度高低,依次排列。 現(xiàn)在的搜索引擎已普遍使用超鏈分析技術(shù),除了分析索引網(wǎng)頁(yè)本身的文字,還分析索引所有指向該網(wǎng)頁(yè)的鏈接的URL、AnchorText、甚至鏈接周圍的文字。所以,有時(shí)候,即使某個(gè)網(wǎng)頁(yè)A中并沒有某個(gè)詞比如“惡魔撒旦”,但如果有別的網(wǎng)頁(yè)B用鏈接“惡魔撒旦”指向這個(gè)網(wǎng)頁(yè)A,那么用戶搜索“惡魔撒旦”時(shí)也能找到網(wǎng)頁(yè)A。而且,如果有越多網(wǎng)頁(yè)(C、D、E、F……)用名為“惡魔撒旦”的鏈接指向這個(gè)網(wǎng)頁(yè)A,或者給出這個(gè)鏈接的源網(wǎng)頁(yè)(B、C、D、E、F……)越優(yōu)秀,那么網(wǎng)頁(yè)A在用戶搜索“惡魔撒旦”時(shí)也會(huì)被認(rèn)為更相關(guān),排序也會(huì)越靠前。 搜索引擎的原理,可以看做三步:從互聯(lián)網(wǎng)上抓取網(wǎng)頁(yè)建立索引數(shù)據(jù)庫(kù)在索引數(shù)據(jù)庫(kù)中搜索排序。 1.從互聯(lián)網(wǎng)上抓取網(wǎng)頁(yè) 利用能夠從互聯(lián)網(wǎng)上自動(dòng)收集網(wǎng)頁(yè)的Spider系統(tǒng)程序,自動(dòng)訪問互聯(lián)網(wǎng),并沿著任何網(wǎng)頁(yè)中的所有URL爬到其它網(wǎng)頁(yè),重復(fù)這過程,并把爬過的所有網(wǎng)頁(yè)收集回來(lái)。 2.建立索引數(shù)據(jù)庫(kù) 由分析索引系統(tǒng)程序?qū)κ占貋?lái)的網(wǎng)頁(yè)進(jìn)行分析,提取相關(guān)網(wǎng)頁(yè)信息(包括網(wǎng)頁(yè)所在URL、編碼類型、頁(yè)面內(nèi)容包含的所有關(guān)鍵詞、關(guān)鍵詞位置、生成時(shí)間、大小、與其它網(wǎng)頁(yè)的鏈接關(guān)系等),根據(jù)一定的相關(guān)度算法進(jìn)行大量復(fù)雜計(jì)算,得到每一個(gè)網(wǎng)頁(yè)針對(duì)頁(yè)面文字中及超鏈中每一個(gè)關(guān)鍵詞的相關(guān)度(或重要性),然后用這些相關(guān)信息建立網(wǎng)頁(yè)索引數(shù)據(jù)庫(kù)。 3.在索引數(shù)據(jù)庫(kù)中搜索排序 當(dāng)用戶輸入關(guān)鍵詞搜索后,由搜索系統(tǒng)程序從網(wǎng)頁(yè)索引數(shù)據(jù)庫(kù)中找到符合該關(guān)鍵詞的所有相關(guān)網(wǎng)頁(yè)。因?yàn)樗邢嚓P(guān)網(wǎng)頁(yè)針對(duì)該關(guān)鍵詞的相關(guān)度早已算好,所以只需按照現(xiàn)成的相關(guān)度數(shù)值排序,相關(guān)度越高,排名越靠前。最后,由頁(yè)面生成系統(tǒng)將搜索結(jié)果的鏈接地址和頁(yè)面內(nèi)容摘要等內(nèi)容組織起來(lái)返回給用戶。 搜索引擎的Spider一般要定期重新訪問所有網(wǎng)頁(yè)(各搜索引擎的周期不同,可能是幾天、幾周或幾月,也可能對(duì)不同重要性的網(wǎng)頁(yè)有不同的更新頻率),更新網(wǎng)頁(yè)索引數(shù)據(jù)庫(kù),以反映出網(wǎng)頁(yè)文字的更新情況,增加新的網(wǎng)頁(yè)信息,去除死鏈接,并根據(jù)網(wǎng)頁(yè)文字和鏈接關(guān)系的變化重新排序。這樣,網(wǎng)頁(yè)的具體文字變化情況就會(huì)反映到用戶查詢的結(jié)果中。 互聯(lián)網(wǎng)雖然只有一個(gè),但各搜索引擎的能力和偏好不同,所以抓取的網(wǎng)頁(yè)各不相同,排序算法也各不相同。大型搜索引擎的數(shù)據(jù)庫(kù)儲(chǔ)存了互聯(lián)網(wǎng)上幾千萬(wàn)至幾十億的網(wǎng)頁(yè)索引,數(shù)據(jù)量達(dá)到幾千G甚至幾萬(wàn)G。但即使最大的搜索引擎建立超過二十億網(wǎng)頁(yè)的索引數(shù)據(jù)庫(kù),也只能占到互聯(lián)網(wǎng)上普通網(wǎng)頁(yè)的不到30%,不同搜索引擎之間的網(wǎng)頁(yè)數(shù)據(jù)重疊率一般在70%以下。我們使用不同搜索引擎的重要原因,就是因?yàn)樗鼈兡芊謩e搜索到不同的網(wǎng)頁(yè)。而互聯(lián)網(wǎng)上有更大量的網(wǎng)頁(yè),是搜索引擎無(wú)法抓取索引的,也是我們無(wú)法用搜索引擎搜索到的。 你心里應(yīng)該有這個(gè)概念:搜索引擎只能搜到它網(wǎng)頁(yè)索引數(shù)據(jù)庫(kù)里儲(chǔ)存的網(wǎng)頁(yè)文字信息。你也應(yīng)該有這個(gè)概念:如果搜索引擎的網(wǎng)頁(yè)索引數(shù)據(jù)庫(kù)里應(yīng)該有而你沒有搜出來(lái),那是你的能力問題,學(xué)習(xí)搜索技巧可以大幅度提高你的搜索能力。 認(rèn)識(shí)搜索引擎的原理更好地推廣你的網(wǎng)站關(guān)鍵字:武漢百度搜索排名靠前優(yōu)化網(wǎng)站建設(shè)推廣策劃網(wǎng)上開店策劃、網(wǎng)上開店培訓(xùn)、武漢網(wǎng)上開店策劃、武漢網(wǎng)站建設(shè)、專業(yè)網(wǎng)站建設(shè)、深圳網(wǎng)上搜索優(yōu)化、北京網(wǎng)站推廣策劃。我們的目標(biāo):用百度競(jìng)價(jià)一半的費(fèi)用達(dá)到10倍以上的百度搜索效果。已用上百家成功案例,需要可以聯(lián)系電子商務(wù)策劃中心