搜索引擎有兩個(gè)主要功能:爬行和構(gòu)建索引,并為搜索用戶提供他們確定的網(wǎng)站的排名列表最相關(guān)。
第一,抓取和索引。
在互聯(lián)網(wǎng)上對(duì)數(shù)十億個(gè)文檔,頁(yè)面,文件,新聞,視頻和媒體進(jìn)行爬行和編制索引。想象一下互聯(lián)網(wǎng)是大城市地鐵系統(tǒng)中的??烤W(wǎng)絡(luò)。每個(gè)站點(diǎn)都是一個(gè)獨(dú)特的文檔,通常是一個(gè)網(wǎng)頁(yè),但有時(shí)是PDF,JPG或其他文件。搜索引擎需要一種方法來(lái)“爬行”整個(gè)城市并找到沿途的所有站點(diǎn),因此他們使用最佳路徑可用鏈接。
Web的鏈接結(jié)構(gòu)用于將所有頁(yè)面綁定在一起。鏈接允許搜索引擎的自動(dòng)機(jī)器人稱為“爬蟲(chóng)”或“蜘蛛”到達(dá)網(wǎng)絡(luò)上數(shù)十億個(gè)互連文檔。一旦引擎找到這些頁(yè)面,它們就會(huì)從它們中解密代碼并將選定的部分存儲(chǔ)在海量數(shù)據(jù)庫(kù)中,以便稍后在搜索查詢需要時(shí)進(jìn)行調(diào)用。為了完成持有可在幾分之一秒內(nèi)訪問(wèn)的數(shù)十億頁(yè)面的巨大任務(wù),搜索引擎公司已經(jīng)在全世界構(gòu)建了數(shù)據(jù)中心。這些巨大的存儲(chǔ)設(shè)施可以容納數(shù)千臺(tái)機(jī)器,可以非??焖俚靥幚泶罅啃畔ⅰ.?dāng)一個(gè)人在任何一個(gè)主要引擎上進(jìn)行搜索時(shí),他們會(huì)立即要求結(jié)果;即使是一秒或兩秒的延遲也會(huì)引起不滿,因此引擎很難盡快提供答案。
第二,提供答案
提供用戶查詢的答案,最常見(jiàn)的是通過(guò)他們檢索的相關(guān)頁(yè)面列表以及相關(guān)性排名。搜索引擎是應(yīng)答機(jī)器。當(dāng)一個(gè)人進(jìn)行在線搜索時(shí),搜索引擎會(huì)搜索其數(shù)十億個(gè)文檔的語(yǔ)料庫(kù)并做兩件事:首先,它只返回那些與搜索者查詢相關(guān)或有用的結(jié)果;第二,它根據(jù)服務(wù)信息的網(wǎng)站的受歡迎程度對(duì)這些結(jié)果進(jìn)行排名。SEO的過(guò)程旨在影響它的相關(guān)性和普及性。
搜索引擎如何確定相關(guān)性和受歡迎程度?
對(duì)于搜索引擎,相關(guān)性不僅僅意味著找到具有正確單詞的頁(yè)面。在網(wǎng)絡(luò)的早期,搜索引擎并沒(méi)有比這個(gè)簡(jiǎn)單的步驟更進(jìn)一步,搜索結(jié)果的價(jià)值有限。多年來(lái),程序工程師已經(jīng)設(shè)計(jì)出更好的方法來(lái)將結(jié)果與搜索者的查詢相匹配。搜索引擎通常假設(shè)網(wǎng)站,頁(yè)面或文檔越受歡迎,其包含的信息必須越有價(jià)值。在用戶對(duì)搜索結(jié)果的滿意度方面,這一假設(shè)已被證明相當(dāng)成功。流行度和相關(guān)性不是手動(dòng)確定的。相反,引擎使用數(shù)學(xué)方程算法從相關(guān)性中分類(lèi),然后按質(zhì)量以及流行度的順序?qū)?nèi)容進(jìn)行排序。這些算法通常包含數(shù)百個(gè)變量。在搜索營(yíng)銷(xiāo)領(lǐng)域,我們將它們稱為“排名因素”專(zhuān)門(mén)針對(duì)此主題制作了一個(gè)資源:搜索引擎排名因素。
如何獲得成功?或者說(shuō)是搜索營(yíng)銷(xiāo)如何成功呢?
搜索引擎的復(fù)雜算法似乎難以理解。實(shí)際上,引擎本身幾乎沒(méi)有提供如何獲得更好結(jié)果或獲得更多流量的洞察力。他們?yōu)槲覀兲峁┑挠嘘P(guān)優(yōu)化和最佳實(shí)踐的內(nèi)容如下所述:
來(lái)自BAIDU站長(zhǎng)的SEO信息。BAIDU建議通過(guò)以下方式在搜索引擎中獲得更好的排名:
1、制作主要面向用戶的頁(yè)面,而不是搜索引擎。不要欺騙您的用戶或向搜索引擎展示與向用戶顯示的內(nèi)容不同的內(nèi)容,這種做法通常被稱為“隱藏真實(shí)內(nèi)容”。
2、創(chuàng)建一個(gè)具有清晰層次結(jié)構(gòu)和文本鏈接的站點(diǎn)。應(yīng)至少?gòu)囊粋€(gè)靜態(tài)文本鏈接訪問(wèn)每個(gè)頁(yè)面。
3、創(chuàng)建一個(gè)有用的,信息豐富的網(wǎng)站,并編寫(xiě)清晰準(zhǔn)確地描述您的內(nèi)容的頁(yè)面。確保<title>元素和ALT屬性具有描述性和準(zhǔn)確性。
4、使用關(guān)鍵字創(chuàng)建描述性的,人性化的網(wǎng)址。提供一個(gè)URL版本來(lái)訪問(wèn)文檔,使用301重定向或rel=“canonical”屬性來(lái)解決重復(fù)內(nèi)容。
來(lái)自BING的SEO信息,微軟的Bing工程師推薦以下內(nèi)容,以便在搜索引擎中獲得更好的排名:
1、確保使用干凈,關(guān)鍵字豐富的URL結(jié)構(gòu)。
2、確保內(nèi)容不包含在富媒體中,并驗(yàn)證富媒體不會(huì)隱藏來(lái)自爬網(wǎng)程序的鏈接。
3、創(chuàng)建關(guān)鍵字豐富的內(nèi)容并將關(guān)鍵字與用戶搜索的內(nèi)容進(jìn)行匹配。定期制作新鮮內(nèi)容。
4、不要將要編入索引的文本放在圖像中。例如,如果您希望將公司名稱或地址編入索引,請(qǐng)確保它不會(huì)顯示在公司徽標(biāo)中。
除了這種自由提供的建議之外,在網(wǎng)絡(luò)搜索存在的15年多的時(shí)間里,搜索網(wǎng)站運(yùn)維已經(jīng)找到了提取有關(guān)搜索引擎如何對(duì)網(wǎng)頁(yè)進(jìn)行排名的信息的方法。SEO和網(wǎng)站運(yùn)維使用這些數(shù)據(jù)來(lái)幫助他們的網(wǎng)站及其客戶實(shí)現(xiàn)更好的定位。
研究引擎活動(dòng)的網(wǎng)站管理員可能沒(méi)有比利用搜索引擎本身進(jìn)行實(shí)驗(yàn),測(cè)試假設(shè)和形成意見(jiàn)的自由更多的工具。通過(guò)這種迭代,時(shí)是艱苦的過(guò)程,已經(jīng)收集了大量關(guān)于發(fā)動(dòng)機(jī)功能的知識(shí)。我們嘗試過(guò)的一些實(shí)驗(yàn)是這樣的:
1、使用無(wú)意義關(guān)鍵字注冊(cè)新網(wǎng)站。
2、在該網(wǎng)站上創(chuàng)建多個(gè)頁(yè)面,所有頁(yè)面都針對(duì)類(lèi)似的荒謬術(shù)語(yǔ)。
3、使頁(yè)面盡可能接近相同,然后一次更改一個(gè)變量,嘗試放置文本,格式化,使用關(guān)鍵字,鏈接結(jié)構(gòu)等。
4、將域中的鏈接指向其他域上的已編制索引,爬網(wǎng)良好的頁(yè)面。
5、記錄搜索引擎中頁(yè)面的排名。
6、現(xiàn)在對(duì)頁(yè)面進(jìn)行小的更改并評(píng)估它們對(duì)搜索結(jié)果的影響,以確定哪些因素可能會(huì)導(dǎo)致結(jié)果上升或下降。
7、記錄任何看似有效的結(jié)果,并在其他域或其他術(shù)語(yǔ)上重新測(cè)試它們。如果多個(gè)測(cè)試始終返回相同的結(jié)果,那么您很可能會(huì)發(fā)現(xiàn)搜索引擎使用的模式。
我們從一個(gè)假設(shè)開(kāi)始,即頁(yè)面上較早鏈接比頁(yè)面下方的鏈接承載更多的權(quán)重。我們通過(guò)創(chuàng)建一個(gè)帶有主頁(yè)的無(wú)意義域來(lái)測(cè)試這一點(diǎn),該主頁(yè)具有指向三個(gè)遠(yuǎn)程頁(yè)面的鏈接,這三個(gè)遠(yuǎn)程頁(yè)面都具有在頁(yè)面上恰好出現(xiàn)一次的相同無(wú)意義單詞。在搜索引擎抓取頁(yè)面后,我們發(fā)現(xiàn)主頁(yè)上最早鏈接的頁(yè)面排名第一。這個(gè)過(guò)程很有用,但并不是唯一有助于教育搜索網(wǎng)站運(yùn)維的過(guò)程。搜索網(wǎng)站運(yùn)維還可以收集關(guān)于搜索引擎如何通過(guò)主要引擎用戶企業(yè)的競(jìng)爭(zhēng)情報(bào)。搜索網(wǎng)站運(yùn)維作為一個(gè)社區(qū)已經(jīng)開(kāi)始了解搜索引擎的許多基本操作以及創(chuàng)建獲得高排名和大量流量的網(wǎng)站和頁(yè)面的關(guān)鍵組件。