Post By:2009/5/13 17:37:01
作為人類對(duì)信息控制和管理最普及、最便捷的途徑,搜索引擎的每一個(gè)新成果都可能影響整個(gè)社會(huì)文明進(jìn)步的進(jìn)程。它的未來(lái)在哪里?我們一直在期待大佬們每一個(gè)可能的答案。
最近,在中文互聯(lián)網(wǎng)領(lǐng)域,百度上交了自己的作業(yè)--阿拉丁。之前李彥宏和李一男曾經(jīng)在多個(gè)公開場(chǎng)合提及它,但在發(fā)布時(shí),百度卻變得異常低調(diào)。
這個(gè)被百度官方稱為“搜索開放平臺(tái)”的新東西會(huì)是影響搜索未來(lái)的big thing么?在過(guò)去的幾天里,這是我與業(yè)界朋友聊天的唯一話題,在本文評(píng)論之前,我先梳理一下什么是搜索開放平臺(tái)本身。
我所理解的搜索開放平臺(tái)
“搜索開放平臺(tái)”的機(jī)制實(shí)際上很簡(jiǎn)單,站長(zhǎng)主動(dòng)向搜索引擎提交一個(gè)個(gè)結(jié)構(gòu)化的數(shù)據(jù)模塊,并可設(shè)置其展現(xiàn)樣式、關(guān)聯(lián)的關(guān)鍵詞、更新頻率等,百度予以采納后將這些數(shù)據(jù)直接呈現(xiàn)給用戶。
和傳統(tǒng)的搜索機(jī)制,它主要有3點(diǎn)變革:
其一,傳統(tǒng)搜索的展示元為一個(gè)個(gè)的web,開放平臺(tái)將其縮小到了數(shù)據(jù)模塊。這一變革的意義在于信息價(jià)值的最大化,同時(shí)大幅提升搜索的用戶體驗(yàn)。
這一點(diǎn),大家可以百度一下“人民幣匯率”,我粗略估算了一下,應(yīng)用搜索開放平臺(tái)之后,對(duì)于關(guān)心“人民幣匯率”的用戶,每次檢索,至少可以節(jié)省10秒以上。
其二,搜索由“只讀”變?yōu)椤翱蓪憽。如果說(shuō)之前的sitemap類協(xié)議讓搜索從“被動(dòng)”變成“主動(dòng)”,那么阿拉丁讓搜索引擎本身從“只讀”變成了“可寫”。站長(zhǎng)在參與搜索結(jié)果本身,將變得越來(lái)越主動(dòng),而這種主動(dòng),是基于非SEO方式下開展的。
其三,搜索結(jié)果開始可定制。在開放平臺(tái)中,站長(zhǎng)將“指定的內(nèi)容”,在“指定的關(guān)鍵詞”匹配下,以“指定的樣式”進(jìn)行展現(xiàn)。
從本質(zhì)上來(lái)說(shuō),這可以理解為:百度與內(nèi)容網(wǎng)站合作,共同來(lái)滿足網(wǎng)民對(duì)搜索體驗(yàn)的更高要求。
搜索開放平臺(tái)、Onebox、Subscribed Links、SearchMonkey
看到這個(gè)平臺(tái),讓我想起了一大堆搜索創(chuàng)新技術(shù),包括Google的Onebox、Subscribed Links,以及Yahoo的SearchMonkey。
這些新應(yīng)用的共同之處在于,搜索結(jié)果將展示一些更為具體的數(shù)據(jù)模塊,而非傳統(tǒng)的--鏈接,比如在Google onebox技術(shù)下,搜索百度的股票“BIDU”可以直接看到實(shí)時(shí)的盤面信息,在Yahoo的SearchMonkey技術(shù)下,一些聲音、視頻節(jié)目可以嵌入到結(jié)果中直接播放。
不過(guò)它們和搜索開放平臺(tái)卻有著很大的區(qū)別--Onebox下搜索結(jié)果的展示方式很像阿拉丁,但它是一個(gè)封閉的系統(tǒng),主要由Google自身把控,Google再?gòu)?qiáng)大,也不可能聰明到重構(gòu)內(nèi)容網(wǎng)站的數(shù)據(jù)展示形式,它更多的是對(duì)自身網(wǎng)頁(yè)數(shù)據(jù)庫(kù)內(nèi)容的直接抓取,且覆蓋領(lǐng)域很小。
從運(yùn)行機(jī)制來(lái)看,Subscribed Link和SearchMonkey倒是和搜索開放平臺(tái)有點(diǎn)相似--站長(zhǎng)提交標(biāo)準(zhǔn)的數(shù)據(jù)模塊,設(shè)置匹配的關(guān)鍵詞,設(shè)計(jì)其展示樣式,Google和Yahoo對(duì)數(shù)據(jù)進(jìn)行索引,供用戶直接查詢。但實(shí)際卻大不相同:
其一,是否將這些應(yīng)用展現(xiàn)在搜索結(jié)果中,搜索開放平臺(tái)是由百度產(chǎn)品人員替用戶來(lái)考慮決定的,而Subscribed Link和SearchMonkey是由用戶決定的。Subscribed Link采用的是用戶訂閱的方式,也就是說(shuō),只有當(dāng)你訂閱某個(gè)內(nèi)容網(wǎng)站提交的數(shù)據(jù)模塊時(shí),在搜索相關(guān)關(guān)鍵詞后才能感受到它的存在。SearchMonkey也類似。
也就是說(shuō),百度期望平臺(tái)的應(yīng)用能讓每一個(gè)用戶受益,而Google和Yahoo則更在意開放的自由度。我認(rèn)為,這是“百度更懂中國(guó)網(wǎng)民”的又一次體現(xiàn)。如果搜索開放平臺(tái)也采用“自由使用”的方式,幾乎可以肯定它將成為雞肋。
其二,搜索開放平臺(tái)目前只開放了“確定性”的數(shù)據(jù)源,類似“人民幣匯率”、“NBA賽程”這種。而Subscribed Link和SearchMonkey則甚至開放了圖片、視頻、游戲等眾多內(nèi)容。
這是百度的又一個(gè)聰明之處。顯然,對(duì)于一個(gè)強(qiáng)推的應(yīng)用來(lái)說(shuō),最重要的就是可控性,開放是一把雙刃劍,它可能帶來(lái)更精準(zhǔn)的搜索結(jié)果,也可能帶來(lái)一大堆spam。在這一點(diǎn)上,百度極為謹(jǐn)慎,這種謹(jǐn)慎很有必要。
不管是阿拉丁、onebox,還是Subscribed Link、SearchMonkey,本質(zhì)上都是搜索巨頭們對(duì)“Hidden Web”(暗網(wǎng))的一種應(yīng)對(duì)方案,但大家在處理方式上的不同,將引發(fā)截然不同的效果。
如何評(píng)估阿拉丁對(duì)中文互聯(lián)網(wǎng)的影響
一切才剛剛開始,現(xiàn)在要評(píng)價(jià)搜索開放平臺(tái)似乎為時(shí)尚早,不過(guò)它的王侯氣質(zhì)已經(jīng)顯現(xiàn)出來(lái)。在我看來(lái)看,這個(gè)平臺(tái)將帶來(lái)以下變革。
1、搜索體驗(yàn)革命。Web還是那些Web,它們的內(nèi)容沒有發(fā)生任何變化,但搜索開放平臺(tái)將用戶想要的最終答案呈現(xiàn)出來(lái),這一點(diǎn),是全體中文網(wǎng)民的福氣。
在韓國(guó)的Naver搜索引擎中,輸入“china”你會(huì)發(fā)現(xiàn)一個(gè)關(guān)于中國(guó)概況的信息模塊,與百度相比,Naver依賴的是人肉的力量,兩者搜索體驗(yàn)的提升是異曲同工的。
2、搜索引擎與內(nèi)容網(wǎng)站的關(guān)系將重構(gòu)。在互聯(lián)網(wǎng)早期,網(wǎng)站更多來(lái)自自然流量,Yahoo和Google的崛起開始讓提供內(nèi)容的網(wǎng)站對(duì)搜索越來(lái)越依賴。隨著搜索開放平臺(tái)、Subscribed Link、SearchMonkey等新技術(shù)的應(yīng)用,可以想象,針對(duì)同一類數(shù)據(jù)的搶奪將不可避免的變得慘烈,在這個(gè)過(guò)程中,搜索引擎與內(nèi)容網(wǎng)站之間的關(guān)系將變得更加微妙。
3、互聯(lián)網(wǎng)信息的流通正在有序化。對(duì)于搜索,傳統(tǒng)的展現(xiàn)方式是以網(wǎng)頁(yè)為單位的,百度的搜索開放平臺(tái)則讓這種單位縮小到了一個(gè)個(gè)信息模塊,這些信息模塊的整理和標(biāo)準(zhǔn)化將有助于未來(lái)我們對(duì)互聯(lián)網(wǎng)信息更深層次的掌控。
總之,阿拉丁的最大受益者是網(wǎng)民,其次是那些在這個(gè)變革期間的積極實(shí)踐網(wǎng)站,最后才是百度自身。值得提醒的是,一如當(dāng)年搜索引擎誕生之初就重視SEO的網(wǎng)站,這是一個(gè)新的契機(jī)。
搜索開放平臺(tái)只是“阿拉丁”的“一期工程”
通過(guò)開放平臺(tái)來(lái)解決“暗網(wǎng)”問(wèn)題,可以理解為一種“迂回”的方式,但是我相信,在百度的整個(gè)“阿拉丁”計(jì)劃中,這只是一部分。
據(jù)Communications Of the ACM的數(shù)據(jù),目前主流的搜索引擎只覆蓋到了網(wǎng)頁(yè)數(shù)據(jù)內(nèi)容的37%。如何抓取更深層次的網(wǎng)頁(yè),并非一個(gè)搜索開放平臺(tái)完全能解決的,比如聲音、視頻格式內(nèi)容,AJAX產(chǎn)生的內(nèi)容,程序動(dòng)態(tài)生成的內(nèi)容,人為限制的內(nèi)容,等等。
相信在搜索開放平臺(tái)之外,百度還在嘗試一些主動(dòng)的技術(shù)。等到將所有關(guān)節(jié)都打通的時(shí)候,阿拉丁的完整面貌才會(huì)展現(xiàn)在我們面前。
從阿拉丁計(jì)劃中我們可以得到一個(gè)啟示:真正顛覆格局的還是技術(shù)上的創(chuàng)新,一旦這些創(chuàng)新打破了各個(gè)信息源之間的隔閡,未來(lái)的互聯(lián)網(wǎng)將變得更加有意思。
對(duì)阿拉丁的一些建議和強(qiáng)調(diào)
在我的理解中,阿拉丁計(jì)劃成敗,有幾個(gè)問(wèn)題至關(guān)重要。
1、對(duì)信息源的100%把握
單純論理想,Google Base不可謂不宏大,也不可謂不開放,但如果在中國(guó)開放這么一個(gè)東西,不可避免成了spam的樂(lè)園。
對(duì)于阿拉丁,我的建議就是--控制、控制、控制。據(jù)我所知,目前百度對(duì)網(wǎng)站提交數(shù)據(jù)的審核非常嚴(yán)格,對(duì)什么是“確定性數(shù)據(jù)”,百度一定要有一個(gè)非常嚴(yán)厲的把控。
阿拉丁應(yīng)該是一個(gè)著眼未來(lái)的長(zhǎng)期計(jì)劃,不要急于求成,寧愿這個(gè)進(jìn)程更慢一點(diǎn),急功近利會(huì)害了它。
2、必要的黑名單機(jī)制
我留意到在搜索開放平臺(tái)的注冊(cè)中,引入了實(shí)名機(jī)制,站長(zhǎng)甚至需要提交身份證復(fù)印件?梢钥闯觯俣葘檎鹃L(zhǎng)建立一個(gè)信用的評(píng)估機(jī)制。
要保證平臺(tái)本身的健康,這一點(diǎn)很有必要。從規(guī)則來(lái)看,百度對(duì)站長(zhǎng)提交的信息會(huì)進(jìn)行審核,但并未公布一個(gè)黑名單機(jī)制,我建議對(duì)于一些有惡意的站長(zhǎng),可以永久封殺。
愛情就是犯。賤,而且還是一次又一次的犯。賤。什么時(shí)候你不犯。賤了,女人就來(lái)了!