bing核心搜索:網址查詢、追蹤鏈接和相關搜索
題記:這是一篇來自Bing核心搜索研發(fā)部經理的一篇文章,本文講訴了Bing的一系列功能改進,這只是一篇普通的搜索功能改進介紹,但通讀本文, 我們會發(fā)現,搜索引擎會把大量精力放在研究人們在搜索時犯的錯、如何正確理解用戶的意圖、以及利用詞庫提供更精準的內容上面。所以盧松松相信,無論是bing、Google還是百度,都會這么做。
在Bing,我們承諾提供最好的搜索結果, 雖然研究小組數據挖掘專家,在不斷提供我們的核心拼寫和排名算法,可現實是總有某些歷史上的遺留下的缺陷,這部分是因為人們過于依賴搜索所犯的錯誤,在這篇文章中,我的同事Bill Ramsey(Bing的研發(fā)部經理),將從三個方面介紹缺陷的發(fā)生率和嚴重性:網址查詢、追蹤鏈接和相關搜索。
網址查詢常見的錯誤
這 是搜索缺陷的主要來源之一,涉及到我們所說的網址查詢,例如“facebook.com”或“雅虎網站/郵箱”的查詢,乍一看,你可能會認為這是一個簡單 的問題。畢竟搜索引擎(Bing)包含數十億網址,找到一個匹配的網站沒多少難度。但在現實中,這種類型的查詢實際上相當復雜。因為我們所有人會用無數的 拼寫與變體。
例如,“facebook.com”就有上千個不同的變體,如“facebookc.om”,“facbook.com”,和 “ww.faceboo.omc”,除了這類拼寫錯誤外,人們并不總是知道正確的URL。例如西南航空公司是southwest.com,但有些人試圖搜 “swair.com”達到該公司的網頁。同時,我們通??吹降木W址,如“雅虎網站/郵箱”時,正確是URL是“mail.yahoo.com”的排列。
即使我們找出了你真正的搜索意圖,但惡意網址或垃圾郵件發(fā)送者提出了另一個挑戰(zhàn)。它們獵取頂級域名對象如coolmathgames.com(人實際上是為coolmath-games.com)的URL。
這是我們的缺陷,我們主要通過三個領域來解決這類錯誤的查詢方法:
第一, 正確識別URL,我們可以就遮擋,通過確定的網址,我們避免如包括像searscardcom.com垃圾結果的問題。
第二, 進行模擬用戶錯誤測試,通過數十億的原模型,我們能夠解決常見的拼寫錯誤的網址。
第三, 我們會分析,尋找像“swair.com”網站,使用戶最終將結束預定網站“southwest.com”。
另 一個例子,適用于機器學習模式,像“facebooklogin.com” 的查詢相當于 “facebooklogin.net”,這是很常見的域名后綴輸入錯誤。此外,像“bed bath and beyond.com” 輸入成 bedbathandbeyond.com。我們的模型已經適應了這些變化,會主動把搜索結果修改,下面的例子是facebook的用戶:
刪除多余追蹤的相關鏈接
搜索引擎的關鍵功能之一,是查詢執(zhí)行拼寫和查詢擴展的組件,拼寫會糾正數百個錯誤的查詢,而搜索出現的詞組(下面的查詢框,表明我們改變了用戶的查詢),我 們把這種改建作為“追索”。例如,如果你輸入“關于成功英雄的事跡”,我們將顯示“包括引號的成功的英雄事跡”,但我們可能只顯示“關于成功的英雄和事 跡”,我們會架設所有關于你的意圖。
在過去,我們用同義詞作為我們追蹤鏈接的一部分,但會經常導致搜索結果偏離主題,導致同義詞追蹤成為多余的功能, 所有我們在不斷擴大“詞語”的定義,幫助其用戶更好的進行匹配。
所以這項功能我們已經刪除,這個附加的價值不大,當Bing改變一些同義詞的話,追蹤鏈接可能不可能添加更多的有價值的信息,所以我們將搜索結果的顏色改為黑色。我們將繼續(xù)努力為用戶指定的搜索詞語提供更好的查詢。
改進相關搜索
相關搜索,這個大家很熟悉,在人們初始搜索時,我們會把相關的搜索防止搜索結果左側,現在調整到右側,例如搜索“布拉德·皮特”:
(注:Bing中國版還沒有變,百度和Google在底部。)
有時我們會查詢搜索結果的題外話。例如“AMD”會給用戶提供意想不到的搜索結果,通過改善我們的相關模型。
同時,我們也取得了其他地方改進,超越有關相關搜索中的格式條款,即“KSN WeatherLab” 中的 “KSN Weather Lab”,(注:一些實驗性項目,處于測試階段),并避免在安全搜索中檢索到成人內容。
結論:
搜索引擎的有點在于它會始終依賴于人,而人們總會有不同缺陷的,我們做的是降低缺陷率和搜索率,希望人們可以做更少的搜索并做更多的事。
作者:Dr. William Ramsey—— bing核心搜索研發(fā)部首席開發(fā)經理
- 1OA辦公協同系統
- 2OA辦公自動化
- 3OA辦公軟件系統
- 4OA應用
- 5OA移動
- 6OA系統對比
- 7辦公室OA
- 8OA辦公軟件
- 9OA定制
- 10家電行業(yè)ERP系統(OA)
- 11煤炭行業(yè)ERP系統(OA)
- 12食品行業(yè)ERP系統(OA)
- 1SEO未來我們該怎么做?分析目前SE調整情況
- 2Google排名優(yōu)化文章:Google排名優(yōu)化翻譯文章
- 3分享網站優(yōu)化超越競爭對手的核心因素
- 4百度應用關鍵詞排名實現因素和定位
- 5應對排名問題進行網站內部頁面微調
- 6SEO具體操作:301重定向404頁面為外鏈
- 7博客留言會不會傳遞權重?社會化評論是否具有SEO價值?
- 8網絡軟文新聞與傳統新聞優(yōu)略對比
- 9醫(yī)療行業(yè)SEO將如何發(fā)展?醫(yī)療行業(yè)SEO真的要覆滅了嗎?
- 10SEO并不需要太高深的技巧:15個SEO注意事項
- 11網站優(yōu)化教程:DEDECMS地圖生成和百度Ping推送
- 12Matt Cutts暗示未來SEO的變化和對待SEO的變化
- 13網站性能優(yōu)化:base64:URL傳輸圖片文件
- 14淘寶客+SEO:最穩(wěn)健的導購網站模式
- 15GOOGLE站長管理員工具:搜索引擎優(yōu)化(SEO)錯誤
- 16網站優(yōu)化教程:清除那些冗余代碼讓搜索引擎抓取的更容易
- 17搜索引擎優(yōu)化教程:百度SEO方法匯總
- 18bing核心搜索:網址查詢、追蹤鏈接和相關搜索
- 19網站運營經驗分享:做好網站生態(tài)圈
- 20網站權重提高的方法:有效的外部鏈接獲取方法
- 21做SEO網站優(yōu)化入門:需要了解的SEO基礎信息
- 22SEO實例教程:百度蜘蛛304狀態(tài)碼的問題分析
- 23網站運營經驗分享:撰寫好的網站分析報告
- 24建站經驗分享:正確使用網站的標簽
- 25利用博客做SEO優(yōu)化:新浪博客做SEO
- 26SEO實例分析教程:網站日志200 0 64代碼
- 27SEO輔助插件:Chrome瀏覽器常用SEO插件介紹
- 28404頁面透徹的講解和404頁面設計
- 29張家界網站建設JSP與PHP的比較
- 30SEO新型技術:金字塔矩陣排名技術和操作原理