Re: [情報] bing uses google search results

看板Google作者 (欲說還休)時間13年前 (2011/02/02 13:40), 編輯推噓10(12237)
留言51則, 13人參與, 最新討論串2/2 (看更多)
※ 引述《homelife (花生醬)》之銘言: : 不久前Google在官方部落格貼的一篇文章, : 大致內容是說從某個時間開始Google懷疑Bing有使用Google的搜尋結果, : 起因是在google搜尋罕見單字"torsorophy"的話, : google會建議使用者用"tarsorrhaphy"來搜尋並且建議兩個後者的搜尋結果, : 但是如果在Bing搜尋"torsorophy" Bing會直接出現兩個Google的建議結果 : 這點讓google開始懷疑 : Google圖:http://goo.gl/mZrj8 Bing圖:http://goo.gl/nyfLP : 之後Google對幾個罕見的單字作了一段時間的實驗並且把實驗貼在部落格裡 : 文章連結: : http://googleblog.blogspot.com/2011/02/microsofts-bing-uses-google-search.html 後面的實驗不是罕見單字,是更賤的實驗XD Google為了驗證Bing是否真的偷用自家搜尋結果, 自已「人造」了幾個單字 換句話說這些是不存在世界上的字,不會有人拿這些字打進搜尋引擊 然後替這些字隨便安上一個搜尋結果,搜尋結果跟字完全無關 看看這些隨便亂加的搜尋結果會不會被Bing撈走 如果Bing是正當地用演算法去搜尋 這些「人造字」打進去Bing不可能會有搜尋結果跑出來 但過了幾週卻跑出跟Google同樣的結果 所以幾乎可以說是罪證確鑿:   IE統計使用者拿哪些關鍵字打進Google→把結果整理給Bing→   Bing去Google撈同樣關鍵字的搜尋結果→放在自己的搜尋結果內 要說成是Google挖洞給Bing跳好像也說得通_A_ -- 果我們要把磁鐵棒放進線圈,    線圈會說「不!!不要過來!!」而發出阻力不讓磁鐵棒靠近。  但是如果我們要把放進去的磁鐵棒從線圈拿走,         「傲嬌是一種  線圈反而會說「我…我又沒有叫你走!!」而發出阻力不讓磁鐵棒離開。  自然現象」  這種現象不就是傲嬌嗎!                     新科科人雜誌  所以傲嬌這東西根本不是新梗,19世紀就有科學家發現傲嬌了。     /民明書房 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 114.47.83.114 ※ 編輯: Kawasumi 來自: 114.47.83.114 (02/02 13:41) ※ 編輯: Kawasumi 來自: 114.47.83.114 (02/02 13:42)

02/02 15:04, , 1F
被抓包了 XDD
02/02 15:04, 1F

02/02 15:09, , 2F
嚴格來說 這算是一個挖洞實驗 因為大家收集搜尋資訊的方法
02/02 15:09, 2F

02/02 15:10, , 3F
都差不多 所以這事情個人覺得比較像是 PR 操作的玩法
02/02 15:10, 3F

02/02 15:11, , 4F
今天的搜尋大未來會議 MS 灰頭土臉 這場算是Google大獲全勝
02/02 15:11, 4F

02/02 15:55, , 5F
什麼是PR操作@@咕狗了一下沒看到比較像的解釋
02/02 15:55, 5F

02/02 16:37, , 6F
公關操作 Google這招擺明就是讓MS難看而已 要說證據確鑿還算
02/02 16:37, 6F

02/02 16:37, , 7F
不上 所以昨天會議雙方已經演變成互吼了 哈哈
02/02 16:37, 7F

02/02 16:37, , 8F
不管怎樣 MS 這次糗大了
02/02 16:37, 8F

02/02 17:44, , 9F
太慘了
02/02 17:44, 9F

02/02 21:33, , 10F
太爽了 告死他
02/02 21:33, 10F

02/03 01:09, , 11F
XDDDDDDDDDDDDDDDD
02/03 01:09, 11F

02/03 02:25, , 12F
這不算 頂多算是Google很聰明的裱了MS
02/03 02:25, 12F

02/03 02:26, , 13F
MS本來是用一個自以為很聰明的方式取得搜尋結果
02/03 02:26, 13F

02/03 02:27, , 14F
但是應該不是直接撈Google的結果 但是那個方式是間接撈的
02/03 02:27, 14F

02/03 02:27, , 15F
從我的感覺應該是如此
02/03 02:27, 15F

02/03 09:05, , 16F
XDDDDDDDDDDDDDD
02/03 09:05, 16F

02/03 11:16, , 17F
讓我貼到FB去吧~~~~XD
02/03 11:16, 17F

02/05 02:04, , 18F
Google 的測試實驗真厲害,這下看 M$ 要怎麼睜眼說瞎話
02/05 02:04, 18F

02/05 02:05, , 19F
不過以台灣來說 ..... 最多人用的還是奇摩搜尋 XDXD
02/05 02:05, 19F

02/05 12:48, , 20F
不過實驗的電腦都自願把自己瀏覽的資料送回MS (opt-in)
02/05 12:48, 20F

02/05 12:48, , 21F
所以Bing顯示同樣結果也蠻正常 也可說是學習的演算法不錯
02/05 12:48, 21F

02/05 17:39, , 22F
其實我並不覺得MS睜眼說瞎話 Google 搞了半天也只有9%的命中
02/05 17:39, 22F

02/05 17:39, , 23F
率 說起來這個動作婊MS看似很漂亮 但因為Google這樣一搞 反
02/05 17:39, 23F

02/05 17:40, , 24F
而讓我會想試試看我從來沒試用過的Bing...這個PR動作的後續
02/05 17:40, 24F

02/05 17:40, , 25F
效應跟我當初想像不太一樣 來自社群的聲音竟然偏向了MS...
02/05 17:40, 25F

02/05 17:40, , 26F
本來還以為大家會說 MS 作弊 不意外... XD
02/05 17:40, 26F

02/05 17:42, , 27F
而且 Google 這個實驗其實你分析過他的實驗手法 就知道 他排
02/05 17:42, 27F

02/05 17:42, , 28F
除了 MS 可能取用各種crawling方式加權的可能性 僅剩Google
02/05 17:42, 28F

02/05 17:43, , 29F
一種 這點MS並沒有否認 只是這件事情要說抄襲實在是告不上法
02/05 17:43, 29F

02/05 17:43, , 30F
院的 :)
02/05 17:43, 30F

02/05 17:49, , 31F
不過這件事情就我的觀感就是 MS 的公關反應差到讓人覺得可笑
02/05 17:49, 31F

02/23 00:21, , 32F
不懂 information retrieval 才會傻傻得被 Google 騙
02/23 00:21, 32F

02/23 00:22, , 33F
Bing 使用的是一個常見做法-- User Log 來提升品質
02/23 00:22, 33F

02/23 00:23, , 34F
事實上,Google 也有類似的做法...
02/23 00:23, 34F

02/23 00:24, , 35F
Bing 用 Toolbar 去蒐集使用者行為(包括:IP,時間,url)
02/23 00:24, 35F

02/23 00:25, , 36F
既然是蒐集使用者行為那一定有使用者用 Google
02/23 00:25, 36F

02/23 00:29, , 37F
但這並不是針對 Google 更沒有去撈同樣關鍵字的搜尋結果
02/23 00:29, 37F

02/23 00:30, , 38F
(事實上,IR研究方面的人都知道,
02/23 00:30, 38F

02/23 00:31, , 39F
Google 根本就不讓你大量撈同樣關鍵字的搜尋結果
02/23 00:31, 39F

02/23 00:31, , 40F
只要有大量搜尋的行為就會被 Google 鎖住)
02/23 00:31, 40F

02/23 00:37, , 41F
這意味著 Bing 只拿到類似的資料:
02/23 00:37, 41F

02/23 00:38, , 42F
100.20.340.12 2011.1.2 http://www.quora.com/
02/23 00:38, 42F

02/23 00:39, , 43F
就 Google 的實驗做法 Bing 應該會拿到類似以下的 log
02/23 00:39, 43F

02/23 00:41, , 44F
02/23 00:41, 44F

02/23 00:42, , 45F
然後接著就是使用者點擊搜尋結果的網址
02/23 00:42, 45F

02/23 00:44, , 46F
但是因為演算法的關係 Bing會將時間相近的網站視為相關
02/23 00:44, 46F

02/23 00:46, , 47F
這才造成在 Bing 只得到Google塞給Bing的偽點擊資料時
02/23 00:46, 47F

02/23 00:47, , 48F
Bing 的搜尋結果"可能"跟Google一樣
02/23 00:47, 48F

02/23 00:49, , 49F
(只有9%的keyword有相同的結果,這應該算是巧合
02/23 00:49, 49F

02/23 00:50, , 50F
而不是 Google 抹黑的"抄襲")
02/23 00:50, 50F

10/09 23:52, , 51F
Bing 的搜尋結果" https://daxiv.com
10/09 23:52, 51F
文章代碼(AID): #1DIEvbVd (Google)
文章代碼(AID): #1DIEvbVd (Google)