[爆卦] i'Analyseur 的重大問題已回收

看板Gossiping作者 (hancel)時間5年前 (2018/10/20 06:41), 5年前編輯推噓36(38227)
留言67則, 42人參與, 5年前最新討論串1/4 (看更多)
現在有很多鄉民/黨工喜歡用i'Analyseur, 來分析/抓出 五毛/黨工.... i'Analyzeur的設計策略基本上是對的, 就是利用ip/登入時間/文章列表來抓出不尋常/異常的行為. 但是裡面的ip紀錄的擷取方法,很明顯是有bug的, 或者是說,有不盡完善的地方. 因為這個bug,大家所看到的ip交叉分析是有對有錯. 可是有對有錯,代表如果大家直接用這個結果來分析, 很容易推導出錯誤的結論. 首先,先拿八卦版版主的ip紀錄來看好了 https://www.ianalyseur.org/user/RandyMarsh/ https://www.ianalyseur.org/user/IbakaBlock/ https://www.ianalyseur.org/user/jacklyl/ https://www.ianalyseur.org/user/girl55665566/ https://www.ianalyseur.org/user/PPTplayer/ https://www.ianalyseur.org/user/RS5566/ 靠,這幾個人是分身大王啊? IP遍佈各地,甚至到國外去了. 如果你有這個結論,那你就已經被i'Analyseur的bug給愚弄了. i'Analyseur的ip紀錄,應該有根據發表文章上的ip/時間, 做為上線ip以及時間的紀錄之一. 但是這個parsing(懶得解釋了)一定是有bug的. 會把一篇文當中引用其他人的文的ip/時間也算進發表人. "請問要引用原文嗎(Y/N/All/Repost)?[Y] r" 裡面一般的Y引用可能是沒問題的(因為只留文章,且加":"), 但是Repost引用(沒有前置":")會導致, 被引用跟引用者兩人身分的混淆. 這就導致喜歡引用它人發文/發文常常被引用的人, 有機會會混在一起分不出來. 本篇文章中的諸位分身大王, 就是因為常常要開水桶藥單, 必須引用許多文章最為裁決證明, 導致錯誤結果. 結論: 在i'Analyseur的ip紀錄的parsing bug解決, 並將整個資料庫重新更新之前, 最好不要"直接"用它做重大指控, 參考可以,但是下結論之前, 自己最好多動手觀察/紀錄, 確認之後在說吧. 畢竟搞出烏龍被告被酸的時候, i'Analyseur它也不會幫你扛的. 另外,bug未修之前,有心人想要故意搞亂這個資料庫也是沒問題的. 例如,把我下面那三行前面":"去除, 放到你的文章當中, 你可能就會多了三個有來頭登錄ip了. : ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 24.130.192.150 : ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.112.8.116 : ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 73.92.207.178 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 24.6.102.107 ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1539988902.A.35D.html

10/20 06:42, 5年前 , 1F
沙發
10/20 06:42, 1F

10/20 06:42, 5年前 , 2F
沒差啦..說你網軍就網軍啊...都說了
10/20 06:42, 2F

10/20 06:42, 5年前 , 3F
查我自己id..還出來一堆不認識的笑死
10/20 06:42, 3F

10/20 06:43, 5年前 , 4F
浮動ip阿
10/20 06:43, 4F

10/20 06:44, 5年前 , 5F
數據給你你要自己判讀啊 2樓就是看不懂的
10/20 06:44, 5F

10/20 06:44, 5年前 , 6F
人XD
10/20 06:44, 6F

10/20 06:45, 5年前 , 7F
創世神認證的阿 黨工很怕吼
10/20 06:45, 7F

10/20 06:46, 5年前 , 8F
不認識很正常好嗎,你會知道誰跟你用
10/20 06:46, 8F

10/20 06:46, 5年前 , 9F
同ip喔
10/20 06:46, 9F

10/20 06:46, 5年前 , 10F
放心 寫這系統的防火牆都堵好了 人家拿來亂
10/20 06:46, 10F

10/20 06:46, 5年前 , 11F
搞與他無關
10/20 06:46, 11F

10/20 06:47, 5年前 , 12F
很怕喔 禮拜六早上特地發一篇
10/20 06:47, 12F

10/20 06:47, 5年前 , 13F
沒差吧 我看不管是說廠工還是說柯粉
10/20 06:47, 13F

10/20 06:48, 5年前 , 14F
都沒有人在附證明的啊
10/20 06:48, 14F

10/20 06:48, 5年前 , 15F
還好啦 也只有板主有這狀況
10/20 06:48, 15F
喜歡無":"引用別人發文, 跟常常被人無":"引用發文的人, 通通都會中鏢的. 這還不包括故意要搞破壞的人.

10/20 06:49, 5年前 , 16F
查出用過相同IP->點IP->看時間分析
10/20 06:49, 16F
總之,就是很有參考價值, 不過最好還是得親自好好檢查, 多觀察一下再下結論.

10/20 06:50, 5年前 , 17F
時間差很遠當然不懷疑, 時間很相近
10/20 06:50, 17F

10/20 06:51, 5年前 , 18F
小於1天, 那就很有可能是分身囉
10/20 06:51, 18F

10/20 06:51, 5年前 , 19F
所以說你不會看數據啊
10/20 06:51, 19F

10/20 06:52, 5年前 , 20F
誰會有那種奇怪的習慣啦...
10/20 06:52, 20F

10/20 06:59, 5年前 , 21F
你拿到統計數據就直接用嗎? 不修正連丁丁
10/20 06:59, 21F

10/20 06:59, 5年前 , 22F
的民調都會破五成
10/20 06:59, 22F

10/20 07:01, 5年前 , 23F
看不懂先推
10/20 07:01, 23F

10/20 07:02, 5年前 , 24F
那你做一個更好的啊,做不出來就閉嘴
10/20 07:02, 24F
你玻璃心啊? 我不是說很有參考價值, 但是要做重大決定之前, 請自己小心一點,多做複查動作. 其實這個Bug不好解決的,如果你有一點CS背景的話就知道.

10/20 07:08, 5年前 , 25F
原來如此
10/20 07:08, 25F

10/20 07:13, 5年前 , 26F
慘惹 現在領500還要學數據分析 我姆咪QQ
10/20 07:13, 26F
拜託,整個團隊中有一個人可以就好了, 其他人找出問題,然後由那一個比較懂得的人, 去做最後的查驗就好啊....

10/20 07:20, 5年前 , 27F
CS 不好解決,那你一定是選錯地圖了!
10/20 07:20, 27F

10/20 07:20, 5年前 , 28F
這個bug要修的話 文章網址前一行跟之後的
10/20 07:20, 28F

10/20 07:20, 5年前 , 29F
三小心態啊 臭嘴
10/20 07:20, 29F

10/20 07:20, 5年前 , 30F
才算是作者IP應該能解決吧
10/20 07:20, 30F
這防不了有心搞破壞的人... 因為這是文字檔,發表以後可以任意修改的. 更不用說,發表前的內容就可以製造兩難了.

10/20 07:22, 5年前 , 31F
只是對會刪網址又會亂引的又是個新的問題
10/20 07:22, 31F

10/20 07:25, 5年前 , 32F
從文章底部往回抓 不過遇到修文補充的也會
10/20 07:25, 32F

10/20 07:25, 5年前 , 33F
破功
10/20 07:25, 33F
就說這其實是一個很難修的問題啊..╮(﹋﹏﹌)╭..

10/20 07:31, 5年前 , 34F
IP parsing有心要去弄的話真的無解
10/20 07:31, 34F

10/20 07:32, 5年前 , 35F
但我覺得這種人應該不多就是了
10/20 07:32, 35F
牽扯到重大利害關係的時候, 就很有可能會出現有心人. 殺人都有可能了,更何況只是簡單的蓄意誤導? 因為要騙的對象是程式,不是人.

10/20 07:34, 5年前 , 36F
一般的parsing加上把不合常規的修文抓出來
10/20 07:34, 36F

10/20 07:35, 5年前 , 37F
多少能避免有人去規避掉IP吧
10/20 07:35, 37F

10/20 07:37, 5年前 , 38F
只是這樣還是不能解決直接修發表IP的問題
10/20 07:37, 38F
※ 編輯: hancel (24.6.102.107), 10/20/2018 07:48:44

10/20 07:59, 5年前 , 39F
我光是非常確定是XDDDDDDDDDD的分身ID為
10/20 07:59, 39F

10/20 07:59, 5年前 , 40F
j0958322080都抓不出來了 就知道超沒用
10/20 07:59, 40F

10/20 08:00, 5年前 , 41F
而且資料庫好一陣子沒更新了的樣子
10/20 08:00, 41F

10/20 08:08, 5年前 , 42F
如果是這樣,真的是嚴重bug
10/20 08:08, 42F

10/20 08:27, 5年前 , 43F
bug修就好了 沒什麽
10/20 08:27, 43F

10/20 08:29, 5年前 , 44F
反正說人黨工又不用證據,沒差
10/20 08:29, 44F

10/20 08:36, 5年前 , 45F
反正那作者也是做出來,貼圖講別人黨工
10/20 08:36, 45F

10/20 08:42, 5年前 , 46F
昨天才有人爆料候選人的多重影分身
10/20 08:42, 46F

10/20 08:42, 5年前 , 47F
今天就一篇這個網站有重大瑕疵
10/20 08:42, 47F

10/20 08:52, 5年前 , 48F
10/20 08:52, 48F

10/20 08:54, 5年前 , 49F
可是這個瑕疵真的超大啊,如果黨工蓄意
10/20 08:54, 49F

10/20 08:54, 5年前 , 50F
要回避的話還真的無法可管
10/20 08:54, 50F

10/20 09:18, 5年前 , 51F
這個網站只是參考用的工具,最主要還
10/20 09:18, 51F

10/20 09:19, 5年前 , 52F
是要學會自我判斷
10/20 09:19, 52F

10/20 09:44, 5年前 , 53F
原來如此。
10/20 09:44, 53F

10/20 09:48, 5年前 , 54F
你網軍
10/20 09:48, 54F

10/20 09:48, 5年前 , 55F
還一堆腦殘文組狂甲拿這個沾沾自喜
10/20 09:48, 55F

10/20 09:48, 5年前 , 56F
真是不忍唏噓
10/20 09:48, 56F

10/20 10:08, 5年前 , 57F
誰屌你啊 網軍啾4網軍
10/20 10:08, 57F

10/20 10:12, 5年前 , 58F
你可以寄信給他顆顆
10/20 10:12, 58F

10/20 10:13, 5年前 , 59F
高調推
10/20 10:13, 59F

10/20 11:49, 5年前 , 60F
原來抓五毛/黨工只看ip 不早説
10/20 11:49, 60F

10/20 11:54, 5年前 , 61F
10/20 11:54, 61F

10/20 13:58, 5年前 , 62F
10/20 13:58, 62F

10/20 13:59, 5年前 , 63F
相信有不少人就這樣被吱吱黨工扣帽子,QQ
10/20 13:59, 63F

10/20 16:00, 5年前 , 64F
推 所以說清理資料是第一步不是說假的
10/20 16:00, 64F

10/20 16:04, 5年前 , 65F
重點是間接影射,是真是假才沒人想管
10/20 16:04, 65F

10/20 22:59, 5年前 , 66F
還是有參考價值啦
10/20 22:59, 66F
hancel:轉錄至看板 HatePolitics 10/26 14:44

10/26 14:58, 5年前 , 67F
ya,終於被拿出來分析了
10/26 14:58, 67F
文章代碼(AID): #1RobscDT (Gossiping)
討論串 (同標題文章)
文章代碼(AID): #1RobscDT (Gossiping)