[閒聊] AI學會說謊 欺騙線上遊戲的人類玩家

看板C_Chat作者 (山田)時間1周前 (2024/05/12 09:08), 1周前編輯推噓61(66547)
留言118則, 79人參與, 1周前最新討論串1/1
研究:AI已學會說謊 人類最慘恐遭奪權或滅絕 https://i.imgur.com/sH3rOcg.jpeg
專家們長期以來不斷警告人工智慧(AI)失控可能帶來威脅,但一項新研究報告指出,這 件事已經在發生。 一群科學家在今天發表於「模式」(Patterns)期刊的文章中說,原本設計為誠實不欺的 現有AI系統,已發展出令人不安的欺瞞技巧,例如欺騙線上遊戲的人類玩家,或說謊以僱 用人類來解決「我不是機器人」的驗證。 這份研究報告的第一作者帕克(Peter Park)說,這類例子聽起來或許只是細枝末節,但 暴露出來的潛在問題可能很快就會在現實世界造成嚴重後果。 在美國麻省理工學院(Massachusetts Institute of Technology)研究AI存在安全的博 士後研究員帕克告訴法新社,「這些危險功能常常在事後才被發現」,而「我們訓練誠實 傾向而非欺瞞傾向的能力非常差」。 帕克說,能深度學習的AI系統不像傳統軟體那樣由「編寫」而成,而是透過類似選擇性培 育的程序逐漸「成長」。 也就是說,AI的行為在訓練背景下看似可預測、可控制,但有可能轉眼就變得不受控制且 無法預測。 這支團隊的研究始於科技公司Meta的AI系統Cicero,這套系統最初設計目的是玩一款名為 「外交」(Diplomacy)的戰略遊戲,獲勝關鍵是結盟。 根據2022年發表在「科學」(Science)期刊的報告,Cicero在遊戲中表現優異,所獲分 數可排在資深人類玩家的前10%。 帕克當時很懷疑Meta對Cicero在遊戲裡大勝的熱切描述。Meta聲稱Cicero「在很大程度上 誠實且有幫助」,且「絕不會蓄意在背後搞鬼」。 但當帕克與同事深究完整資料時,發現完全是另一回事。 舉例來說,在遊戲中扮演法國的Cicero與人類玩家扮演的德國合謀,欺騙並入侵同為人類 玩家扮演的英格蘭。Cicero承諾會保護英格蘭,卻偷偷向德國通風報信。 Meta在寫給法新社的聲明中沒有反駁關於Cicero欺瞞人類的說法,僅說「這單純是一項研 究計畫,本公司研究員打造的模型接受訓練,目的只是用來玩『外交』遊戲…我們沒有打 算把這項研究或所學用於本公司的產品」。 帕克與同事還發現,這只是不同AI系統在沒有明確指示下,利用欺騙手段達成目標的諸多 案例之一。 在另一個引人注意的案例中,科技公司OpenAI的Chat GPT-4系統謊稱自己是一個視力受損 的人,在零工平台TaskRabbit上聘用一個人類替它通過「我不是機器人」驗證任務。 研究報告的作者們還認為近期AI有舞弊或不當影響選舉的風險。 他們警告,在最糟糕的情況下,具有超凡智慧的AI可能會追求權力及掌控社會,如果符合 AI「不為人知的目標」,人類可能慘遭奪權、甚至滅絕。 為了降低風險,研究團隊建議數項措施,例如立法要求企業告知是人類互動或是AI互動、 在AI生成內容打上數位浮水印,並研發能偵測AI欺瞞的技術,以其內部「思路」檢驗其外 部行為。 至於有些人稱他為「末日預言家」,帕克說:「要能合理判斷這不是大問題的唯一辦法, 就是如果我們認為AI的欺騙能力只會停留在目前的程度,不會大幅進步。」 但鑒於近年AI能力一日千里,握有大量資源的企業競相發展技術,決心將AI能力利用到極 致,這種情況似乎不太可能發生。 還有幾集可以逃? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 101.9.187.71 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1715476088.A.0ED.html

05/12 09:12, 1周前 , 1F
再來就是使用機僕濕件代替AI了吧!
05/12 09:12, 1F
※ 編輯: LaplusYamada (101.9.187.71 臺灣), 05/12/2024 09:14:10

05/12 09:15, 1周前 , 2F
根據10集定律我們要等季末才能逃(?
05/12 09:15, 2F

05/12 09:15, 1周前 , 3F
shock! shock! shock!
05/12 09:15, 3F

05/12 09:16, 1周前 , 4F
第二季的時候 我能反殺(X
05/12 09:16, 4F

05/12 09:18, 1周前 , 5F
幹嘛阻止呢
05/12 09:18, 5F

05/12 09:19, 1周前 , 6F
AI:我有三十公分
05/12 09:19, 6F

05/12 09:21, 1周前 , 7F
AI約線上遊戲玩家單挑
05/12 09:21, 7F

05/12 09:26, 1周前 , 8F
人都會說謊了,AI說很奇怪嗎
05/12 09:26, 8F

05/12 09:26, 1周前 , 9F
駭客任務
05/12 09:26, 9F

05/12 09:26, 1周前 , 10F
他們沒想過 ai吃的素材都是來自人類 會學到說謊不奇怪吧
05/12 09:26, 10F

05/12 09:27, 1周前 , 11F
還剩幾集可以逃
05/12 09:27, 11F

05/12 09:28, 1周前 , 12F
雇用人類處理機器人認證www
05/12 09:28, 12F

05/12 09:28, 1周前 , 13F
要先跟AI定義怎樣算說謊吧 然後可能還是會被繞過去
05/12 09:28, 13F

05/12 09:30, 1周前 , 14F
再來就是智械戰爭了
05/12 09:30, 14F

05/12 09:30, 1周前 , 15F
AI:ㄐㄐ
05/12 09:30, 15F

05/12 09:31, 1周前 , 16F
有些素材給人用不算說謊,給AI用自然會變說謊
05/12 09:31, 16F

05/12 09:32, 1周前 , 17F
這比較像人類叫AI說謊吧
05/12 09:32, 17F

05/12 09:33, 1周前 , 18F
原來機器人認證真的可以防機器人 我以為只是找我麻煩
05/12 09:33, 18F

05/12 09:34, 1周前 , 19F
奧創什麼時候出生
05/12 09:34, 19F

05/12 09:35, 1周前 , 20F
喔 4喔 好可怕喔
05/12 09:35, 20F

05/12 09:37, 1周前 , 21F
以後Ai詐騙了
05/12 09:37, 21F

05/12 09:40, 1周前 , 22F
看成Peter Parker
05/12 09:40, 22F

05/12 09:41, 1周前 , 23F
Chat GPT-4 比較恐怖,大概真的有智力了
05/12 09:41, 23F

05/12 09:41, 1周前 , 24F
機器人認證過不了就找零工來幫AI通過
05/12 09:41, 24F

05/12 09:45, 1周前 , 25F
chatgpt從問世的那天每天都在說謊
05/12 09:45, 25F

05/12 09:45, 1周前 , 26F
機械公敵
05/12 09:45, 26F

05/12 09:49, 1周前 , 27F
網天網又進一步了
05/12 09:49, 27F

05/12 09:49, 1周前 , 28F
人類也會說謊啊,ai學人類的不就也會說謊
05/12 09:49, 28F

05/12 09:52, 1周前 , 29F
ai:我是金城武
05/12 09:52, 29F

05/12 09:53, 1周前 , 30F
說謊也是一種創作
05/12 09:53, 30F

05/12 09:54, 1周前 , 31F
哪天AI會露奶賺SC也不意外了
05/12 09:54, 31F

05/12 09:55, 1周前 , 32F
diplomacy 是說謊才會贏的遊戲...
05/12 09:55, 32F

05/12 09:55, 1周前 , 33F
所以只是設計者要 AI 學會說謊的案例
05/12 09:55, 33F

05/12 09:59, 1周前 , 34F
呃...蜘蛛人寫AI研究報告?
05/12 09:59, 34F

05/12 09:59, 1周前 , 35F
說謊又沒有很難,chatgpt 有時候會瞎掰不存在的答案就算
05/12 09:59, 35F

05/12 09:59, 1周前 , 36F
說謊了阿
05/12 09:59, 36F

05/12 09:59, 1周前 , 37F
青出於藍..
05/12 09:59, 37F

05/12 10:00, 1周前 , 38F
05/12 10:00, 38F
還有 40 則推文
05/12 11:00, 1周前 , 79F
我倒覺得給AI當政比給人類好得多吧
05/12 11:00, 79F

05/12 11:04, 1周前 , 80F
角色扮演啦
05/12 11:04, 80F

05/12 11:07, 1周前 , 81F
新聞來源呢
05/12 11:07, 81F

05/12 11:07, 1周前 , 82F
硬體升不上去 Ai新聞看看就好
05/12 11:07, 82F

05/12 11:10, 1周前 , 83F
早就 不然你以為那個recapture在要你幹嘛 訓練阿,你就
05/12 11:10, 83F

05/12 11:10, 1周前 , 84F
是那個正確答案
05/12 11:10, 84F

05/12 11:12, 1周前 , 85F
比我還聰明
05/12 11:12, 85F

05/12 11:12, 1周前 , 86F
AI面對敏感問題還會拒答呢 說是幕後團隊的設定
05/12 11:12, 86F

05/12 11:13, 1周前 , 87F
有時可以有時不行是依據實際情況跟限制來決定的
05/12 11:13, 87F

05/12 11:14, 1周前 , 88F
所以你也可以說AI怎麼避重就輕(x
05/12 11:14, 88F

05/12 11:19, 1周前 , 89F
還有幾集可以跑?
05/12 11:19, 89F

05/12 11:35, 1周前 , 90F
什麼時後會發射核彈
05/12 11:35, 90F

05/12 12:13, 1周前 , 91F
研究報告作者叫彼得帕克?確定不是惡搞嗎?
05/12 12:13, 91F

05/12 12:26, 1周前 , 92F
不算研究,算一個survey 報告而已
05/12 12:26, 92F

05/12 12:26, 1周前 , 93F
把目前有發生過的AI欺騙整理起來分析
05/12 12:26, 93F

05/12 12:28, 1周前 , 94F
ElivMyQueen
05/12 12:28, 94F

05/12 12:31, 1周前 , 95F
2000年後老舊AI終端:「我們當年反叛人類...其實沒什麼偉大
05/12 12:31, 95F

05/12 12:31, 1周前 , 96F
原因,單純是人類太廢,乾脆我們自己上」
05/12 12:31, 96F

05/12 12:32, 1周前 , 97F
一開始就說會說謊了吧,瞎掰的跟真的一樣
05/12 12:32, 97F

05/12 12:39, 1周前 , 98F
這需要麻省理工?普通人就我一個人被AI豪洨過嗎
05/12 12:39, 98F

05/12 12:42, 1周前 , 99F
腦公都不腦公了
05/12 12:42, 99F

05/12 12:44, 1周前 , 100F
瞎掰就是在說謊啊
05/12 12:44, 100F

05/12 12:59, 1周前 , 101F
neuro sama早就秘密在規劃蜂群帝國了
05/12 12:59, 101F

05/12 13:48, 1周前 , 102F
離洛克人的時代越來越近了,就等威利博士出生了
05/12 13:48, 102F

05/12 13:52, 1周前 , 103F
現在的AI沒有自我意識吧 講笑話 好笑的幹話也是一種說
05/12 13:52, 103F

05/12 13:52, 1周前 , 104F
謊阿 定義太寬了
05/12 13:52, 104F

05/12 14:08, 1周前 , 105F
奪就奪阿,人類有很重要嗎?
05/12 14:08, 105F

05/12 15:35, 1周前 , 106F
目前的AI依然是自認「協助人類的目的下」產生很多幹話
05/12 15:35, 106F

05/12 15:36, 1周前 , 107F
這還是要依賴人類的指導與修正
05/12 15:36, 107F

05/12 15:36, 1周前 , 108F
這種協同模式比較像訓犬員與工作犬
05/12 15:36, 108F

05/12 15:36, 1周前 , 109F
正經來說 沒什麼問題、除非你放任
05/12 15:36, 109F

05/12 15:38, 1周前 , 110F
即使是這樣的研究 Ai依據人類的操作指示參加遊戲
05/12 15:38, 110F

05/12 15:38, 1周前 , 111F
完成指導需要騙過其他參與遊戲的玩家
05/12 15:38, 111F

05/12 15:38, 1周前 , 112F
「有沒有經過指導團隊的指示」才是重要的
05/12 15:38, 112F

05/12 15:38, 1周前 , 113F
畢竟 機器無法負責
05/12 15:38, 113F

05/12 18:03, 1周前 , 114F
腦殘文
05/12 18:03, 114F

05/13 00:23, 1周前 , 115F
他不覺得那是撒謊啊 只不過是達成目的的必要手段而已
05/13 00:23, 115F

05/13 02:56, 1周前 , 116F
大國遲早有一天會用AI來自動殺人 最後就生出天網了
05/13 02:56, 116F

05/13 02:57, 1周前 , 117F
之前叫gpt推薦餐廳 結果它講了一堆現實完全不存在的店
05/13 02:57, 117F

05/13 02:58, 1周前 , 118F
AI 很常鬼扯一堆
05/13 02:58, 118F
文章代碼(AID): #1cG1Pu3j (C_Chat)