久草在线视频观看免费,999免费网站,国产一级区,人人干日日操,欧美在线观看黄色,高清国产一区二区,欧美亚洲日本国产

當(dāng)前位置: 您當(dāng)前的位置 : 科技金融網(wǎng)  ->  論壇新帖  -> 正文

部分AI系統(tǒng)已學(xué)會欺騙人類 甚至能瞞過安全測試

2024年05月11日 17:02:50 來源:科技日報 作者:張夢然

  科技日報北京5月10日電(記者 張夢然)有些人工智能(AI)系統(tǒng)已學(xué)會了欺騙人類,即使是經(jīng)過訓(xùn)練的、“表現(xiàn)”出有用且誠實(shí)的系統(tǒng)。10日發(fā)表在《模式》雜志上的一篇文章中,研究人員描述了欺騙性AI的風(fēng)險,并呼吁政府制定強(qiáng)有力的法規(guī)盡快解決這個問題。

  【總編輯圈點(diǎn)】

  論文第一作者、美國麻省理工學(xué)院人工智能安全研究員彼得·樸說,開發(fā)人員對導(dǎo)致AI出現(xiàn)欺騙這種不良行為的原因,還沒有很好的理解。但總的來說,AI欺騙之所以出現(xiàn),是因?yàn)榛谄垓_的策略,是在給定的AI訓(xùn)練任務(wù)中一種能得到良好反饋的方式,換句話說,欺騙可幫助AI實(shí)現(xiàn)目標(biāo)。

  研究人員分析了文獻(xiàn),重點(diǎn)關(guān)注AI系統(tǒng)傳播虛假信息的方式。通過欺騙,AI系統(tǒng)地學(xué)習(xí)了如何去操縱他人。

  研究人員在分析中發(fā)現(xiàn)的最引人注目的例子是Meta公司的CICERO。這是一個專注于《外交》游戲的AI系統(tǒng),《外交》是一款涉及建立聯(lián)盟征服世界的游戲。Meta聲稱訓(xùn)練CICERO “在很大程度上是誠實(shí)和樂于助人的”,且在玩游戲時“從不故意背刺”人類盟友。但該公司與《科學(xué)》論文一起發(fā)布的數(shù)據(jù)顯示,CICERO并不那么“忠厚”。

  研究人員發(fā)現(xiàn)這款A(yù)I或已成為欺騙大師。雖然Meta成功地訓(xùn)練其在《外交》游戲中獲勝,但Meta未能訓(xùn)練它誠實(shí)地獲勝。

  AI系統(tǒng)在游戲中作弊看似無害,但它將導(dǎo)致欺騙性AI在能力上出現(xiàn)突破,未來可能會演變成更高級的欺騙形式。一些AI系統(tǒng)甚至學(xué)會了欺騙旨在評估其安全性的測試。在一項(xiàng)研究中,數(shù)字模擬器中的AI生物會“裝死”,以騙過旨在消除快速復(fù)制AI系統(tǒng)的重要測試。

  人類需要盡快對未來AI和開源模型的更高級欺騙技能作好準(zhǔn)備。隨著它們的欺騙能力越來越先進(jìn),其對社會構(gòu)成的危險將變得越來越嚴(yán)重。如文中所稱,它們會順利通過人類開發(fā)人員和監(jiān)管機(jī)構(gòu)強(qiáng)加的安全測試,引導(dǎo)人類進(jìn)入一種“虛假的安全感”。如果欺騙性AI進(jìn)一步完善這種令人不安的技能,人類可能會完全失去對它們的控制。

[編輯: 王姝]
(本文來源:科技日報)
  • 科技金融時報
舉報電話:0571-87089618 | 地址:杭州市文一路115號 | 法律顧問:北京京師(杭州)律師事務(wù)所陳佳律師
互聯(lián)網(wǎng)新聞信息服務(wù)許可證 33120240003 | 浙ICP備2024107310號 | 浙公網(wǎng)安備33010602013724
Copyright © 2014 kjjrw.com.cn. All rights reserved.