介紹
人工智能 (AI) 領(lǐng)域準備進入一個新的領(lǐng)域——機器從補充人類用戶的工具轉(zhuǎn)變?yōu)樽灾?a href="http://www.www27dydycom.cn/v/" target="_blank">智能代理,可以設(shè)定自己的目標(biāo),決定學(xué)習(xí)什么,決定如何學(xué)習(xí),和更多。高度智能系統(tǒng)改變世界的潛力類似于以往工業(yè)革命帶來的變化。問題不是智能系統(tǒng)是否會繼續(xù)改變我們的生活;而是 問題是以什么方式和在什么程度上。
什么是人工智能安全工程?
AI Safety Engineering(或簡稱“AI Safety”)是一個擬議的 AI 開發(fā)框架,它將機器倫理學(xué)與心理學(xué)、經(jīng)濟學(xué)、金融學(xué)和其他領(lǐng)域相結(jié)合,以:
擴大對機器倫理的討論,以包括狹義的、一般的和超人的智能
將最近和正在進行的人工智能倫理討論與開發(fā)具有通用智能的機器的可用工程指南、流程和標(biāo)準聯(lián)系起來
針對智能系統(tǒng)中已知和潛在漏洞的來源
作為一個新興的研究領(lǐng)域,人工智能安全的出現(xiàn)有幾個原因。首先,人工智能的成功不僅僅以實現(xiàn)目標(biāo)來衡量;成功的人工智能是以符合人類價值觀和偏好的方式實現(xiàn)目標(biāo)的人工智能?;仡?60 多年的 AI 發(fā)展,我們可以看到機器目標(biāo)與人類價值觀和偏好之間的不一致遲早會導(dǎo)致 AI 失敗。正如本系列中所探討的那樣,將這種失調(diào)作為一個關(guān)鍵漏洞是開發(fā)安全人工智能的核心。
其次,人工智能的最新進展已經(jīng)開始達到人工狹義智能系統(tǒng)的邊界,這些系統(tǒng)在給定的上下文中執(zhí)行單一或狹義定義的任務(wù)。傳感器、大數(shù)據(jù)、處理,尤其是機器學(xué)習(xí)方面的進步使這些系統(tǒng)越來越像人類,并擴展了它們的能力和用途??紤]到這一點,達到人工智能的下一個層次——通用人工智能——即將到來,如果安全人工智能不是優(yōu)先考慮的潛在后果也是如此。
Safe AI 的核心是假設(shè)通用人工智能會給人類帶來風(fēng)險。AI Safety 不是通過嘗試在任務(wù)或目標(biāo)級別將人類價值觀和偏好傳授給機器來解決這個問題——這可能是不可能的壯舉——AI Safety 旨在:
以符合人類能力和/或
優(yōu)先考慮人類福利、合作行為和為人類服務(wù)
這樣做,我們將確保人工智能流程和目標(biāo)在宏觀層面尊重人類,而不是試圖在微觀層面實現(xiàn)同樣的目標(biāo)——讓機器傾向于對我們友好,作為智能核心的一部分。
作為一種工程開發(fā)理念,AI Safety 將 AI 系統(tǒng)設(shè)計視為產(chǎn)品設(shè)計,對產(chǎn)品責(zé)任的每個角度進行檢查和測試,包括使用、誤用和潛在漏洞。圖 1說明了 AI Safety 的新興原則和建議。
圖 1:AI 安全工程強調(diào)開發(fā)智能系統(tǒng),即使在遞歸自我改進的情況下也能證明它們是安全的。
在本系列中領(lǐng)先
AI 安全工程是一門新興學(xué)科,有很多需要研究、討論和編纂的內(nèi)容。貿(mào)澤電子很高興推出這個博客系列,讓 AI 工程師了解關(guān)鍵概念并鼓勵參與其持續(xù)開發(fā):
本系列的第 2 部分重點介紹了我們從過去 60 多年的 AI 開發(fā)中學(xué)到的經(jīng)驗,即 AI 失敗的原因是機器目標(biāo)與人類價值觀和偏好之間的不一致。它還討論了為什么將人類價值觀和偏好傳授給機器是一個無法解決的問題,并指出了安全人工智能的必要性。
第 3 部分討論了需要 AI 安全的另一個原因:AI 的進步正在突破人工狹義智能 (ANI) 系統(tǒng)的界限,并將人工智能 (AGI) 納入視野。
第 4 部分探討了實施 AI 安全的其他挑戰(zhàn):不可預(yù)測性、不可解釋性和不可理解性。
第 5 部分描述了 AI 安全將改變工程的方式。開發(fā)深入用戶價值核心的用例和檢查情報漏洞是這里的兩個關(guān)鍵主題。
第 6 部分以關(guān)于使用“人工愚蠢”來幫助我們開發(fā)安全人工智能的討論作為結(jié)尾。限制機器能力以及理解認知偏差是這里的關(guān)鍵主題。
審核編輯hhy
-
AI
+關(guān)注
關(guān)注
88文章
35168瀏覽量
280170 -
人工智能
+關(guān)注
關(guān)注
1807文章
49029瀏覽量
249681
發(fā)布評論請先 登錄
AI玩具充電管理IC,安全精準是核心
面向AI WAN的華為解決方案釋放算網(wǎng)潛能 使能差異化服務(wù)

AI端側(cè)部署開發(fā)(SC171開發(fā)套件V3)
首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手
在樹莓派上設(shè)置 DeepSeek R1:2025 年離線人工智能的未來

Banana Pi 發(fā)布 BPI-AI2N & BPI-AI2N Carrier,助力 AI 計算與嵌入式開發(fā)
《零基礎(chǔ)開發(fā)AI Agent——手把手教你用扣子做智能體》

《AI Agent應(yīng)用與項目實戰(zhàn)》閱讀體驗--跟著迪哥學(xué)Agent
NVIDIA 發(fā)布保障代理式 AI 應(yīng)用安全的 NIM 微服務(wù)
C2000?第2代至第3代MCU功能安全使能器遷移指南

AI即服務(wù)平臺的安全性分析
基于AI網(wǎng)關(guān)的智慧煤礦安全監(jiān)測應(yīng)用

AI引擎機器學(xué)習(xí)陣列指南

評論