世界數(shù)字技術(shù)院發(fā)布：生成式AI安全測試標準及大語言模型

4月17日公布，第27屆聯(lián)合國科技大會于4月15至19日在瑞士日內(nèi)瓦舉行，期間，世界數(shù)字技術(shù)院（WDTA）于4月16日發(fā)布了多項重要科研成果，包括《生成式人工智能應(yīng)用安全測試標準》與《大語言模型安全測試方法》兩款國際標準。

據(jù)悉，上述兩款標準主要針對大型模型與生成式AI應(yīng)用領(lǐng)域的安全檢測設(shè)定了新基準。參與制定工作的單位有OpenAI、螞蟻集團、科大訊飛、谷歌、微軟、英偉達、百度、騰訊等多家知名企業(yè)，其中，《大語言模型安全測試方法》由螞蟻集團主導(dǎo)完成。

這兩份標準為生成式AI應(yīng)用（特別是基于大語言模型的應(yīng)用）的安全性測試提供了明確的框架，涵蓋了基礎(chǔ)模型選取、嵌入和矢量數(shù)據(jù)庫、RAG或檢索增強生成、AI應(yīng)用運行時的安全等多個方面。

另一方面，《大語言模型安全測試方法》為大模型自身的安全性評估提供了全面、嚴謹且實用性強的解決方案，提出了大語言模型的安全風(fēng)險分類、攻擊分類分級方法以及測試方法。據(jù)稱，該方法能有效應(yīng)對大語言模型的復(fù)雜性，全面測試其防御敵對攻擊的能力，幫助開發(fā)者和組織識別并修復(fù)潛在漏洞，從而提升使用大語言模型構(gòu)建的人工智能系統(tǒng)的安全性與可靠性。

值得注意的是，WDTA是一個總部位于日內(nèi)瓦的國際非政府組織，遵循聯(lián)合國的指導(dǎo)原則，致力于推動全球數(shù)字技術(shù)發(fā)展和國際合作。AI STR（安全、可信、負責(zé)任）計劃是WDTA的核心倡議，旨在保障人工智能系統(tǒng)的安全性、可信性和責(zé)任感。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

人工智能

人工智能

+關(guān)注

關(guān)注
1806

文章
49011

瀏覽量
249364
語言模型

語言模型

+關(guān)注

關(guān)注
0

文章
561

瀏覽量
10787
OpenAI

OpenAI

+關(guān)注

關(guān)注
9

文章
1207

瀏覽量
8908

一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

搜索歷史

世界數(shù)字技術(shù)院發(fā)布：生成式AI安全測試標準及大語言模型

評論