通過界面和功能測試不能保證AI軟件的質量

近兩年人工智能發(fā)展迅猛，各種應用層出不窮，但其質量卻是良莠不齊。原因在于大部分測試童鞋還在用傳統的測試方式也就是通過界面和功能對人工智能軟件進行測試，但是AI軟件從開發(fā)到測試都很不同于傳統軟件，本文就以智能文本分類系統為例通過兩步來介紹為何傳統的測試方法不能保證AI軟件的質量。

一、第一步------------人工智能軟件測試的痛點

目標

掌握人工智能軟件測試面臨的現實痛點

步驟

1.智能文本分類系統是AI自然語言處理的一個基本應用，界面如下圖所示

通過界面和功能測試不能保證AI軟件的質量

2.對其測試時需要根據不同的輸入點擊獲取標簽得出所屬的類別以及所屬類別的概率值

3.通過功能和界面進行測試的話需要輸入各種可能輸入的文本，耗時巨大，并且也不太現實

4.從界面上對得到的score代表的概率值進行判斷無法得出一個客觀的評判，這個值多少合適判斷不了

5.因此傳統界面和功能測試完了判斷不了智能文本分類系統能否上線

二、第二步----------------AI軟件測試的正確方式

目標

掌握AI軟件測試的正確方式

步驟

1.了解AI軟件測試的本質

人工智能軟件是根據算法對大量的數據進行訓練找規(guī)律，最終得出一個模型來對新的數據進行預測，預測的時候會給出一個概率值。

2.AI軟件測試的正確方式

通過實現人工智能算法自帶的評測指標來進行AI軟件的測試可以很好的評估軟件的質量，完美解決窮舉各種輸入和概率值大小的現實問題

3.通過AI模型測試的具體評測指標

以智能文本分類為例，其采用了監(jiān)督示機器學習的分類算法，對應的評測指標有：

準確率、精確率、召回率

總結

本文通過智能文本分類系統面臨的測試難點來指出AI軟件測試過程中的通用難題。以此指出了通過功能和界面測試人工智能軟件不能保證AI軟件的質量，正確的方式應該是通過實現AI軟件算法自帶的評測進行進行測試

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規(guī)問題，請聯系本站處理。舉報投訴

AI

AI

+關注

關注
88

文章
35164

瀏覽量
280039
人工智能

人工智能

+關注

關注
1807

文章
49029

瀏覽量
249598

精選推薦
更多

文章

資料

帖子

AI通話的N種新玩法，讓科幻照進現實

腦極體
1天前

589 閱讀

三菱電機SiC DIPIPM在變頻家電中的應用（2）

三菱電機半導體
18小時前

520 閱讀

三菱電機SiC DIPIPM在變頻家電中的應用（1）

三菱電機半導體
18小時前

486 閱讀

英飛凌TLD7002-16 OTP PRG的常見問題解析

駿龍電子
18小時前

429 閱讀

DC/DC轉換器電路板安裝過程中的焊接技巧與導通檢查要點

駿龍電子
18小時前

518 閱讀

基于openharmony適配移植的回收器視圖教程

姚小熊27
0.17 MB

免費

1下載

基于Netty開發(fā)的SMQTT

石飛鵬
1.52 MB

免費

0下載

Go Vite通用的去中心化應用平臺

唯愛萌meng
2.83 MB

2積分

1下載

xsec-ip-database惡意IP和域名庫

王靜
0.06 MB

2積分

4下載

SmartBond? DA1470x 藍牙低功耗開發(fā)套件數據手冊

5.33 MB

免費

1下載

【VisionFive 2單板計算機試用體驗】3、開源大語言模型部署

左岸cpx
1天前

127 閱讀

【M-K1HSE開發(fā)板免費體驗】DevEco Studio應用開發(fā)體驗(物理機器運行失敗)

jf_1137202360
1天前

91 閱讀

【RA-Eco-RA6M4開發(fā)板評測】開箱、Hello World（串口+OLED）

jf_57061047
1天前

142 閱讀

省錢+環(huán)保+個性：打造一臺永不“過時”的自定義電腦！

早知
2天前

576 閱讀

【BPI-CanMV-K230D-Zero開發(fā)板體驗】+溫度大氣壓檢測及顯示

jinglixixi
2天前

730 閱讀

推薦專欄
更多

企業(yè)產品

資料

方案
更多

一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

搜索歷史

通過界面和功能測試不能保證AI軟件的質量

評論