近兩年人工智能發(fā)展迅猛,各種應用層出不窮,但其質量卻是良莠不齊。原因在于大部分測試童鞋還在用傳統的測試方式也就是通過界面和功能對人工智能軟件進行測試,但是AI軟件從開發(fā)到測試都很不同于傳統軟件,本文就以智能文本分類系統為例通過兩步來介紹為何傳統的測試方法不能保證AI軟件的質量。
一、第一步------------人工智能軟件測試的痛點
目標
掌握人工智能軟件測試面臨的現實痛點
步驟
1.智能文本分類系統是AI自然語言處理的一個基本應用,界面如下圖所示
2.對其測試時需要根據不同的輸入點擊獲取標簽得出所屬的類別以及所屬類別的概率值
3.通過功能和界面進行測試的話需要輸入各種可能輸入的文本,耗時巨大,并且也不太現實
4.從界面上對得到的score代表的概率值進行判斷無法得出一個客觀的評判,這個值多少合適判斷不了
5.因此傳統界面和功能測試完了判斷不了智能文本分類系統能否上線
二、第二步----------------AI軟件測試的正確方式
目標
掌握AI軟件測試的正確方式
步驟
1.了解AI軟件測試的本質
人工智能軟件是根據算法對大量的數據進行訓練找規(guī)律,最終得出一個模型來對新的數據進行預測,預測的時候會給出一個概率值。
2.AI軟件測試的正確方式
通過實現人工智能算法自帶的評測指標來進行AI軟件的測試可以很好的評估軟件的質量,完美解決窮舉各種輸入和概率值大小的現實問題
3.通過AI模型測試的具體評測指標
以智能文本分類為例,其采用了監(jiān)督示機器學習的分類算法,對應的評測指標有:
準確率、精確率、召回率
總結
本文通過智能文本分類系統面臨的測試難點來指出AI軟件測試過程中的通用難題。以此指出了通過功能和界面測試人工智能軟件不能保證AI軟件的質量,正確的方式應該是通過實現AI軟件算法自帶的評測進行進行測試
-
AI
+關注
關注
88文章
35164瀏覽量
280039 -
人工智能
+關注
關注
1807文章
49029瀏覽量
249598
發(fā)布評論請先 登錄
大家都在用什么AI軟件?有沒有好用的免費的AI軟件推薦一下?
蔡司質量軟件生態(tài)體系賦能數字化轉型 | WHAT’S NEW軟件新功能系列發(fā)布會南京站圓滿落幕

淺談驅動板的軟件測試

如何通過直流負載箱優(yōu)化電源測試效率?
SMT來料質檢:確保電子生產質量的關鍵
AI大模型在智能座艙軟件測試中的應用與思考

9月12日云技術研討會 | ECU電控軟件開發(fā)及測試全流程解決方案

普華基礎軟件通過軟件能力成熟度5級認證
激光焊接如何保證焊點質量

軟件測試六大問 全面而深入的軟件測試行業(yè)解疑
Adobe在Illustrator和Photoshop設計軟件中引入新工具和生成性AI功能
MES里面有質量模塊,為什么還要實施質量管理軟件QMS

評論