在AI大行其道的當下,算法、算力與數(shù)據(jù)這驅動AI崛起的三大因素,誰將成為檢驗其能否產(chǎn)業(yè)化的試金石?答案必然是數(shù)據(jù)。
眾所周知,深度學習作為當前AI技術的研究前沿,其成功與否背后直接與產(chǎn)品落地直接掛鉤。從學術角度來講,深度學習的原理是將標注的數(shù)據(jù)特征反向輸送給機器,以實現(xiàn)機器智能這一目標。然巧婦難為無米之炊,沒有AI數(shù)據(jù)便無法應用更復雜的模型,亦無法得出效果更優(yōu)的算法。
尤其隨著AI技術在行業(yè)內(nèi)的落地應用,原有通用AI數(shù)據(jù)集很難對算法準確率與魯棒性能力實現(xiàn)進步一提升,因此破局之道全部寄希望在了場景化的高質量AI數(shù)據(jù)之上。
數(shù)據(jù)難求?高質量AI數(shù)據(jù)更可遇不可求
回歸本質來看,以近年來炒得最熱的CV+AI為例,其不僅可實現(xiàn)人臉識別,也可應用于養(yǎng)殖領域。而這套模式之所以能在其他領域跑通,原理在于技術本身是有共性的,差異取決于所訓練的AI數(shù)據(jù)樣本。
在這其中算法僅是一小部分,核心依舊離不開AI數(shù)據(jù)。誰能夠擁有高質量的還原落地場景的AI數(shù)據(jù),誰便能快人一步實現(xiàn)產(chǎn)業(yè)化落地。
因此對于人工智能企業(yè)來說,優(yōu)質AI數(shù)據(jù)的必要性毋庸置疑。企業(yè)深知AI數(shù)據(jù)的真正價值已不在數(shù)據(jù)本身之上,而在于背后所反映出的真實性與科學性。但數(shù)據(jù)難求,高質量的AI數(shù)據(jù)更是可遇而不可求,也正是基于這樣一個背景,數(shù)據(jù)標注行業(yè)開始出現(xiàn)在視野中。
然目前來看,早期的數(shù)據(jù)標注發(fā)展仿佛讓人們看到了十年前IT外包行業(yè)的縮影。層層眾包與轉包的服務模式,致使數(shù)據(jù)交付精度層次不齊、數(shù)據(jù)隱私無法保障等現(xiàn)象頻發(fā),直接拉低了AI數(shù)據(jù)行業(yè)整體服務質量。
此外,過于依賴人力的標注方式,也讓各個環(huán)節(jié)暴露了大量弊端。如在語音轉寫類標注時,人類標注員很難在長時間下保持時刻專注。再比如機器視覺類項目中,一套項目至少涉及數(shù)以萬計的圖片標注工作,常會引發(fā)標注任務不夠細化、缺乏定制化標注能力等問題。而此時若投入大量人力,則又會產(chǎn)生極大成本負荷,外加中間商等各項因素的影響,久而久之讓行業(yè)進入了一個惡性循環(huán)當中。
云測數(shù)據(jù)服務成果發(fā)布?引領數(shù)據(jù)標注跨入高質量時代
反觀整個數(shù)據(jù)標注市場,雖有公開數(shù)據(jù)集、標注工具、以及半監(jiān)督學習一類技術的存在,但對于現(xiàn)階段AI產(chǎn)品面臨落地的產(chǎn)業(yè)環(huán)境,沒有高質量還原場景的AI數(shù)據(jù)的支撐,想要產(chǎn)業(yè)落地無疑是空中樓閣。
正如行業(yè)流行的那句話所言——“前面有多少智能?后面就有多少人工”。因此如何將人類經(jīng)驗與學習規(guī)則充分結合以獲取符合算法需求的高質量標注數(shù)據(jù),如何制定標準審核流程和控制標注質檢成本等問題,既是擋在AI產(chǎn)業(yè)化前方的攔路虎,也是擺在高質量AI數(shù)據(jù)獲取面前的難題。
為解決行業(yè)存在的現(xiàn)實問題,助力企業(yè)占領未來發(fā)展高地。在9月6日的北京服貿(mào)會上,Testin云測旗下AI數(shù)據(jù)服務品牌——云測數(shù)據(jù)的服務成果正式發(fā)布,并向外界展示了最高交付精準度達99.99%這一傲人成果。
區(qū)別于傳統(tǒng)模式,云測數(shù)據(jù)以自建形式搭建了數(shù)據(jù)場景實驗室與數(shù)據(jù)標注基地來對相應AI數(shù)據(jù)進行生產(chǎn)。以標準化服務為抓手,在前期幫助客戶梳理更貼合實際情況的需求,試標驗收合格后開始大規(guī)模作業(yè)。作業(yè)提交后,還有三層質檢環(huán)節(jié)和抽檢環(huán)節(jié)來確保AI數(shù)據(jù)的高質量輸出,并有項目經(jīng)理全程跟蹤數(shù)據(jù)交付的流程。通過這種服務模式來解決AI數(shù)據(jù)質量參差不齊這一詬病。
再者,過往數(shù)據(jù)標注人員常以單臺電腦部署軟件形式為主,這種工作模式基本毫無協(xié)同性可言,極大程度拖慢了人員效率與項目周期。而云測數(shù)據(jù)在AI數(shù)據(jù)生產(chǎn)中,設計了從創(chuàng)建任務、分配任務、標注流轉、到質檢/抽檢環(huán)節(jié)和最后的驗收等更完善的管理流程,每個環(huán)節(jié)有相應專業(yè)人員來把控數(shù)據(jù)標注的質量和時間節(jié)點,進行好上下游工作環(huán)節(jié)銜接,得以在保證質量的前提現(xiàn)下將效率最大化。
另一方面,與多數(shù)開源與在線標注工具相比,后者存在著極高的部署門檻與學習成本,如不同版本間的不同編譯與配置部署、標簽設置繁瑣、數(shù)據(jù)導出限制過多等問題。這對于技術驅動型的AI企業(yè)而言,將成為業(yè)務最致命的死穴。
而云測數(shù)據(jù)這套模式,全方位支持企業(yè)在文本、語音、圖像、視頻等各類AI數(shù)據(jù)處理需求,且已完成對智慧城市、智能家居、智能駕駛、智慧金融等不同行業(yè)的覆蓋。這種服務體驗,將企業(yè)精力重新聚焦在業(yè)務自身之上,從長遠來看也更符合當前降本增效的業(yè)務需求。
Testin云測總裁徐琨在采訪中指出:“為客戶降本增效,不斷為客戶創(chuàng)造價值,幫助客戶在這個充滿不確定性的時代,或保持優(yōu)勢,或突圍而出,依然是我們的初衷。”
此外,考慮到不同業(yè)務類型不同敏感級別的數(shù)據(jù)隱私需求,云測數(shù)據(jù)亦設置了一系列嚴格措施。其中一條核心原則就是數(shù)據(jù)絕不復用,當AI數(shù)據(jù)合格交付后絕不留底。其二便是所有與云測數(shù)據(jù)進行數(shù)據(jù)采集的用戶都會簽訂數(shù)據(jù)授權協(xié)議,從來源上確保企業(yè)用于訓練的AI數(shù)據(jù)合法合規(guī)。并通過內(nèi)部設定的數(shù)據(jù)隔離、質量保障等一系列數(shù)據(jù)安全流程和技術,從多個維度破解潛在的數(shù)據(jù)泄露風險。
高質量數(shù)據(jù)攻破AI行業(yè)天花板
復盤近年來AI發(fā)展,這個時代標志性技術,已然從學術界逐步走進了產(chǎn)業(yè)界中。雖然其催生出的大量新業(yè)態(tài)被看好,但真正能夠支撐落地的應用仍屬鳳毛麟角。
如近幾年炒的異常火熱的無人駕駛,之所以很難脫離測試道路,原因便在于機器對復雜道路的理解不盡人意,而究其根源依舊是高質量AI數(shù)據(jù)的稀缺。再如近期發(fā)表在《歐洲心臟雜志》上的一項AI看診新技術,之所以對其的描述仍為‘深度學習工具邁出的新一步’,問題本質仍出在精確度遠未達到推廣到臨床環(huán)境中所需水平方面。
不可置否,高質量AI數(shù)據(jù)已是AI能否實現(xiàn)產(chǎn)業(yè)化的關鍵。尤其在當前5G商用落地加速以及“新基建”的雙重帶動下,產(chǎn)業(yè)與經(jīng)濟結構的調(diào)整升級、新舊動能穩(wěn)步轉換推進已是大勢所趨。因此,云測數(shù)據(jù)最高交付精準度達99.99%的這一成果,必將成為AI產(chǎn)業(yè)打破自身天花板的一個全新變量。
正如Testin云測總裁徐琨所說:“效率的提升最終都是通過技術來實現(xiàn)的,新技術孕育著新機會。人工智能是劃時代的技術,我相信,在不久的未來,人工智能將成為像互聯(lián)網(wǎng)一樣的通用型技術,云測數(shù)據(jù)作為人工智能技術的AI數(shù)據(jù)服務提供商,將成為AI創(chuàng)新的土壤和支撐?!?br /> 責任編輯:pj
-
數(shù)據(jù)
+關注
關注
8文章
7256瀏覽量
91887 -
AI
+關注
關注
88文章
35164瀏覽量
280000 -
人工智能
+關注
關注
1807文章
49029瀏覽量
249562
發(fā)布評論請先 登錄
HarmonyOS5云服務技術分享--ArkTS開發(fā)Node環(huán)境
公有云服務器在大數(shù)據(jù)與AI時代的角色與機遇
租用國外云服務器算數(shù)據(jù)跨境嗎?
云儲存服務器與傳統(tǒng)存儲的區(qū)別 云儲存服務器數(shù)據(jù)恢復方法
Testin云測榮獲華為開發(fā)者聯(lián)盟生態(tài)市場服務商認證

AI數(shù)據(jù)服務在智能駕駛訓練中的應用實例
Testin云測中標銀聯(lián)數(shù)據(jù)服務有限公司一站式測試服務采購項目
云硬盤掛載到新服務器,怎么恢復數(shù)據(jù)?
Acrel-EIoT能源物聯(lián)網(wǎng)云平臺-遠程抄表提供能源物聯(lián)網(wǎng)數(shù)據(jù)服務

評論