一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

人工智能最重大的風險:數(shù)據(jù)出錯

8gVR_D1Net08 ? 來源:未知 ? 作者:鄧佳佳 ? 2018-04-04 10:49 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

糟糕的數(shù)據(jù)對于人工智能來說是個大問題,隨著企業(yè)越來越接受人工智能,風險只會越來越高。人工智能和機器學習有望徹底改變很多行業(yè),但它們也帶來了重大風險——鑒于該技術(shù)現(xiàn)在才剛剛開始得到大力實施,其中有很多風險尚待發(fā)現(xiàn)。

已經(jīng)有一些公共的,令人尷尬的人工智能變壞的例子。微軟的Tay由于遭到推特釣魚(Twitter troll)的破壞,在一天之內(nèi)從無辜的聊天機器人變成了一個瘋狂的種族主義者。兩年前,谷歌不得不審查“大猩猩”和“黑猩猩”這樣的關(guān)鍵詞的圖片搜索,因為它返回的結(jié)果是非洲裔美國人的照片——而這個問題仍未完全解決。

隨著企業(yè)越來越接受人工智能,風險只會越來越大。

西雅圖一家將人工智能應(yīng)用于醫(yī)療保健數(shù)據(jù)的公司KenSci的人工智能的負責人Ankur Teredesai說:“我們一覺醒來就冒汗。到最后,我們談?wù)撜鎸嵉牟∪?,真實的生活。?/p>

KenSci的人工智能平臺向醫(yī)生和保險公司提供醫(yī)療保健建議。如果醫(yī)療記錄或用于創(chuàng)建預測模型的訓練集中存在錯誤,后果可能是致命的,這種情況揭示了人工智能實施的關(guān)鍵風險因素:數(shù)據(jù)實踐的質(zhì)量。

人工智能的護欄壞掉了

KenSci處理來自世界各地的合作伙伴組織的數(shù)百萬患者記錄。這些信息是以不同的語言,標準和格式,并按照不同的分類方案組織起來的。

為了解決這個問題,KenSci使用本土和第三方工具,它還取決于合作伙伴的醫(yī)療保健機構(gòu)。

他說:“醫(yī)療保健系統(tǒng)投入了大量的精力來制定協(xié)議、確保合規(guī)性、確保他們的數(shù)據(jù)資產(chǎn)盡可能的干凈。五年或十年前,這是個大問題,今天,由于西方世界、亞洲和澳大利亞大部分地區(qū)數(shù)字化的成熟,編碼顯著減少,世界上很多地方已經(jīng)轉(zhuǎn)向標準化。”

為了減輕對人工智能的依賴所產(chǎn)生的風險,KenSci有三個額外的安全層。首先有防御錯誤的前線:提供護理的醫(yī)生。

Teredesai說:“我們不相信人工智能。我們相信輔助智能,我們把如何行動的決策交給醫(yī)生這樣訓練有素的專家來制定。”

他說,KenSci平臺只是提出建議,而在大多數(shù)情況下,這些建議甚至不適用于治療。他說:“我們的大部分工作都集中在成本預測、工作流分析和工作流程優(yōu)化上,很多時候,我們離臨床決策只有幾步之遙?!?/p>

該公司自己的醫(yī)療專家通過評估外部傳來的數(shù)據(jù)以及數(shù)據(jù)使用方式上的限制來提供第二道防線。例如,來自男性患者治療結(jié)果的數(shù)據(jù)可能不適用于女性。

他說:“我們有一個嚴格的程序來確保模型不被評分——如果底層的數(shù)據(jù)不正確,不足以使該模型得到評分——錯進錯出?!?/p>

最后,有外部的同行評審對KenSci模型的輸出結(jié)果,以及由平臺做出決策的因素進行評審。

他說:“我們的研究人員在人工智能運動的公平性和透明度方面處于最前沿。我們相信公開出刊物,相信模型正在對分發(fā)的參數(shù)做決策,以便專家不僅可以評估模型的輸出結(jié)果,還可以評估納入該評分體系的因素和分數(shù)。為了確保KenSci平臺是開放的、透明的、接受調(diào)查的,人們花了很多心思?!?/p>

KenSci的方法顯示了公司在進一步依賴人工智能時需要實施的各種流程。

一切關(guān)乎數(shù)據(jù)

以人工智能為基礎(chǔ)的網(wǎng)絡(luò)安全初創(chuàng)公司Jask的首席技術(shù)官JJ Guy說,人工智能的90%是數(shù)據(jù)物流。他說,所有主要的人工智能進展都受到數(shù)據(jù)集進步的推動。

他說:“算法簡單而有趣,因為它們是干凈、簡單和離散的問題。收集、分類和標記用于訓練算法的數(shù)據(jù)集是一份苦差事——尤其是足以反映真實世界的數(shù)據(jù)集?!?/p>

他說,以應(yīng)用提供逐向駕駛路線導航的程序為例。它們已經(jīng)存在了幾十年,但最近才變得好用——因為有了更好的數(shù)據(jù)。

他說:“谷歌資助了一個車隊,該車隊行駛在美國的每一條道路上并對道路進行數(shù)字化繪圖。車隊將這些數(shù)據(jù)與衛(wèi)星圖像和其它數(shù)據(jù)源結(jié)合起來,然后聘請一批人類監(jiān)護員手動改善表示世界各地建筑、交叉口和交通信號燈的數(shù)據(jù)。隨著人工智能應(yīng)用于更廣泛的問題,成功的方法將會就是那些認識到成功并不是來自算法而是來自數(shù)據(jù)整理(data wrangling)的方法?!?/p>

然而,公司在開始他們的人工智能項目之前往往沒有意識到良好的數(shù)據(jù)的重要性。

Forrester Research的分析師Michele Goetz表示:“大多數(shù)組織并不認為這是一個問題。當被問及人工智能預計會帶來什么挑戰(zhàn)時,擁有用于訓練人工智能的受到悉心監(jiān)護的數(shù)據(jù)集居然最不受重視?!?/p>

Forrester去年進行的一項調(diào)查顯示,只有17%的受訪者表示最大的挑戰(zhàn)在于沒有“受到悉心監(jiān)護的數(shù)據(jù)來訓練人工智能?!?/p>

她說:“但是,當公司開始進行人工智能項目時,這是從概念驗證和試點項目轉(zhuǎn)向生產(chǎn)系統(tǒng)的最大難題和障礙之一?!?/p>

451 Research的創(chuàng)始人兼研究副總裁Nick Patience說,最大的問題之一不是沒有足夠的數(shù)據(jù),而是數(shù)據(jù)被鎖藏并難以訪問。

他說:“如果你的數(shù)據(jù)完全孤立,機器學習就不會奏效。例如,如果你的財務(wù)數(shù)據(jù)在甲骨文(Oracle)中,人力資源(HR)數(shù)據(jù)在Workday中,合同在Documentum存儲庫中,并且你沒有做任何事情來嘗試創(chuàng)建這些孤島之間的連接?!?/p>

他說,公司還沒有準備好接受人工智能。

他說:“你不妨在每個孤島中使用標準的分析工具?!?/p>

數(shù)據(jù)問題可能會干擾人工智能

即使你有數(shù)據(jù),你仍然會遇到質(zhì)量問題,以及隱藏在訓練集中的偏見。

最近的幾項研究表明,用于訓練圖像識別的人工智能的流行數(shù)據(jù)集帶有性別偏見。例如,一張男性做飯的圖片會被誤認為是女性,因為在培訓數(shù)據(jù)中,廚師往往是女性。

SpringBoard.ai的首席執(zhí)行官Bruce Molloy說:“無論我們有什么偏見,要是存在各種歧視、種族或性別或年齡,那些東西都會反映在數(shù)據(jù)中?!?/p>

構(gòu)建人工智能系統(tǒng)的公司需要考慮分析數(shù)據(jù)的數(shù)據(jù)和算法是否符合組織的原則、目標和價值。

他說:“你不能將判斷、道德和價值外包給人工智能?!?/p>

他說,這可能來自幫助人們了解人工智能如何以自己的方式做出決定的分析工具,來自內(nèi)部或外部審計師,還是評估委員會。

合規(guī)性也是數(shù)據(jù)來源的一個問題——僅僅因為一個公司可以獲取信息,并不意味著它可以隨心所欲地使用信息。

IDC的認知和人工智能系統(tǒng)研究主管David Schubmehl說,組織已經(jīng)開始審計機器學習模型,并且研究進入這些模型的數(shù)據(jù)。

他說,獨立的審計公司也開始關(guān)注它。

他說:“我認為這將成為審計過程的一部分,但與其它任何東西一樣,這是一個新興領(lǐng)域。組織仍在試圖弄明白什么才是最佳實踐。”

他表示,在此之前,公司要謹慎行事。

他說:“我認為我們還處在這樣的初級階段——人工智能或機器學習模型還只是向受過培訓的專業(yè)人員提供建議和幫助,而不是自己完成工作。人工智能應(yīng)用程序要花更長的時間來創(chuàng)建,因為人們正試圖確保數(shù)據(jù)是正確的,數(shù)據(jù)得到合理的集成,并且他們擁有正確的數(shù)據(jù)類型和正確的數(shù)據(jù)集?!?/p>

普華永道公司的股東兼全球人工智能領(lǐng)導者Anand Rao表示,即使完全準確的數(shù)據(jù)也可能存在蓋然性的偏差。比如說,如果有一家位于中西部的保險公司利用歷史數(shù)據(jù)來訓練人工智能系統(tǒng),然后擴展到佛羅里達州,該系統(tǒng)對于預測颶風風險將不會有用。

他說:“歷史是有效的,數(shù)據(jù)是有效的。問題是,你在哪里使用這個模型,以及如何使用這個模型?”

假數(shù)據(jù)的崛起

這些內(nèi)在偏見可能難以發(fā)現(xiàn),但至少它們不涉及積極嘗試弄亂結(jié)果的數(shù)據(jù)源。以在社交媒體上傳播假新聞為例,這里的問題越來越嚴重。

Rao說:“這是一場軍備競賽?!?/p>

雖然社交媒體公司正在努力解決這個問題,但黑客正在使用自己的人工智能來創(chuàng)建聰明得足以騙過人類的人工智能,無論是影響社交媒體還是讓廣告商相信他們才是真正的消費者。

Lucidworks首席執(zhí)行官Will Hayes說:“我們已經(jīng)看到了影響??纯催x舉以及用機器人和其它操縱者放大消息的做法?!?/p>

那些操縱者也并不總是在俄羅斯或中國。

Hayes說:“如果一個品牌希望在社交媒體上增大影響力,營銷公司想要證明他們增加了你的曝光率,這根本就不必動用工程師來思考他們賴以操縱數(shù)據(jù)的方法。”

這就是領(lǐng)域知識和常識發(fā)揮作用的地方。

加里根萊曼集團(The Garrigan Lyman Group,該公司是一家營銷公司,幫助公司處理來自各種渠道的數(shù)據(jù))的首席技術(shù)官Chris Geiser說:“了解數(shù)學和模式只能讓你走到這一步了。你要了解所有的個人數(shù)據(jù)來源,這才是最重要的事情,你越了解自己的數(shù)據(jù),你想要達到的目標以及你的關(guān)鍵績效指標,你就越能指向正確的方向。”

對數(shù)據(jù)源進行三角測量

如果一家公司的數(shù)據(jù)有多個來源,那么在應(yīng)用任何機器學習之前,以一個數(shù)據(jù)來源為準檢查另一個數(shù)據(jù)來源,這是很重要。

作為全球最大的電信公司之一,NTT集團在其網(wǎng)絡(luò)基礎(chǔ)設(shè)施中生成了大量的數(shù)據(jù)。

NTT Security的安全研究全球副總裁Kenji Takahashi說:“我們處于安全目的而使用機器學習來分析網(wǎng)絡(luò)流量數(shù)據(jù)。我們的最終目標是全面了解隱藏在網(wǎng)絡(luò)中的惡意僵尸網(wǎng)絡(luò)基礎(chǔ)設(shè)施。”

該公司目前正在投資技術(shù),以提高機器學習培訓數(shù)據(jù)的質(zhì)量。為此,NTT使用“集成(ensemble)”方法,對來自不同來源的數(shù)據(jù)分析結(jié)果進行加權(quán)投票,他這樣說道。

然后,這些數(shù)據(jù)進入超大型數(shù)據(jù)庫,將其作為機器學習的訓練數(shù)據(jù)。

他說:“就像在教室里一樣,學習任何錯漏百出的劣質(zhì)課本都是非常不利的。訓練數(shù)據(jù)的質(zhì)量決定了機器學習系統(tǒng)的性能。”

創(chuàng)建團隊和工具來解決問題

Infosys于1月份發(fā)布的一項調(diào)查顯示,49%的IT決策者表示他們無法部署他們想要的人工智能,因為他們的數(shù)據(jù)還沒就緒。

Infosys的高級副總裁兼產(chǎn)品管理和戰(zhàn)略主管Sudhir Jha說:“人工智能正在成為商業(yè)戰(zhàn)略的核心,但數(shù)據(jù)管理仍然是一個揮之不去的障礙?!?/p>

在這里,領(lǐng)導力才能是關(guān)鍵,對于一些開展人工智能旅程的組織來說,第一步可能是任命一位首席數(shù)據(jù)官,SAP的Leonardo和人工智能部門的全球副總裁Marc Teerlink表示,擁有首席數(shù)據(jù)官的公司能更好地管理數(shù)據(jù)。

他說:“錯進錯出。數(shù)據(jù)質(zhì)量,所有權(quán)和治理都事關(guān)重大?!?/p>

普華永道的Rao說,如今的大多數(shù)公司都必須開發(fā)自己的技術(shù)來準備用于人工智能和機器學習系統(tǒng)的數(shù)據(jù)。為此,你需要數(shù)據(jù)科學家,如果你內(nèi)部不具備這樣的腦力,你可以聘請顧問來完成這項工作。

一些前瞻的公司,例如Bluestem Brands,正在使用人工智能來處理供其它人工智能系統(tǒng)使用的數(shù)據(jù)。這家擁有13個不同零售品牌(包括Fingerhut和Bedford Fair)的公司已采取這種方法來確保搜索黑色服裝的顧客能獲得所有相關(guān)結(jié)果——無論供應(yīng)商將這種顏色稱為“黑色”、“午夜”、“深海市蜃樓”或“深灰色(dark charcoal)”。

IT主管Jacob Wagner說:“藝術(shù)家有無限的創(chuàng)造力來指代同一個基本色彩的色差——它永無止境”。不僅僅是顏色。他說:“同樣的問題存在于人類解析和解釋的每個屬性上?!?/p>

Bluestem用唾手可得的碎片創(chuàng)建了數(shù)據(jù)準備系統(tǒng)。

Wagner說:“搜索技術(shù)在很大程度上正在商品化。詞法分析、文本匹配,所有這些技術(shù)已經(jīng)成為典范并得到了改善,開源算法與任何專有軟件包一樣高效?!?/p>

而且并不需要動用博士級別的數(shù)據(jù)科學家來做這種事。

他說:“有了一些才華橫溢的工程師,你可以想出將它接入數(shù)據(jù)流的方法?!?/p>

Wagner是Apache Spark的忠實粉絲,Apache Spark是一個大數(shù)據(jù)引擎,它可以從很多不同來源獲取數(shù)據(jù)并對其進行切割,Apache Solr是一個開源搜索引擎。Bluestem不僅在面向客戶的方面使用它,而且還在內(nèi)部使用它,以幫助編輯工作流(譯注:原文為editorial workflows,editorial可能是指iOS上的一款文本編輯神器,同時可用于制作工作流workflow)。

該公司還使用Lucidworks Fusion這樣的商業(yè)產(chǎn)品,后者允許商業(yè)用戶通過額外的業(yè)務(wù)邏輯來定制搜索體驗——比如說,可以將與情人節(jié)有關(guān)的查詢集中到一系列策略集中,而不需要IT人員參與。

有了正確的數(shù)據(jù)管理策略、工具和人員,你可以大大提高組織的人工智能獲得成功的可能性。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1806

    文章

    48984

    瀏覽量

    248895
  • 機器學習
    +關(guān)注

    關(guān)注

    66

    文章

    8500

    瀏覽量

    134503

原文標題:人工智能最大的風險因素:數(shù)據(jù)出錯

文章出處:【微信號:D1Net08,微信公眾號:AI人工智能D1net】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    【「具身智能機器人系統(tǒng)」閱讀體驗】+數(shù)據(jù)在具身人工智能中的價值

    嵌入式人工智能(EAI)將人工智能集成到機器人等物理實體中,使它們能夠感知、學習環(huán)境并與之動態(tài)交互。這種能力使此類機器人能夠在人類社會中有效地提供商品及服務(wù)。 數(shù)據(jù)是一種貨幣化工具 數(shù)據(jù)
    發(fā)表于 12-24 00:33

    人工智能應(yīng)用領(lǐng)域及未來展望

    計算能力的大幅提升、數(shù)據(jù)的爆炸式增長以及算法的不斷創(chuàng)新,人工智能迎來了爆發(fā)式的增長。從智能手機中的語音助手到自動駕駛汽車,從醫(yī)療診斷到金融風險評估,
    的頭像 發(fā)表于 12-07 11:29 ?1554次閱讀

    嵌入式和人工智能究竟是什么關(guān)系?

    應(yīng)用場景。例如,在智能家居領(lǐng)域,嵌入式系統(tǒng)可以控制各種智能設(shè)備,如智能燈泡、智能空調(diào)等,而人工智能則可以實現(xiàn)對這些設(shè)備的
    發(fā)表于 11-14 16:39

    人工智能云計算大數(shù)據(jù)三者關(guān)系

    人工智能、云計算與大數(shù)據(jù)之間的關(guān)系是緊密相連、相互促進的。大數(shù)據(jù)人工智能提供了豐富的訓練資源和驗證環(huán)境;云計算為大數(shù)據(jù)
    的頭像 發(fā)表于 11-06 10:03 ?991次閱讀

    Anthropic在人工智能領(lǐng)域取得重大突破

     10月23日消息,美國當?shù)貢r間周二,人工智能初創(chuàng)企業(yè)Anthropic宣布了一項重大進展。這家由前OpenAI高管創(chuàng)立并獲得亞馬遜支持的公司,在人工智能領(lǐng)域取得了新的突破,其研發(fā)的AI智能
    的頭像 發(fā)表于 10-23 14:56 ?972次閱讀

    《AI for Science:人工智能驅(qū)動科學創(chuàng)新》第6章人AI與能源科學讀后感

    、優(yōu)化等方面的應(yīng)用有了更清晰的認識。特別是書中提到的基于大數(shù)據(jù)和機器學習的能源管理系統(tǒng),通過實時監(jiān)測和分析能源數(shù)據(jù),實現(xiàn)了能源的高效利用和智能化管理。 其次,第6章通過多個案例展示了人工智能
    發(fā)表于 10-14 09:27

    AI for Science:人工智能驅(qū)動科學創(chuàng)新》第4章-AI與生命科學讀后感

    閱讀這一章后,我深感人工智能與生命科學的結(jié)合正引領(lǐng)著一場前所未有的科學革命,以下是我個人的讀后感: 1. 技術(shù)革新與生命科學進步 這一章詳細闡述了人工智能如何通過其強大的數(shù)據(jù)處理和分析能力,加速生命科學
    發(fā)表于 10-14 09:21

    《AI for Science:人工智能驅(qū)動科學創(chuàng)新》第一章人工智能驅(qū)動的科學創(chuàng)新學習心得

    人工智能:科學研究的加速器 第一章清晰地闡述了人工智能作為科學研究工具的強大功能。通過機器學習、深度學習等先進技術(shù),AI能夠處理和分析海量數(shù)據(jù),發(fā)現(xiàn)傳統(tǒng)方法難以捕捉的模式和規(guī)律。這不僅極大地提高了
    發(fā)表于 10-14 09:12

    risc-v在人工智能圖像處理應(yīng)用前景分析

    其在人工智能圖像處理領(lǐng)域的應(yīng)用提供更多支持。 標準化和規(guī)范化推進 :為了降低RISC-V的碎片化風險并促進其在全球范圍內(nèi)的廣泛應(yīng)用,標準化和規(guī)范化將是未來的重要趨勢。這將有助于提升RISC-V技術(shù)
    發(fā)表于 09-28 11:00

    人工智能ai 數(shù)電 模電 模擬集成電路原理 電路分析

    人工智能ai 數(shù)電 模電 模擬集成電路原理 電路分析 想問下哪些比較容易學 不過好像都是要學的
    發(fā)表于 09-26 15:24

    人工智能ai4s試讀申請

    目前人工智能在繪畫對話等大模型領(lǐng)域應(yīng)用廣闊,ai4s也是方興未艾。但是如何有效利用ai4s工具助力科研是個需要研究的課題,本書對ai4s基本原理和原則,方法進行描訴,有利于總結(jié)經(jīng)驗,擬按照要求準備相關(guān)體會材料??茨芊裼兄谌腴T和提高ss
    發(fā)表于 09-09 15:36

    名單公布!【書籍評測活動NO.44】AI for Science:人工智能驅(qū)動科學創(chuàng)新

    大力發(fā)展AI for Science的原因。 第2章從科學研究底層的理論模式與主要困境,以及人工智能三要素(數(shù)據(jù)、算法、算力)出發(fā),對AI for Science的技術(shù)支撐進行解讀。 第3章介紹了在
    發(fā)表于 09-09 13:54

    報名開啟!深圳(國際)通用人工智能大會將啟幕,國內(nèi)外大咖齊聚話AI

    8月28日至30日,2024深圳(國際)通用人工智能大會暨深圳(國際)通用人工智能產(chǎn)業(yè)博覽會將在深圳國際會展中心(寶安)舉辦。大會以“魅力AI·無限未來”為主題,致力于打造全球通用人工智能領(lǐng)域集產(chǎn)品
    發(fā)表于 08-22 15:00

    利用人工智能改變 PCB 設(shè)計

    人工智能在PCB設(shè)計中展現(xiàn)出不可否認的潛力,但是工程師們自然對其影響有所顧慮。關(guān)于工作保障和責任的等問題常常浮現(xiàn):人工智能會奪走我的工作嗎?如果人工智能出錯,我會被指責嗎?然而,
    的頭像 發(fā)表于 08-15 10:38 ?893次閱讀
    利用<b class='flag-5'>人工智能</b>改變 PCB 設(shè)計

    FPGA在人工智能中的應(yīng)用有哪些?

    FPGA(現(xiàn)場可編程門陣列)在人工智能領(lǐng)域的應(yīng)用非常廣泛,主要體現(xiàn)在以下幾個方面: 一、深度學習加速 訓練和推理過程加速:FPGA可以用來加速深度學習的訓練和推理過程。由于其高并行性和低延遲特性
    發(fā)表于 07-29 17:05