一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

探索“What-If”場景通常意味著編寫一次性的自定義代碼來分析特定模型

Tensorflowers ? 來源:未知 ? 作者:李倩 ? 2018-10-11 11:31 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

構(gòu)建有效的機(jī)器學(xué)習(xí) (ML) 系統(tǒng)需要提出許多問題。僅僅訓(xùn)練一個(gè)模型,然后放任不管,是遠(yuǎn)遠(yuǎn)不夠的。而優(yōu)秀的開發(fā)者就像偵探一樣,總是不斷探索,試圖更好地理解自己的模型:數(shù)據(jù)點(diǎn)的變化對模型的預(yù)測結(jié)果有何影響?對于不同的群體,例如在歷史上被邊緣化的人群,模型的表現(xiàn)是否有所不同?用于測試模型的數(shù)據(jù)集的多樣化程度如何?要回答這些類型的問題并不容易。探索 “What-If” 場景通常意味著編寫一次性的自定義代碼來分析特定模型。此過程不僅效率低下,而且非編程人員很難參與塑造和改進(jìn) ML 模型的過程。Google AI PAIR 計(jì)劃的一個(gè)重點(diǎn)就是讓廣大用戶能夠更輕松地檢查、評估和調(diào)試 ML 系統(tǒng)。

我們發(fā)布了What-If 工具(https://pair-code.github.io/what-if-tool/),這是開源TensorBoard網(wǎng)絡(luò)應(yīng)用的一個(gè)新功能,可以讓用戶在無需編寫代碼的情況下分析 ML 模型。在給定 TensorFlow 模型和數(shù)據(jù)集指針的前提下,What-If 工具可為模型結(jié)果探索提供交互式可視界面。

What-If 工具:展示了一組面部圖片(共 250 張),以及微笑檢測模型得出的結(jié)果

What-If 工具擁有各種功能,包括使用Facets自動(dòng)可視化數(shù)據(jù)集、手動(dòng)編輯數(shù)據(jù)集示例并查看相關(guān)更改的影響,以及自動(dòng)生成局部依賴圖(顯示模型的預(yù)測結(jié)果如何隨任何單個(gè)功能的更改而變化)。下面詳細(xì)探索其中兩項(xiàng)功能。

探索數(shù)據(jù)點(diǎn)上的 What-If 場景

反事實(shí)

只需點(diǎn)擊一下按鈕,即可將某個(gè)數(shù)據(jù)點(diǎn)與模型預(yù)測不同結(jié)果的最相似點(diǎn)進(jìn)行比較。我們將這些點(diǎn)稱為 “反事實(shí)”,它們可以清楚顯示出模型的決策邊界。或者,您也可以手動(dòng)編輯一個(gè)數(shù)據(jù)點(diǎn),然后探索模型預(yù)測的變化情況。在下方的屏幕截圖中,我們將該工具用于二進(jìn)制分類模型。此模型根據(jù)UCI 人口普查數(shù)據(jù)集的公開人口普查數(shù)據(jù)來預(yù)測某個(gè)人的收入是否超過 5 萬美元。這是 ML 研究人員常用的基準(zhǔn)預(yù)測任務(wù),特別適用于分析算法公平性的情況,我們很快會談及這個(gè)話題。在這個(gè)案例中,對于選定的數(shù)據(jù)點(diǎn),模型預(yù)測此人收入超過 5 萬美元的置信度為 73%。該工具自動(dòng)找出數(shù)據(jù)集中與此最相似的人(模型預(yù)測其收入少于 5 萬美元),并將二者進(jìn)行并排比較。在此案例中,只需對年齡和職業(yè)作出微小的改變,模型的預(yù)測就會出現(xiàn)大幅變化。

反事實(shí)對比

表現(xiàn)和算法公平性分析

您也可以探索不同分類閾值的影響,并考慮不同數(shù)值公平性標(biāo)準(zhǔn)等限制條件。下方的屏幕截圖展示了微笑檢測模型的結(jié)果,該模型使用開源CelebA 數(shù)據(jù)集(由帶注解的名人面部圖像組成)進(jìn)行訓(xùn)練。在下圖中,我們根據(jù)頭發(fā)是否為棕色,將數(shù)據(jù)集中的面部圖像分成兩組,并為其中每組繪制一條ROC 曲線和預(yù)測結(jié)果的混淆矩陣,同時(shí)提供滑塊,設(shè)定模型必須在達(dá)到一定的置信度,才會判定是否為微笑的面部圖像。在此案例中,該工具自動(dòng)為兩組設(shè)置了置信度閾值,以優(yōu)化模型,從而實(shí)現(xiàn)機(jī)會均等。

比較兩組數(shù)據(jù)在微笑檢測模型上的表現(xiàn),并將其分類閾值設(shè)置為滿足 “機(jī)會均等” 限制條件

演示

為了說明 What-If 工具的功能,我們發(fā)布了一組使用預(yù)訓(xùn)練模型的演示:

檢測錯(cuò)誤分類:這是一種多分類模型,通過對植物花朵的四次測量來預(yù)測植物種類。該工具有助于顯示模型的決策邊界和導(dǎo)致錯(cuò)誤分類的原因。該模型使用UCI 鳶尾花數(shù)據(jù)集進(jìn)行訓(xùn)練。

評估二進(jìn)制分類模型的公平性:這是上文提及的微笑檢測圖像分類模型。該工具有助于評估不同子組的算法公平性。在訓(xùn)練模型的過程中,為了展示該工具如何幫助揭示模型中的此類偏見,我們特意沒有提供來自特定人群子集的任何示例。評估公平性需要謹(jǐn)慎考慮整體環(huán)境,但這是很有用的量化起點(diǎn)。

研究不同子組的模型表現(xiàn):這是根據(jù)人口普查信息預(yù)測對象年齡的回歸模型。該工具有助于展示模型在不同子組的相對表現(xiàn),以及不同特點(diǎn)如何分別影響預(yù)測結(jié)果。該模型使用UCI 人口普查數(shù)據(jù)集進(jìn)行訓(xùn)練。

What-If 的實(shí)際應(yīng)用

我們與 Google 內(nèi)部團(tuán)隊(duì)一起測試了 What-If 工具的表現(xiàn),從中看到這個(gè)工具的直接價(jià)值。有一個(gè)團(tuán)隊(duì)很快發(fā)現(xiàn),他們的模型錯(cuò)誤地忽略了數(shù)據(jù)集的一個(gè)整體特點(diǎn),進(jìn)而修復(fù)了之前并未發(fā)現(xiàn)的代碼錯(cuò)誤。另一個(gè)團(tuán)隊(duì)使用該工具將其示例按表現(xiàn)最佳到最差進(jìn)行直觀排列,進(jìn)而發(fā)現(xiàn)表現(xiàn)不佳的模型示例類型有何模式。我們希望 Google 內(nèi)部和外部的人士都能使用此工具,以更好地理解 ML 模型,并開始評估其公平性。此外,由于此代碼是開源的,我們歡迎大家為該工具的發(fā)展添磚加瓦。

致謝

What-If 是眾人合作的成果,其成功離不開 Mahima Pushkarna 設(shè)計(jì)的用戶體驗(yàn),Jimbo Wilson 對 Facets 作出的更新,還有許多其他人提供的意見。我們想感謝測試此工具并提供寶貴反饋的 Google 團(tuán)隊(duì),還要感謝 TensorBoard 團(tuán)隊(duì)的一切幫助。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:What-If 工具:無需寫代碼,即可測試機(jī)器學(xué)習(xí)模型

文章出處:【微信號:tensorflowers,微信公眾號:Tensorflowers】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    揭秘為什么Cloud TPU編寫自定義估算器模型?

    在本文中,我會逐步介紹編寫自定義估算器以便在 Cloud TPU 上運(yùn)行的全過程。
    的頭像 發(fā)表于 09-20 09:46 ?5293次閱讀

    HarmonyOS應(yīng)用自定義鍵盤解決方案

    增強(qiáng)用戶輸入的安全,避免敏感信息被截取或者泄露。本文介紹了自定義鍵盤的實(shí)現(xiàn),并結(jié)合自定義鍵盤和系統(tǒng)鍵盤的切換、自定義鍵盤的布局避讓等場景,
    的頭像 發(fā)表于 06-05 14:19 ?675次閱讀

    使用什么API編寫具有已知UUID兩者的自定義服務(wù)特性?

    和CyByLyIASStValueValueValuy()API。在我的例子中有個(gè)自定義服務(wù)和個(gè)特性(4字節(jié))問題1。應(yīng)該使用什么API編寫
    發(fā)表于 10-19 16:01

    zynq自定義ip中的時(shí)鐘頻率是多少?

    嗨,我正在使用zynq zc702,我設(shè)計(jì)了幾個(gè)自定義ip,它們用verilog模塊編寫,并且將駐留在PL部分,現(xiàn)在我的設(shè)計(jì)工作正常,ps和pl通信意味著即用自定義ip的arm完成..
    發(fā)表于 03-04 13:02

    我可以編寫自定義代碼控制沒有Motor Pilot的電機(jī)嗎?

    我得到了 MCSDK 示例,但我怎樣才能更進(jìn)步?我可以編寫自定義代碼控制沒有 Motor Pilot 的電機(jī)嗎?[STEVAL-SPIN
    發(fā)表于 12-22 07:31

    找到個(gè)文檔描述不同的錯(cuò)誤代碼對CAN FD模塊意味著什么?

    我試圖找到個(gè)文檔描述不同的錯(cuò)誤代碼對 CAN FD 模塊意味著什么。有沒有人知道從哪里搜索的鏈接或想法?我的 CAN FD 外設(shè)在某個(gè)時(shí)候以錯(cuò)誤狀態(tài) 516 告終,我無法找到它的含
    發(fā)表于 02-03 06:44

    STATCOM自定義建模及動(dòng)穩(wěn)態(tài)調(diào)壓分析

    STATCOM自定義建模及動(dòng)穩(wěn)態(tài)調(diào)壓分析:建立了statcom基于功率注入法的穩(wěn)態(tài)模型和基于受控電流源的動(dòng)態(tài)模型,并利用電力系統(tǒng)分析軟件提供
    發(fā)表于 03-18 16:09 ?18次下載

    SOPC中自定義外設(shè)和自定義指令性能分析

    SOPC中自定義外設(shè)和自定義指令性能分析 NiosII是個(gè)建立在FPGA上的嵌入式軟核處理器,靈活性很強(qiáng)。作為體現(xiàn)NiosII靈活性精髓的兩個(gè)最主要方面,自
    發(fā)表于 03-29 15:12 ?1716次閱讀
    SOPC中<b class='flag-5'>自定義</b>外設(shè)和<b class='flag-5'>自定義</b>指令性能<b class='flag-5'>分析</b>

    RTWconfigurationguide基于模型設(shè)計(jì)—自定義

    基于模型設(shè)計(jì)—自定義目標(biāo)系統(tǒng)配置指南,RTW自動(dòng)代碼生成相關(guān)資料。
    發(fā)表于 05-17 16:41 ?3次下載

    AVR編寫1602自定義字符

    AVR編寫自定義字符不錯(cuò)的練習(xí)題目
    發(fā)表于 03-20 14:21 ?1次下載

    iOS自定義轉(zhuǎn)場動(dòng)畫例程與需要注意的問題

    controller (出現(xiàn)的那個(gè)) 個(gè)動(dòng)畫控制器 自定義轉(zhuǎn)場和在自定義之前樣。對于push和pop,意味著調(diào)用UINavigatio
    發(fā)表于 09-26 16:41 ?0次下載
    iOS<b class='flag-5'>自定義</b>轉(zhuǎn)場動(dòng)畫例程與需要注意的問題

    淺析Zephyr應(yīng)用的代碼結(jié)構(gòu)中的自定義驅(qū)動(dòng)

    項(xiàng)目納入到應(yīng)用代碼目錄管理 Zephyr應(yīng)用的代碼結(jié)構(gòu)--自定義開發(fā)板: 將自定義board納入到應(yīng)用代碼目錄管理 除了上面兩個(gè)
    的頭像 發(fā)表于 08-18 09:08 ?5356次閱讀

    自定義視圖組件教程案例

    自定義組件 1.自定義組件-particles(粒子效果) 2.自定義組件- pulse(脈沖button效果) 3.自定義組件-progress(progress效果) 4.
    發(fā)表于 04-08 10:48 ?15次下載

    大型語言模型(LLM)的自定義訓(xùn)練:包含代碼示例的詳細(xì)指南

    近年來,像 GPT-4 這樣的大型語言模型 (LLM) 因其在自然語言理解和生成方面的驚人能力而受到廣泛關(guān)注。但是,要根據(jù)特定任務(wù)或領(lǐng)域定制LLM,定制培訓(xùn)是必要的。本文提供了有關(guān)自定義訓(xùn)練 LLM 的詳細(xì)分步指南,其中包含
    發(fā)表于 06-12 09:35 ?3437次閱讀

    自定義算子開發(fā)

    個(gè)完整的自定義算子應(yīng)用過程包括注冊算子、算子實(shí)現(xiàn)、含自定義算子模型轉(zhuǎn)換和運(yùn)行含自定義op模型
    的頭像 發(fā)表于 04-07 16:11 ?3378次閱讀
    <b class='flag-5'>自定義</b>算子開發(fā)