一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機(jī)器學(xué)習(xí)中賦予了什么數(shù)學(xué)意義

姚小熊27 ? 來(lái)源:雷鋒網(wǎng) ? 作者:雷鋒網(wǎng) ? 2020-10-14 09:40 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

機(jī)器學(xué)習(xí)中的用于聲稱性能的指標(biāo)標(biāo)準(zhǔn)很少被討論。由于在這個(gè)問(wèn)題上似乎沒(méi)有一個(gè)明確的、廣泛的共識(shí),因此我認(rèn)為提供我一直在倡導(dǎo)并盡可能遵循的標(biāo)準(zhǔn)可能會(huì)很有趣。它源于這個(gè)簡(jiǎn)單的前提,這是我的科學(xué)老師從中學(xué)開(kāi)始就灌輸給我的:

科學(xué)報(bào)告的一般規(guī)則是,您寫(xiě)下的每個(gè)數(shù)字都應(yīng)為“真”的,因?yàn)椤罢妗钡亩x是什么。

讓我們來(lái)研究一下這對(duì)測(cè)試性能等統(tǒng)計(jì)量意味著什么。當(dāng)你在科學(xué)出版物中寫(xiě)下以下陳述時(shí):

測(cè)試準(zhǔn)確率為52.34%。你所表達(dá)的是,據(jù)你所知,你的模型在從測(cè)試分布中提取的未見(jiàn)數(shù)據(jù)上成功的概率在0.52335和0.52345之間。

這是一個(gè)非常強(qiáng)有力的聲明。

考慮你的測(cè)試集是從正確的測(cè)試分布中抽取的N個(gè)樣本IID組成的。成功率可以表示為一個(gè)二項(xiàng)式變量,其平均概率p由樣本平均值估計(jì):p?s/N

其標(biāo)準(zhǔn)差為:σ=√p(1-p)。

其中當(dāng)p=0.5時(shí),其上限為0.5。

在正態(tài)近似下,估計(jì)量的標(biāo)準(zhǔn)差為:δ=σ/√N(yùn)。

這個(gè)精度估計(jì)上的誤差δ是這樣的,在最壞的情況下,有約50%的精度:

換句話說(shuō),為了保證上述報(bào)告中例子52.34%的準(zhǔn)確率,你的測(cè)試集的大小至少應(yīng)該在30M樣本的數(shù)量級(jí)上!這種粗略的分析很容易轉(zhuǎn)化為除了準(zhǔn)確率以外的任何可計(jì)算的數(shù)量,盡管不能轉(zhuǎn)化為像似然率或困惑度這樣的連續(xù)數(shù)字。

下面是一些常見(jiàn)的機(jī)器學(xué)習(xí)數(shù)據(jù)集的說(shuō)明。

在ImageNet上可以合理地報(bào)告多少位數(shù)的精度?準(zhǔn)確率在80%左右,測(cè)試集是15萬(wàn)張圖片:

√(0.8*0.2/150000)=0.103%

這意味著你幾乎可以報(bào)告XX.X%的數(shù)字,而實(shí)際上每個(gè)人都是這樣做的。

MNIST呢,準(zhǔn)確率在99%:

√(0.99*0.01/10000)=0.099%

噗,也報(bào)個(gè)XX.X%就OK了!

然而,最值得注意的是,在大多數(shù)情況下,性能數(shù)據(jù)并不是單獨(dú)呈現(xiàn)的,而是用來(lái)比較同一測(cè)試集上的多種方法。在這種情況下,實(shí)驗(yàn)之間的抽樣方差會(huì)被抵消,即使在樣本量較小的情況下,它們之間的準(zhǔn)確度差異也可能在統(tǒng)計(jì)學(xué)上很顯著。估計(jì)圖方差的一個(gè)簡(jiǎn)單方法是執(zhí)行bootstrap重采樣。更嚴(yán)格、通常更嚴(yán)格的檢驗(yàn)包括進(jìn)行配對(duì)差異檢驗(yàn)或更普遍的方差分析。

報(bào)告超出其內(nèi)在精度的數(shù)字可能很具有極大的吸引力,因?yàn)樵谂c基線進(jìn)行比較的情況下,或者當(dāng)人們認(rèn)為測(cè)試集是一成不變的情況下,同時(shí)也不是從測(cè)試分布中抽取的樣本時(shí),性能數(shù)字往往更加重要。當(dāng)在生產(chǎn)中部署模型時(shí),這種做法會(huì)讓人感到驚訝,并且固定的測(cè)試集假設(shè)突然消失了,還有一些無(wú)關(guān)緊要的改進(jìn)。更普遍的是,這種做法會(huì)直接導(dǎo)致對(duì)測(cè)試集進(jìn)行過(guò)擬合。

那么,在我們的領(lǐng)域中數(shù)字為“真”意味著什么?好吧,這確實(shí)很復(fù)雜。對(duì)于工程師而言,很容易辯稱不應(yīng)該報(bào)告的尺寸超出公差。或者對(duì)于物理學(xué)家來(lái)說(shuō),物理量不應(yīng)超過(guò)測(cè)量誤差。對(duì)于機(jī)器學(xué)習(xí)從業(yè)者,我們不僅要應(yīng)對(duì)測(cè)試集的采樣不確定性,而且還要應(yīng)對(duì)獨(dú)立訓(xùn)練運(yùn)行,訓(xùn)練數(shù)據(jù)的不同初始化和改組下的模型不確定性。

按照這個(gè)標(biāo)準(zhǔn),在機(jī)器學(xué)習(xí)中很難確定哪些數(shù)字是“真”的。解決辦法當(dāng)然是盡可能地報(bào)告其置信區(qū)間。置信區(qū)間是一種更精細(xì)的報(bào)告不確定性的方式,可以考慮到所有隨機(jī)性的來(lái)源,以及除簡(jiǎn)單方差之外的顯著性檢驗(yàn)。它們的存在也向你的讀者發(fā)出信號(hào),表明你已經(jīng)考慮過(guò)你所報(bào)告的內(nèi)容的意義,而不僅僅是你的代碼所得到的數(shù)字。用置信區(qū)間表示的數(shù)字可能會(huì)被報(bào)告得超出其名義上的精度,不過(guò)要注意的是,你現(xiàn)在必須考慮用多少位數(shù)來(lái)報(bào)告不確定性,正如這篇博文所解釋的那樣。一路走來(lái)都是烏龜。

數(shù)字少了,雜亂無(wú)章的東西就少了,科學(xué)性就強(qiáng)了。

避免報(bào)告超出統(tǒng)計(jì)學(xué)意義的數(shù)字結(jié)果,除非你為它們提供一個(gè)明確的置信區(qū)間。這理所當(dāng)然地被認(rèn)為是科學(xué)上的不良行為,尤其是在沒(méi)有進(jìn)行配對(duì)顯著性測(cè)試的情況下,用來(lái)論證一個(gè)數(shù)字比另一個(gè)數(shù)字好的時(shí)候。僅憑這一點(diǎn)就經(jīng)常有論文被拒絕。一個(gè)良好的習(xí)慣是對(duì)報(bào)告中帶有大量數(shù)字的準(zhǔn)確率數(shù)字始終持懷疑態(tài)度。還記得3000萬(wàn)、30萬(wàn)和30萬(wàn)的經(jīng)驗(yàn)法則對(duì)最壞情況下作為“嗅覺(jué)測(cè)試”的統(tǒng)計(jì)顯著性所需樣本數(shù)量的限制嗎?它會(huì)讓你避免追逐統(tǒng)計(jì)上的“幽靈”。
責(zé)任編輯:YYX

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    FPGA在機(jī)器學(xué)習(xí)的具體應(yīng)用

    ,越來(lái)越多地被應(yīng)用于機(jī)器學(xué)習(xí)任務(wù)。本文將探討 FPGA 在機(jī)器學(xué)習(xí)的應(yīng)用,特別是在加速神經(jīng)網(wǎng)
    的頭像 發(fā)表于 07-16 15:34 ?394次閱讀

    LD Gen2 Lite激光雷達(dá):賦予機(jī)器人 “感知力” 的關(guān)鍵

    機(jī)器人的感知世界里,激光雷達(dá)宛如一雙敏銳的“慧眼”,賦予機(jī)器人“看”清周圍環(huán)境、自主決策的能力。亮道智能最新推出的純固態(tài)Flash短距激光雷達(dá)LD Gen2 Lite,憑借其獨(dú)特的技術(shù)優(yōu)勢(shì),在
    的頭像 發(fā)表于 04-25 10:42 ?216次閱讀

    嵌入式AI技術(shù)之深度學(xué)習(xí):數(shù)據(jù)樣本預(yù)處理過(guò)程中使用合適的特征變換對(duì)深度學(xué)習(xí)意義

    ? 作者:蘇勇Andrew 使用神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)機(jī)器學(xué)習(xí),網(wǎng)絡(luò)的每個(gè)層都將對(duì)輸入的數(shù)據(jù)做一次抽象,多層神經(jīng)網(wǎng)絡(luò)構(gòu)成深度學(xué)習(xí)的框架,可以深度理解數(shù)據(jù)中所要表示的規(guī)律。從原理上看,使用深度學(xué)習(xí)
    的頭像 發(fā)表于 04-02 18:21 ?888次閱讀

    數(shù)學(xué)專業(yè)轉(zhuǎn)人工智能方向:考研/就業(yè)前景分析及大學(xué)四年學(xué)習(xí)路徑全揭秘

    隨著AI技術(shù)的不斷進(jìn)步,專業(yè)人才的需求也日益增長(zhǎng)。數(shù)學(xué)作為AI的基石,為機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、數(shù)據(jù)分析等提供理論基礎(chǔ)和工具,因此越來(lái)越多的
    的頭像 發(fā)表于 02-07 11:14 ?1118次閱讀
    <b class='flag-5'>數(shù)學(xué)</b>專業(yè)轉(zhuǎn)人工智能方向:考研/就業(yè)前景分析及大學(xué)四年<b class='flag-5'>學(xué)習(xí)</b>路徑全揭秘

    傳統(tǒng)機(jī)器學(xué)習(xí)方法和應(yīng)用指導(dǎo)

    在上一篇文章,我們介紹機(jī)器學(xué)習(xí)的關(guān)鍵概念術(shù)語(yǔ)。在本文中,我們會(huì)介紹傳統(tǒng)機(jī)器學(xué)習(xí)的基礎(chǔ)知識(shí)和多
    的頭像 發(fā)表于 12-30 09:16 ?1191次閱讀
    傳統(tǒng)<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>方法和應(yīng)用指導(dǎo)

    如何選擇云原生機(jī)器學(xué)習(xí)平臺(tái)

    當(dāng)今,云原生機(jī)器學(xué)習(xí)平臺(tái)因其彈性擴(kuò)展、高效部署、低成本運(yùn)營(yíng)等優(yōu)勢(shì),逐漸成為企業(yè)構(gòu)建和部署機(jī)器學(xué)習(xí)應(yīng)用的首選。然而,市場(chǎng)上的云原生機(jī)器
    的頭像 發(fā)表于 12-25 11:54 ?457次閱讀

    zeta在機(jī)器學(xué)習(xí)的應(yīng)用 zeta的優(yōu)缺點(diǎn)分析

    在探討ZETA在機(jī)器學(xué)習(xí)的應(yīng)用以及ZETA的優(yōu)缺點(diǎn)時(shí),需要明確的是,ZETA一詞在不同領(lǐng)域可能有不同的含義和應(yīng)用。以下是根據(jù)不同領(lǐng)域的ZETA進(jìn)行的分析: 一、ZETA在機(jī)器
    的頭像 發(fā)表于 12-20 09:11 ?1127次閱讀

    cmp在機(jī)器學(xué)習(xí)的作用 如何使用cmp進(jìn)行數(shù)據(jù)對(duì)比

    機(jī)器學(xué)習(xí)領(lǐng)域,"cmp"這個(gè)術(shù)語(yǔ)可能并不是一個(gè)常見(jiàn)的術(shù)語(yǔ),它可能是指"比較"(comparison)的縮寫(xiě)。 比較在機(jī)器學(xué)習(xí)的作用 模型
    的頭像 發(fā)表于 12-17 09:35 ?883次閱讀

    傅立葉變換在機(jī)器學(xué)習(xí)的應(yīng)用 常見(jiàn)傅立葉變換的誤區(qū)解析

    傅里葉變換在機(jī)器學(xué)習(xí)的應(yīng)用 傅里葉變換是一種將信號(hào)分解為其組成頻率分量的數(shù)學(xué)運(yùn)算,它在機(jī)器學(xué)習(xí)
    的頭像 發(fā)表于 12-06 17:06 ?1068次閱讀

    什么是機(jī)器學(xué)習(xí)?通過(guò)機(jī)器學(xué)習(xí)方法能解決哪些問(wèn)題?

    計(jì)算機(jī)系統(tǒng)自身的性能”。事實(shí)上,由于“經(jīng)驗(yàn)”在計(jì)算機(jī)系統(tǒng)主要以數(shù)據(jù)的形式存在,因此機(jī)器學(xué)習(xí)需要設(shè)法對(duì)數(shù)據(jù)進(jìn)行分析學(xué)習(xí),這就使得它逐漸成為智能數(shù)據(jù)分析技術(shù)的創(chuàng)新源之一,
    的頭像 發(fā)表于 11-16 01:07 ?965次閱讀
    什么是<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>?通過(guò)<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>方法能解決哪些問(wèn)題?

    eda在機(jī)器學(xué)習(xí)的應(yīng)用

    機(jī)器學(xué)習(xí)項(xiàng)目中,數(shù)據(jù)預(yù)處理和理解是成功構(gòu)建模型的關(guān)鍵。探索性數(shù)據(jù)分析(EDA)是這一過(guò)程不可或缺的一部分。 1. 數(shù)據(jù)清洗 數(shù)據(jù)清洗 是機(jī)器學(xué)習(xí)
    的頭像 發(fā)表于 11-13 10:42 ?903次閱讀

    【「時(shí)間序列與機(jī)器學(xué)習(xí)」閱讀體驗(yàn)】時(shí)間序列的信息提取

    。 時(shí)間序列的單調(diào)性理論是數(shù)學(xué)求導(dǎo)。下面是使用EWMA分析股票價(jià)格變動(dòng),以決定買入還是賣出。通過(guò)仿真數(shù)據(jù),這種指數(shù)移動(dòng)平均的技術(shù)剔除了短期波動(dòng),有助看清股票整體趨勢(shì)。 通過(guò)對(duì)本章學(xué)習(xí),對(duì)時(shí)間序列的研究目的、方法與特征有較全
    發(fā)表于 08-17 21:12

    【「時(shí)間序列與機(jī)器學(xué)習(xí)」閱讀體驗(yàn)】+ 鳥(niǎo)瞰這本書(shū)

    清晰,從時(shí)間序列分析的基礎(chǔ)理論出發(fā),逐步深入到機(jī)器學(xué)習(xí)算法在時(shí)間序列預(yù)測(cè)的應(yīng)用,內(nèi)容全面,循序漸進(jìn)。每一章都經(jīng)過(guò)精心設(shè)計(jì),對(duì)理論知識(shí)進(jìn)行了詳細(xì)的闡述,對(duì)實(shí)際案例進(jìn)行了生動(dòng)的展示,使讀者在理論與實(shí)踐
    發(fā)表于 08-12 11:28

    【「時(shí)間序列與機(jī)器學(xué)習(xí)」閱讀體驗(yàn)】+ 簡(jiǎn)單建議

    這本書(shū)以其系統(tǒng)性的框架和深入淺出的講解,為讀者繪制一幅時(shí)間序列分析與機(jī)器學(xué)習(xí)融合應(yīng)用的宏偉藍(lán)圖。作者不僅扎實(shí)地構(gòu)建了時(shí)間序列分析的基礎(chǔ)知識(shí),更巧妙地展示
    發(fā)表于 08-12 11:21

    【《時(shí)間序列與機(jī)器學(xué)習(xí)》閱讀體驗(yàn)】+ 了解時(shí)間序列

    收到《時(shí)間序列與機(jī)器學(xué)習(xí)》一書(shū),彩色印刷,公式代碼清晰,非常精美。感謝作者,感謝電子發(fā)燒友提供一個(gè)讓我學(xué)習(xí)時(shí)間序列及應(yīng)用的機(jī)會(huì)! 前言第一段描述
    發(fā)表于 08-11 17:55