經(jīng)常會收到一些比較簡要的技術咨詢,描述了是什么任務,發(fā)現(xiàn)用BERT粗暴精調(diào)效果不好之后,問我有什么辦法可以提升。
在面對第一把梭就失敗時,我通常是這么判斷的:
- 如果效果差的很離譜,比如二分類準確率在60%以下,那大概率是模型有問題,開始用小數(shù)據(jù)集debug
- 如果有點效果,但一言難盡,那估計是數(shù)據(jù)有問題,要不然噪聲多,要不然是真的難,可以自己看一下訓練集,如果人看完后在幾秒內(nèi)都不能給出答案,就別太指望模型可以做好
在第一把效果還行的情況下,推薦嘗試以下策略:
- In-Domain Further Pre-train:利用同領域下的無監(jiān)督數(shù)據(jù)繼續(xù)MLM預訓練,這個方法我真的百試不厭,一般用一兩百萬的數(shù)據(jù)就能提升1-2個點
- Within-Task Further Pre-Training:利用不同領域的同任務數(shù)據(jù)預先精調(diào),選通用一些的一般也有提升
- Multi-Task Fine-Tuning:利用不同任務預先精調(diào)
- Layer-wise Decreasing Layer Rate:每層學到的知識都是不同的,前面幾層會更通用,所以學的時候可以用小一點的學習率,防止災難性遺忘
- Features from Different layers:把不同層的輸出集成起來,不過這個方法不一定有提升
- 長文本處理:截斷或使用層次化編碼
以上這些方法,都出自復旦邱錫鵬老師的《How to fine-tune BERT for text classification?》,該文進行了各種詳細的實驗,得出了不少有用的結論,推薦大家去學習。即使有的方法在論文數(shù)據(jù)集中表現(xiàn)一般,在自己的數(shù)據(jù)上也可以嘗試。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
-
數(shù)據(jù)集
+關注
關注
4文章
1223瀏覽量
25374 -
DEBUG
+關注
關注
3文章
94瀏覽量
20484 -
nlp
+關注
關注
1文章
490瀏覽量
22563
發(fā)布評論請先 登錄
相關推薦
熱點推薦
保持電容性負載穩(wěn)定的六種方法
本帖最后由 gk320830 于 2015-3-8 23:36 編輯
保持電容性負載穩(wěn)定的六種方法本系列的第10部分是我們所熟悉的《電氣工程》雜志(Electrical Engineering
發(fā)表于 09-25 09:31
linux下查看網(wǎng)卡流量的六種方法
本文介紹了linux下查看網(wǎng)卡流量的六種方法,linux系統(tǒng)中使用nload、iftop、iostat等工具查看網(wǎng)卡流量,需要的朋友參考下。
發(fā)表于 07-25 06:29
六種常見的伺服電機故障以及相對應的電機維修方法
論是哪種伺服電機,使用時間久了,都會產(chǎn)生一些小問題,那今天就給大家?guī)淼氖?b class='flag-5'>六種常見的電機故障表現(xiàn)。當伺服電機出現(xiàn)小問題,不僅要及時檢測出來,而且要找到產(chǎn)生這些故障的原因,伺服電機電機維修師才能對癥下藥,才可以修理好伺服電機。以下是六種常見的伺服電機故障以及相對應的電機維修
發(fā)表于 02-01 06:29
個人制作電路板的六種方法及操作步驟
本文主要介紹了個人制作電路板的六種方法及詳細操作步驟。根據(jù)電路原理圖中所用的元件形狀和印刷板面積的大小合理安排元件的密度和各元件的位置。確定元件位置應按照先大后小、先整體后局部的原則進行,使電路中相鄰元件就近放置,排列整齊均勻。
發(fā)表于 04-25 16:15
?7.2w次閱讀
PCB溶液濃度的六種計算方法
在PCB生產(chǎn)過程中,很多工序要用到各種溶液,往往這些溶液對PCB板的產(chǎn)品質(zhì)量起到?jīng)Q定性的作用。精確的計算好各種溶液的濃度才能確保各種溶液在工藝中起到它應有的作用。下面介紹六種計算方法。
手機NFC的六種實用用法
每當新機發(fā)布時,相信不少小伙伴除了會關注手機的性能、拍照、續(xù)航、價格之外,而且還會關注手機是否還帶NFC功能。隨著科技發(fā)展,現(xiàn)在手機里的NFC功能已經(jīng)多達六種了,接下來筆者就來告訴大家NFC究竟那六種實用的用法。
導致開關電源嘯叫的六種情況及解決方法
導致開關電源嘯叫的六種情況及解決方法(深圳市中遠通電源技術開發(fā)有限公司怎么樣)-導致開關電源嘯叫的六種情況及解決方法
發(fā)表于 09-24 17:14
?61次下載

關于機器學習的六種基礎算法來源、用途、演變
這六種算法分別是:線性回歸、邏輯回歸、梯度下降、神經(jīng)網(wǎng)絡、決策樹與k均值聚類算法。
發(fā)表于 11-04 10:18
?1201次閱讀
測電阻的六種方法 電阻測試方法 電阻好壞測量方法
測電阻的六種方法 電阻測試方法 電阻好壞測量方法 電阻是一種常見的電子元件,它的作用是限制電流的流動,從而保護電路以及電子元器件。在實際中,電阻由于長時間的使用或是外力的損壞,很容易失
抑制電磁干擾的六種常用方法
抑制電磁干擾的六種常用方法 電磁干擾(EMI)是現(xiàn)代電子設備中最常見的問題之一。隨著無線技術和電子設備的不斷發(fā)展,電磁干擾問題變得越來越普遍和嚴重。電磁干擾會影響到電子設備的性能,甚至可能導致設備
評論