標注多跳問答(Multi-hop QA)數據集費時費力!本文首次研究了無監(jiān)督的多跳問答的可能性,提出了MQG-QA,一種無監(jiān)督的框架,從同構和異構數據源中自動生成多跳問答對。使用生成的數據預先訓練QA系統(tǒng)將大大減少對人工標注訓練數據的需求。
多跳問答(QA)訓練數據的獲取是非常耗時費力的。為了解決這個問題,我們探索了無監(jiān)督的多跳QA問答對生成的問題,可以在沒有標注的QA對場景下使用,非常的適合真實場景。
我們模型首先通過首先從每個數據源中選擇或生成相關信息,然后將多個信息整合起來,形成一個多跳問題。我們發(fā)現,用我們模型產生的訓練數據訓練出來的模型,性能和完全監(jiān)督模型之間的F1差距較小。這個現象是非常激動人心的,表明我們可以通過無監(jiān)督預的構造數據來大大減少對人工標注的訓練的需求。
下圖是該方法的簡易用法演示:
原文標題:【NAACL2021】初探無監(jiān)督的多跳問答對
文章出處:【微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。
責任編輯:haq
-
人工智能
+關注
關注
1804文章
48477瀏覽量
245196
原文標題:【NAACL2021】初探無監(jiān)督的多跳問答對
文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
大功率永磁無刷直流電機及其系統(tǒng)研究
AI如何對產品設計帶來更多的可能性?
ADS131A02從AIN1P采到的ADC值不準,請問有哪些可能性會造成這樣的影響?
高通探索收購英特爾芯片設計業(yè)務的可能性
新思科技探索AI+EDA的更多可能性
三星電子積極探討在越南設立半導體組裝工廠的可能性
蘋果積極探索為Apple Watch SE引入塑料表殼的可能性
【《大語言模型應用指南》閱讀體驗】+ 基礎知識學習
神經網絡如何用無監(jiān)督算法訓練
深度學習中的無監(jiān)督學習方法綜述
基于FPGA的類腦計算平臺 —PYNQ 集群的無監(jiān)督圖像識別類腦計算系統(tǒng)
藍牙Mesh模塊多跳大數據量高帶寬傳輸數據方法

評論