資料介紹
推特文本中包含著大量的非標(biāo)準(zhǔn)詞,這些非標(biāo)準(zhǔn)詞是由人們有意或無(wú)意而創(chuàng)造的。對(duì)很多自然語(yǔ)言處理的任務(wù)而言,預(yù)先對(duì)推特文本進(jìn)行規(guī)范化處理是很有必要的。針對(duì)已有的規(guī)范化系統(tǒng)性能較差的問(wèn)題,提出一種創(chuàng)新的無(wú)監(jiān)督文本規(guī)范化系統(tǒng)。首先,使用構(gòu)造的標(biāo)準(zhǔn)詞典來(lái)判斷當(dāng)前的推特是否需要標(biāo)準(zhǔn)化。然后,對(duì)推特中的非標(biāo)準(zhǔn)詞會(huì)根據(jù)其特征來(lái)考慮進(jìn)行一對(duì)一還是一對(duì)多規(guī)范化;對(duì)于需要一對(duì)多的非標(biāo)準(zhǔn)詞,通過(guò)前向和后向搜索算法,計(jì)算出所有可能的多詞組合。其次,對(duì)于多詞組合中的非規(guī)范化詞,基于二部圖隨機(jī)游走和誤拼檢查,來(lái)產(chǎn)生合適的候選。最后,使用基于上下文的語(yǔ)言模型來(lái)得到最合適的標(biāo)準(zhǔn)詞。所提算法在數(shù)據(jù)集上獲得86. 4qo的F值,超過(guò)當(dāng)前最好的基于圖的隨機(jī)游走算法10個(gè)百分點(diǎn)。
- 基于無(wú)監(jiān)督空間一致性約束的心臟MRI分割 38次下載
- 聯(lián)合多流行結(jié)構(gòu)和自表示的無(wú)監(jiān)督特征選擇方法 4次下載
- 一種興趣點(diǎn)分層學(xué)習(xí)的全監(jiān)督算法 5次下載
- 一種基于BERT模型的社交電商文本分類算法 8次下載
- 一種側(cè)重于學(xué)習(xí)情感特征的預(yù)訓(xùn)練方法 4次下載
- 一種基于DE和ELM的半監(jiān)督分類方法 5次下載
- 一種面向鐵路文本分類的字符級(jí)特征提取方法 10次下載
- 一種基于光滑表示的半監(jiān)督分類算法 17次下載
- 基于規(guī)范化函數(shù)的深度金字塔模型算法 14次下載
- 一種針對(duì)中英混合文本的多維度多情感分析方法 16次下載
- 一種基于神經(jīng)網(wǎng)絡(luò)的短文本分類模型 10次下載
- 數(shù)據(jù)庫(kù)-關(guān)系規(guī)范化的詳細(xì)資料介紹,為什么要對(duì)進(jìn)行關(guān)系的規(guī)范化? 5次下載
- 一種基于最優(yōu)路徑的物流管理與監(jiān)督系統(tǒng)設(shè)計(jì) 4次下載
- 一種基于PCA和RS的文本過(guò)濾方法
- 一種有效的文本圖像二值化方法
- 神經(jīng)網(wǎng)絡(luò)如何用無(wú)監(jiān)督算法訓(xùn)練 852次閱讀
- 淺談?dòng)布娐烽_(kāi)發(fā)流程規(guī)范 1371次閱讀
- 基于一種無(wú)OS的MCU實(shí)用軟件框架 724次閱讀
- 一種實(shí)用的嵌入式無(wú) OS 軟件框架 685次閱讀
- 分享一種嵌入式系統(tǒng)自動(dòng)化測(cè)試的詳細(xì)方案 2872次閱讀
- verilog語(yǔ)言編寫(xiě)規(guī)范 1229次閱讀
- 基于文本驅(qū)動(dòng)的三維模型風(fēng)格化方法 7258次閱讀
- 用于弱監(jiān)督大規(guī)模點(diǎn)云語(yǔ)義分割的混合對(duì)比正則化框架 1390次閱讀
- 一種新的無(wú)監(jiān)督時(shí)間序列異常檢測(cè)方法 2754次閱讀
- 一種漸薄型孔無(wú)銅是什么原因 4969次閱讀
- 淺析FPGA規(guī)范化的重要性 3247次閱讀
- 一種全新的無(wú)監(jiān)督機(jī)器翻譯方法,在BLUE基準(zhǔn)測(cè)試上取得了10分以上提升 6039次閱讀
- 無(wú)監(jiān)督訓(xùn)練加微小調(diào)整,只用一個(gè)模型即可解決多種NLP 6003次閱讀
- 采用無(wú)監(jiān)督學(xué)習(xí)的方法,用深度摘要網(wǎng)絡(luò)總結(jié)視頻 7179次閱讀
- 一種創(chuàng)新性DPD線性化電路特有的自適應(yīng)算法 2484次閱讀
下載排行
本周
- 1DC電源插座圖紙
- 0.67 MB | 2次下載 | 免費(fèi)
- 2AN158 GD32VW553 Wi-Fi開(kāi)發(fā)指南
- 1.51MB | 2次下載 | 免費(fèi)
- 3AN148 GD32VW553射頻硬件開(kāi)發(fā)指南
- 2.07MB | 1次下載 | 免費(fèi)
- 4AN111-LTC3219用戶指南
- 84.32KB | 次下載 | 免費(fèi)
- 5AN153-用于電源系統(tǒng)管理的Linduino
- 1.38MB | 次下載 | 免費(fèi)
- 6AN-283: Σ-Δ型ADC和DAC[中文版]
- 677.86KB | 次下載 | 免費(fèi)
- 7SM2018E 支持可控硅調(diào)光線性恒流控制芯片
- 402.24 KB | 次下載 | 免費(fèi)
- 8AN-1308: 電流檢測(cè)放大器共模階躍響應(yīng)
- 545.42KB | 次下載 | 免費(fèi)
本月
- 1ADI高性能電源管理解決方案
- 2.43 MB | 450次下載 | 免費(fèi)
- 2免費(fèi)開(kāi)源CC3D飛控資料(電路圖&PCB源文件、BOM、
- 5.67 MB | 138次下載 | 1 積分
- 3基于STM32單片機(jī)智能手環(huán)心率計(jì)步器體溫顯示設(shè)計(jì)
- 0.10 MB | 130次下載 | 免費(fèi)
- 4使用單片機(jī)實(shí)現(xiàn)七人表決器的程序和仿真資料免費(fèi)下載
- 2.96 MB | 44次下載 | 免費(fèi)
- 53314A函數(shù)發(fā)生器維修手冊(cè)
- 16.30 MB | 31次下載 | 免費(fèi)
- 6美的電磁爐維修手冊(cè)大全
- 1.56 MB | 24次下載 | 5 積分
- 7如何正確測(cè)試電源的紋波
- 0.36 MB | 17次下載 | 免費(fèi)
- 8感應(yīng)筆電路圖
- 0.06 MB | 10次下載 | 免費(fèi)
總榜
- 1matlab軟件下載入口
- 未知 | 935121次下載 | 10 積分
- 2開(kāi)源硬件-PMP21529.1-4 開(kāi)關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計(jì)
- 1.48MB | 420062次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233088次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191367次下載 | 10 積分
- 5十天學(xué)會(huì)AVR單片機(jī)與C語(yǔ)言視頻教程 下載
- 158M | 183335次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81581次下載 | 10 積分
- 7Keil工具M(jìn)DK-Arm免費(fèi)下載
- 0.02 MB | 73810次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65988次下載 | 10 積分
評(píng)論