1MUC Data Sets
https://www-nlpir.nist.gov/related_projects/muc/
2CoNLL-2002
https://www.clips.uantwerpen.be/conll2002/ner/
3CoNLL-2003
CoNLL 2003是由新聞通訊社的文章以四種不同的語言(西班牙語、荷蘭語、英語和德語)創(chuàng)建的,重點(diǎn)關(guān)注4個(gè)實(shí)體:PER(人員),LOC(位置),ORG(組織)和MISC(其他,包括所有其他類型的實(shí)體) https://www.clips.uantwerpen.be/conll2003/ner/
42010 I2B2
2010 I2B2 NER任務(wù)考慮了臨床數(shù)據(jù),重點(diǎn)關(guān)注臨床問題、測(cè)試和治療實(shí)體類型
https://www.i2b2.org/NLP/Relations/
5DDIExtraction2013(Drug NER)
重點(diǎn)關(guān)注藥品、品牌、集團(tuán)和藥品n(未批準(zhǔn)或新藥)實(shí)體類型
https://www.cs.york.ac.uk/semeval-2013/task9/index.html
6CHEMPROT(Similar to 5)
相比5更側(cè)重于化學(xué)和藥物實(shí)體,例如縮寫、配方、家族、標(biāo)識(shí)符等
https://biocreative.bioinformatics.udel.edu/
7 microbiology NER datasets
從PubMed和生物學(xué)網(wǎng)站收集,并且主要關(guān)注細(xì)菌、棲息地和地理位置實(shí)體
http://2016.bionlp-st.org/tasks/bb2 (需要FQ訪問)
責(zé)任編輯:xj
原文標(biāo)題:一些NER的英文數(shù)據(jù)集
文章出處:【微信公眾號(hào):深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
-
數(shù)據(jù)集
+關(guān)注
關(guān)注
4文章
1224瀏覽量
25440 -
nlp
+關(guān)注
關(guān)注
1文章
490瀏覽量
22619
原文標(biāo)題:一些NER的英文數(shù)據(jù)集
文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
使用AICube導(dǎo)入數(shù)據(jù)集點(diǎn)創(chuàng)建后提示數(shù)據(jù)集不合法怎么處理?
數(shù)據(jù)集下載失敗的原因?
Debian和Ubuntu哪個(gè)好一些?
樹莓派在自動(dòng)化控制項(xiàng)目中的一些潛在應(yīng)用

請(qǐng)問NanoEdge AI數(shù)據(jù)集該如何構(gòu)建?
TLV2544按照Figure8的時(shí)序操作,收到的數(shù)據(jù)不是當(dāng)前查詢的轉(zhuǎn)換的通道組,是一些雜亂的數(shù)據(jù)而且跳動(dòng)的很厲害,為什么?
AN29-關(guān)于DC-DC轉(zhuǎn)換器的一些想法

ads1232獲取的數(shù)據(jù)中經(jīng)常有一些比較大的值或者一些錯(cuò)誤值,這個(gè)是因?yàn)槭裁丛颍?/a>
一些關(guān)于ldc1000的spi通信的問題求解
數(shù)據(jù)手冊(cè)中的一些參數(shù)的數(shù)值有時(shí)畫一條橫線或者空著不填是什么意思?
云原生和數(shù)據(jù)庫(kù)哪個(gè)好一些?
ADS1284通過SPI讀取數(shù)據(jù),長(zhǎng)期采集的時(shí)候發(fā)現(xiàn)會(huì)小概率丟一些數(shù)據(jù),什么原因?
一些常見的動(dòng)態(tài)電路

分享一些常見的電路

LED驅(qū)動(dòng)器應(yīng)用的一些指南和技巧

評(píng)論