基于Bert-BiLSTM-CRF的水利命名实体识别方法

桂明 陆, 东升 李

摘要


当前,命名实体识别技术在知识抽取、问答系统、机器翻译发挥独特作用。论文针对水利领域中文语料,构建了一种基于 Bert-BiLSTM-CRF 的水利领域命名实体识别方法。作为端到端的深度学习预训练模型,Bert 模型可以抽取丰富的文本特征得到输出向量,再由 BiLSTM 捕获每个单词在上下文中的语义,最后利用 CRF 模型提取最优序列。实验数据共 5000 条,实体词分为 7 类,F-1 值为 83.01%。论文通过与 Bert-CRF、BiLSTM-CRF 方法在数据集上进行实验对比,实验表明,论文所提出的模型准确率、召回率和 F1 值均达到 80% 以上。因此,论文所提出的方法对水利中文语料有一定的实用性,可以达到不错的实体识别效果。

关键词


Bert-BiLSTM-CRF;实体识别;预训练模型;最优序列

全文:

PDF

参考


张栋,陈文亮.基于上下文相关字向量的中文命名实体识别[J/ OL].计算机科学:1-11[2020-11-29] . http://kns.cnki.net/kcms/detail/50.1075.TP.20201105.1430.006.html.

Chen GONG, Zhenghua LI, Qingrong XIA, et al. Hierarchical

蔡庆.多准则融合的中文命名实体识别方法[J].东南大学学报 (自然科学版),2020,50(5):929-934.

Liu Z, Luo M, Yang H, et al. Named Entity Recognition for the Horticultural Domain[J]. Journal of Physics: Conference Series, 2020,1631(1):12016(6pp).

Zhang W N, Ming Z Y, Zhang Y, et al. Capturing the Semantics of Key Phrases Using Multiple Languages for Question Retrieval[J]. IEEE Transactions on Knowledge & Data Engineering,2016,28(4):888-900.

Lafferty J, Mccallum A, Pereira F C N . Conditional Random Fields: Probabilistic Models for Segmenting and Labeling Sequence Data[J]. proceedings of icml, 2002.

侯位昭,张欣海,宋凯磊,等.基于置信度的Active-BiLSTM- CRF中文层级地址分词方法[J].中国电子科学研究院学 报,2021,16(7):639-644+660.

郑光敏,易天源,唐东昕,等.基于BERT-BiLSTM-CRF模型的中国 民族药知识抽取[J].武汉大学学报(理学版),2021,67(5):393-402.

吴恪涵,张雪英,叶鹏,等.基于BERT-BiLSTM-CRF的中文地址解 析方法[J].地理与地理信息科学,2021,37(4):10-15.

陈琛,吴芬琳.基于BERT的电子病历命名实体识别[J].自动化与 仪器仪表,2021(3):173-176.




DOI: https://doi.org/10.12346/etr.v4i6.6268

Refbacks

  • 当前没有refback。