HFCAS OpenIR
基于条件随机场的蒙古语词性标注方法
其他题名Mongolian part-of-speech tagging approach based on conditional random fields
2010-01-01
发表期刊计算机应用
ISSN1001-9081
摘要为了保留蒙古语词缀中大量的语法、语义信息和缩小蒙古语词典的规模,蒙古语词性标注需要对词干和词缀都进行词性标注。针对这一问题提出了一种基于条件随机场(CRF)的蒙古语词性标注方法。该方法利用CRF模型能够添加任意特征的特点,充分使用蒙文上下文信息,针对词素之间的相互影响添加了新的统计特征,并在3.8万句的蒙古语词性标注语料上进行了封闭测试,该方法的标注准确率达到了96.65%,优于使用隐马尔可夫模型(HMM)的词性标注模型。
其他摘要It is necessary to tag both stem and affix in the Mongolian part of speech tagging in order to save lots of syntax and semantic information of affix and to reduce the size of Mongolian dictionary.This paper presented a new approach of Mongolian part of speech tagging based on CRF.To take advantage of the ability of using arbitrary features as input in CRF the system exploited not only the contexts of words but also new statistical features adopted for mutual influence between the morphemes.The system was tested in the 38000 part-of-speech dataset provided by Inner Mongolia University.The closed test results show that POS tagging accuracy of the testing set reaches 96.65% outperforming the HMM-based model.
关键词词干 词缀 条件随机场 词性标注 词素
收录类别CSCD
语种中文
CSCD记录号CSCD:3909767
引用统计
被引频次:3[CSCD]   [CSCD记录]
文献类型期刊论文
条目标识符http://ir.hfcas.ac.cn:8080/handle/334002/51298
专题中国科学院合肥物质科学研究院
推荐引用方式
GB/T 7714
. 基于条件随机场的蒙古语词性标注方法[J]. 计算机应用,2010,000.
APA (2010).基于条件随机场的蒙古语词性标注方法.计算机应用,000.
MLA "基于条件随机场的蒙古语词性标注方法".计算机应用 000(2010).
条目包含的文件
条目无相关文件。
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
百度学术
百度学术中相似的文章
必应学术
必应学术中相似的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。