设为首页收藏本站

大数据论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
查看: 2637|回复: 9

[FAQ(问题集锦)] 最新的NLPIR2013版,导入用户词典后分词结果并没有变化

[复制链接]
发表于 2013-5-21 10:57:40 | 显示全部楼层 |阅读模式
         我用最新的NLPIR2013版,但导入用户词典后分词结果并没有变化,无论是用NLPIR_AddUserWord还是NLPIR_ImportUserDict都如此。前者返回true,后者返回导入词的数目,看起来都成功调用
回复

使用道具 举报

发表于 2013-6-4 17:42:35 | 显示全部楼层

回帖奖励 +2

应该是好使的,请把你的测试语句,及包含的用户词典给出来看看。我们的用户词典是事后分析弥补。不一定都会好使。
如果还有问题,可以再导入词典后,加一个语句:NLPIR_SaveTheUsrDic();我这边测试结果都是可以使用用户词典的。

点评

词典格式不对吧,应该 词典内容格式为:词+空格或Tab+词性,每词一行。如:国家主席 np  详情 回复 发表于 2015-6-3 19:57
我测试了 也是不行哦,详细情况请看 http://www.bigdatabbs.com/forum.php?mod=viewthread&tid=3564&extra=page%3D1  发表于 2013-10-29 22:01
管理员您好,我也是用户词典不好使。 String sInput = "王华平安提出的NLP理论"; 用户词典是: 王华 平安 导入用户词典后的分词结果: 王华平安/nr 提出/v 的/u NLP/n 理论/n 为什么王华平安没有分开,我的  详情 回复 发表于 2013-6-7 12:23
回复 支持 反对

使用道具 举报

发表于 2013-6-7 10:32:33 | 显示全部楼层
回个帖子,下班咯~
回复 支持 反对

使用道具 举报

发表于 2013-6-7 11:21:43 | 显示全部楼层
我只是路过,不发表意见
回复 支持 反对

使用道具 举报

发表于 2013-6-7 12:23:55 | 显示全部楼层
admin 发表于 2013-6-4 17:42
应该是好使的,请把你的测试语句,及包含的用户词典给出来看看。我们的用户词典是事后分析弥补。不一定都会 ...

管理员您好,我也是用户词典不好使。
String sInput = "王华平安提出的NLP理论";
用户词典是:
王华
平安

导入用户词典后的分词结果: 王华平安/nr 提出/v 的/u NLP/n 理论/n
为什么王华平安没有分开,我的用户字典是让他们分开的呀!!
回复 支持 反对

使用道具 举报

发表于 2013-6-8 10:55:50 | 显示全部楼层
抱歉,这个是系统无法识别的,因为我们系统自动将王华平安识别为人名,这种情况在香港人名中出现较多,两个姓,分别为王、华。用户词典不能将已经合成的部分拆开,只能讲分开的分词结果内容合并。

点评

张老师,我测试了用户字典 合并也不成功呢,详情请看 http://www.bigdatabbs.com/forum.php?mod=viewthread&tid=3564&extra=page%3D1  发表于 2013-10-29 22:01
回复 支持 反对

使用道具 举报

发表于 2015-6-3 19:57:28 | 显示全部楼层
admin 发表于 2013-6-4 17:42
应该是好使的,请把你的测试语句,及包含的用户词典给出来看看。我们的用户词典是事后分析弥补。不一定都会 ...

词典格式不对吧,应该 词典内容格式为:词+空格或Tab+词性,每词一行。如:国家主席 np
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|大数据论坛 ( 京ICP备10002193号-4 京公海网安备110108001289号  

GMT+8, 2018-11-16 21:32 , Processed in 0.265067 second(s), 26 queries , Gzip On.

Powered by Discuz! X3.1

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表