设为首页收藏本站

大数据论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
查看: 194|回复: 1

[汉语分词] PYNLPIR调用segment得到的分词结果不完整

[复制链接]
发表于 2017-6-8 16:14:35 | 显示全部楼层 |阅读模式
尝试利用segment对中文商品短语进行分词,但是发现总是不正确,调试后发现对于一些词(规律还没有掌握)由segment获得的segments并不完整
例如:
接着剂 只能获得:接着
太太乐鸡精 只能获得:太太乐、鸡
乙二醇 只能获得:乙
还有像蒙牛利乐包特仑苏,估计是系统设置包特仑是特殊词,即使自定义了:利乐包和特仑苏,还是只能分词为:包特仑、苏
不知道这种情况应该如何解决?
感谢各位帮助

点评

海!外直播 t.cn/RxlBL8F 禁闻视频 t.cn/RxkPOK9 当我用心去了解世界时,惊愕地发现:从小我们被告诉,资本主义才有的邪恶暴力腐败凄惨都被社会主义国家拥有了;而社会主义应有的平等自由福利人权都被资本主义国家拥有   发表于 2017-6-13 21:43
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|大数据论坛 ( 京ICP备10002193号-4  

GMT+8, 2017-12-12 21:52 , Processed in 0.143598 second(s), 29 queries , Gzip On.

Powered by Discuz! X3.1

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表