设为首页收藏本站

大数据论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
查看: 286|回复: 3

[汉语分词] java web project使用NLPIR 分词的结果和java project使用NLPIR 分词的结果不一样

[复制链接]
发表于 2017-7-26 01:09:15 | 显示全部楼层 |阅读模式
这是在java project中使用NLPIR 分词的结果:
分词结果为:
哎/e ~/w 那个/rz 金刚/n 圈/qv 尺寸/n 太/d 差/a ,/wd 前/f 重/v 后/f 轻/a ,/wd 左宽/nr 右/f 窄/a ,/wd 他/rr 戴/v 上/f 去/vf 很/d 不/d 舒服/a ,/wd 整/v 晚/tg 失眠/vi 会/v 连累/v 我/rr 嘛/y ,/wd 他/rr 虽然/c 是/vshi 只/q 猴子/n ,/wd 但/c 你/rr 也/d 不/d 能/v 这样/rzv 对/p 他/rr 啊/y ,/wd 官府/n 知道/v 会/v 说/v 我/rr 虐待/v 动物/n 的/ude1 ,/wd 说/v 起/vf 那个/rz 金刚/n 圈/qv ,/wd 啊/y ~/w 去年/t 我/rr 在/p 陈家村/nr 认识/v 了/ule 一个/mq 铁匠/n ,/wd 他/rr 手工/d 精美/a ,/wd 价钱/n 又/d 公道/a ,/wd 童叟无欺/vl ,/wd 干脆/d 我/rr 介绍/v 你/rr 再/d 定做/v 一个/mq 吧/y !/wt
增加用户词典后分词结果为:
哎/e ~/w 那个/rz 金刚圈/n 尺寸/n 太差/n ,/wd 前/f 重/v 后/f 轻/a ,/wd 左宽右窄/n ,/wd 他/rr 戴/v 上/f 去/vf 很/d 不/d 舒服/a ,/wd 整/v 晚/tg 失眠/vi 会/v 连累/v 我/rr 嘛/y ,/wd 他/rr 虽然/c 是/vshi 只/q 猴子/n ,/wd 但/c 你/rr 也/d 不/d 能/v 这样/rzv 对/p 他/rr 啊/y ,/wd 官府/n 知道/v 会/v 说/v 我/rr 虐待/v 动物/n 的/ude1 ,/wd 说/v 起/vf 那个/rz 金刚圈/n ,/wd 啊/y ~/w 去年/t 我/rr 在/p 陈家村/nr 认识/v 了/ule 一个/mq 铁匠/n ,/wd 他/rr 手工/d 精美/a ,/wd 价钱/n 又/d 公道/a ,/wd 童叟无欺/vl ,/wd 干脆/d 我/rr 介绍/v 你/rr 再/d 定做/v 一个/mq 吧/y !/wt
删除用户词典后分词结果为:
哎/e ~/w 那个/rz 金刚圈/n 尺寸/n 太差/n ,/wd 前/f 重/v 后/f 轻/a ,/wd 左宽/nr 右/f 窄/a ,/wd 他/rr 戴/v 上/f 去/vf 很/d 不/d 舒服/a ,/wd 整/v 晚/tg 失眠/vi 会/v 连累/v 我/rr 嘛/y ,/wd 他/rr 虽然/c 是/vshi 只/q 猴子/n ,/wd 但/c 你/rr 也/d 不/d 能/v 这样/rzv 对/p 他/rr 啊/y ,/wd 官府/n 知道/v 会/v 说/v 我/rr 虐待/v 动物/n 的/ude1 ,/wd 说/v 起/vf 那个/rz 金刚圈/n ,/wd 啊/y ~/w 去年/t 我/rr 在/p 陈家村/nr 认识/v 了/ule 一个/mq 铁匠/n ,/wd 他/rr 手工/d 精美/a ,/wd 价钱/n 又/d 公道/a ,/wd 童叟无欺/vl ,/wd 干脆/d 我/rr 介绍/v 你/rr 再/d 定做/v 一个/mq 吧/y !/wt
从段落中提取的关键词:
陈家村#左宽#金刚圈#太差#
这是在java web project中使用NLPIR 分词的结果:
分词结果为:
哎/w ~/w 那个金刚圈尺寸太差,前重后轻,左宽右窄,他戴上去很不舒服,整晚失眠会连累我嘛,他虽然是只猴子,但你也不能这样对他啊,官府知道会说我虐待动物的,说起那个金刚圈,啊/w ~/w 去年我在陈家村认识了一个铁匠,他手工精美,价钱又公道,童叟无欺,干脆我介绍你再定做一个吧!/w
增加用户词典后分词结果为:
哎/w ~/w 那个金刚圈尺寸太差,前重后轻,左宽右窄,他戴上去很不舒服,整晚失眠会连累我嘛,他虽然是只猴子,但你也不能这样对他啊,官府知道会说我虐待动物的,说起那个金刚圈,啊/w ~/w 去年我在陈家村认识了一个铁匠,他手工精美,价钱又公道,童叟无欺,干脆我介绍你再定做一个吧!/w
删除用户词典后分词结果为:
哎/w ~/w 那个金刚圈尺寸太差,前重后轻,左宽右窄,他戴上去很不舒服,整晚失眠会连累我嘛,他虽然是只猴子,但你也不能这样对他啊,官府知道会说我虐待动物的,说起那个金刚圈,啊/w ~/w 去年我在陈家村认识了一个铁匠,他手工精美,价钱又公道,童叟无欺,干脆我介绍你再定做一个吧!/w
从段落中提取的关键词:


-------------------------
明显web project的结果不正常,我的data文件夹和NLPIR .dll,NLPIR .lib的路径是正确的,自己手动配置过路径,也试过在使用默认路径时把上面几个文件复制到tomcat的bin目录下,分词结果都是上面那种异常的结果,这个问题有没有人遇到过,请求帮助。
回复

使用道具 举报

 楼主| 发表于 2017-7-26 01:11:32 | 显示全部楼层
版本是NLPIR/ICTCLAS2016分词系统
回复 支持 反对

使用道具 举报

发表于 2017-7-26 17:11:30 | 显示全部楼层
楼主求教啊,我也在下载了NLPIR/ICTCLAS2016分词系统,但是运行自带的java项目:jnaTest的时候,一直是“初始化失败!”,我看他们提供的注册方法CLibrary.Instance.NLPIR_Init()中第三个形参LicenceCode,是不是跟这个LicenceCode有关啊,您是怎么运行起来的? 在线等~~
回复 支持 反对

使用道具 举报

发表于 2017-7-27 14:23:05 | 显示全部楼层
我也是初始化不了,楼主可否解答一下
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|大数据论坛 ( 京ICP备10002193号-4  

GMT+8, 2017-12-15 08:41 , Processed in 0.138838 second(s), 27 queries , Gzip On.

Powered by Discuz! X3.1

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表