设为首页收藏本站

大数据论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
查看: 490|回复: 2

估计我这问题没人回答,换个问题吧,好几个函数测试和文档描述不一致!!

[复制链接]
发表于 2017-1-9 09:30:17 | 显示全部楼层 |阅读模式
本帖最后由 蓝天百元 于 2017-1-10 07:15 编辑

这两函数有问题:
NLPIR_AddUserWord
NLPIR_SaveTheUsrDic
旧dllNLPIR_AddUserWord 返回 1和0,加入新词成功返回1,如果失败或者词典中已经加入过该词了,返回0,文档中都没做太详细描述,都自己反复测试的。
现在的dll NLPIR_AddUserWord测试竟然开始返回2了,以前存在的词认为失败返回0,现在返回1和2,有时是1有时是2,没规律,0都不返回了。
顺便请把NLPIR_DelUsrWord这个也检查下。
    都是旧文档,好几个函数文档都不更新,从svn下载后发现有很多版本,几个版本的文档竟然不相同,变做还得同时对照几个文档,也不知道哪个文档对哪个文档错,几个函数名字和参数格式都不一致。

   文档不准确,授权频繁过期,导致很多人开始接触时不知道哪里的问题,浪费很多人力物力。建议你们提高责任心。。。。。拿着国家经费。。。。,要么就收费,有问题可以直接找你们解决。


回复

使用道具 举报

 楼主| 发表于 2017-1-9 09:33:07 | 显示全部楼层
本帖最后由 蓝天百元 于 2017-1-10 07:20 编辑

还有不知是不是bug的问题。测试时发现有些情况加入用户词语后,分词结果和未加入前相同,并不按照用户词典调整分词结果,这种情况根据词语的不同而不同,多数词语起作用,有的词语就不起作用。
回复 支持 反对

使用道具 举报

 楼主| 发表于 2017-1-10 07:33:33 | 显示全部楼层
本帖最后由 蓝天百元 于 2017-1-10 07:36 编辑

对比了sqlserver2016版的全文索引分词引擎,发现分词并没有多大区别。。。。
因为考虑颗粒粗的话有的数据会搜索不到,颗粒细的话数据量太大,这是个问题。
调整颗粒粗细后发现分词结果基本相同,没什么明显的改变。
如果使用数据库的话sqlserver可以自定义字典、相似词、禁止输出词、自动去无效副词 定冠词之类的
这个分词系统只支持关键词黑名单。
多线程和单线程调用时间几乎没大区别,看文档说支持多线程。

回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|大数据论坛 ( 京ICP备10002193号-4  

GMT+8, 2017-9-20 21:04 , Processed in 0.230803 second(s), 25 queries , Gzip On.

Powered by Discuz! X3.1

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表