设为首页收藏本站

大数据论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
查看: 6348|回复: 5

ICTCLAS实现的lucene 4.X中文分词器

[复制链接]
发表于 2014-8-8 15:05:36 | 显示全部楼层 |阅读模式
本帖最后由 风未馨 于 2015-1-14 13:08 编辑

使用ICTCLAS2014实现的lucene4.X分词器,在lucene4.5,lucene4.9下测试,可以正常进行索引的建立和查询.分享给大家,有兴趣的朋友可以通过网盘下载java实例使用。
(ICAnalyzer百度云盘下载地址:http://pan.baidu.com/s/1dDEiYp7) 不要直接点链接,会跳转,复制到浏览器即可!

回复

使用道具 举报

发表于 2014-8-16 20:49:36 | 显示全部楼层
很好的工作。
回复 支持 反对

使用道具 举报

发表于 2014-9-3 14:55:09 | 显示全部楼层
本帖最后由 卧室甜菜 于 2014-9-3 17:35 编辑

楼主,我在使用的时候,启动分词失败,报错信息如下,还望解答,谢谢。
分词启动失败
java.io.IOException: failed to start dividewords engine ,please @lingjoin
        at com.lingjoin.analyzer.ICTokenizer.incrementToken(ICTokenizer.java:74)
        at com.lingjoin.analyzer.ICFilter.incrementToken(ICFilter.java:29)
        at org.apache.lucene.index.DocInverterPerField.processFields(DocInverterPerField.java:102)
        at org.apache.lucene.index.DocFieldProcessor.processDocument(DocFieldProcessor.java:248)
        at org.apache.lucene.index.DocumentsWriterPerThread.updateDocuments(DocumentsWriterPerThread.java:298)
        at org.apache.lucene.index.DocumentsWriter.updateDocuments(DocumentsWriter.java:415)
        at org.apache.lucene.index.IndexWriter.updateDocuments(IndexWriter.java:1298)
        at org.apache.lucene.index.IndexWriter.addDocuments(IndexWriter.java:1259)
        at org.apache.lucene.index.IndexWriter.addDocuments(IndexWriter.java:1244)
        at com.teradata.isearch.util.LuceneUtil.Index(LuceneUtil.java:61)
        at com.teradata.isearch.util.LuceneUtil.main(LuceneUtil.java:290)】

找到日志看了一下,是由于license的问题。。。。已解决

点评

就是授权文件过期的错,有问题可联系我···  详情 回复 发表于 2014-9-4 16:01
回复 支持 反对

使用道具 举报

发表于 2014-9-3 14:55:12 | 显示全部楼层
楼主,我在使用的时候,启动分词失败,报错信息如下,还望解答,谢谢。
分词启动失败
java.io.IOException: failed to start dividewords engine ,please @lingjoin
        at com.lingjoin.analyzer.ICTokenizer.incrementToken(ICTokenizer.java:74)
        at com.lingjoin.analyzer.ICFilter.incrementToken(ICFilter.java:29)
        at org.apache.lucene.index.DocInverterPerField.processFields(DocInverterPerField.java:102)
        at org.apache.lucene.index.DocFieldProcessor.processDocument(DocFieldProcessor.java:248)
        at org.apache.lucene.index.DocumentsWriterPerThread.updateDocuments(DocumentsWriterPerThread.java:298)
        at org.apache.lucene.index.DocumentsWriter.updateDocuments(DocumentsWriter.java:415)
        at org.apache.lucene.index.IndexWriter.updateDocuments(IndexWriter.java:1298)
        at org.apache.lucene.index.IndexWriter.addDocuments(IndexWriter.java:1259)
        at org.apache.lucene.index.IndexWriter.addDocuments(IndexWriter.java:1244)
        at com.teradata.isearch.util.LuceneUtil.Index(LuceneUtil.java:61)
        at com.teradata.isearch.util.LuceneUtil.main(LuceneUtil.java:290)

点评

这是分词的授权过期的原因,可以联系我,我给你找个新的授权文件,我QQ:893066591,或者留下联系方式  详情 回复 发表于 2014-9-4 15:34
回复 支持 反对

使用道具 举报

 楼主| 发表于 2014-9-4 15:34:03 | 显示全部楼层
卧室甜菜 发表于 2014-9-3 14:55
楼主,我在使用的时候,启动分词失败,报错信息如下,还望解答,谢谢。
分词启动失败
java.io.IOExceptio ...

这是分词的授权过期的原因,可以联系我,我给你找个新的授权文件,我QQ:893066591,或者留下联系方式
回复 支持 反对

使用道具 举报

 楼主| 发表于 2014-9-4 16:01:23 | 显示全部楼层
卧室甜菜 发表于 2014-9-3 14:55
楼主,我在使用的时候,启动分词失败,报错信息如下,还望解答,谢谢。
分词启动失败
java.io.IOExceptio ...

就是授权文件过期的错,有问题可联系我···
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|大数据论坛 ( 京ICP备10002193号-4  

GMT+8, 2017-9-20 20:54 , Processed in 0.163807 second(s), 26 queries , Gzip On.

Powered by Discuz! X3.1

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表