elasticsearch插件bug fix

lucene4变化不少:http://blog.mikemccandless.com/2012/07/lucene-400-alpha-at-long-last.html 自定义的analyzer的要求也更加严格,之前写的几个插件,都报错了。 错误具体表现在第一次分词没有问题,第二次及后续的分词都是空,感谢各位网友的积极响应和测试反馈,谢谢。 具体是什么原因呢? 仔细研究了下代码,发现reset多加了一个参数,汗,fix如下: –    public void reset(Reader input) throws IOException { +    public void reset() throws IOException {   受影响的插件:pinyin、string2int、stconvert 这次都是按jdk6重新编译的,上次反映的jdk7的问题也一并解决了。  

发布个插件:elasticsearch-river-email

最近发现vps上面跑的用来收邮件的python脚本占用了30%的cpu,并且一直就有写个邮件river的想法,不过一直没有付诸行动,今天下班抽空完成了这个插件,理论支持的协议: /** now support: imap imaps pop3s pop3 */ 不过只有时间测试了pop3协议,正常收取。 地址:https://github.com/medcl/elasticsearch-river-email 创建river的方式:

RTF已经包含该插件,并测试通过: https://github.com/medcl/elasticsearch-rtf/tree/master/elasticsearch/plugins/river-email

elasticsearch插件carrot2发布,版本1.0

carrot2是一个对搜索结果聚合的开源项目,做了一个插件,用来实现elasticsearch搜索结果的聚合,carrot2调用的是mahout的库,本插件支持几个简单的参数配置,先发个版本,有时间再改进。 github地址: https://github.com/medcl/elasticsearch-carrot2/downloads 安装方法: 1.下载stopword词典配置文件(https://github.com/downloads/medcl/elasticsearch-carrot2/config.zip),解压到config目录 2.下载安装插件

3.重启ElasticSearch 4.安装完毕

ElasticSearch插件发布:PartialUpdate

地址:https://github.com/medcl/ElasticSearch.PartialUpdate 是否碰到过因为需要修改索引中某个字段,而需要将整个索引文档进行重建,是不是很麻烦啊,昨天弄了个插件,就是方便索引文档局部更新的,使用说明如下: 1.先下载插件,解压到ES的plugin目录: elasticsearch/plguin/es-partial-update/ 2.试一把 先索引一个文档吧

执行修改操作,添加一个字段,修改一个字段

看看修改之后的结果吧