write down,forget
标签 Tag : plugin

elasticsearch插件bug fix

<Category: Diving Into ElasticSearch, 小道消息> Comments Off on elasticsearch插件bug fix

lucene4变化不少:http://blog.mikemccandless.com/2012/07/lucene-400-alpha-at-long-last.html
自定义的analyzer的要求也更加严格,之前写的几个插件,都报错了。
错误具体表现在第一次分词没有问题,第二次及后续的分词都是空,感谢各位网友的积极响应和测试反馈,谢谢。

具体是什么原因呢?

仔细研究了下代码,发现reset多加了一个参数,汗,fix如下:

–    public void reset(Reader input) throws IOException {
+    public void reset() throws IOException {

 

受影响的插件:pinyin、string2int、stconvert

这次都是按jdk6重新编译的,上次反映的jdk7的问题也一并解决了。

 

阅读这篇文章的其余部分 »

本文来自: elasticsearch插件bug fix

发布个插件:elasticsearch-river-email

<Category: Diving Into ElasticSearch> Comments Off on 发布个插件:elasticsearch-river-email

最近发现vps上面跑的用来收邮件的python脚本占用了30%的cpu,并且一直就有写个邮件river的想法,不过一直没有付诸行动,今天下班抽空完成了这个插件,理论支持的协议:
/**
now support:
imap
imaps
pop3s
pop3
*/
不过只有时间测试了pop3协议,正常收取。
地址:https://github.com/medcl/elasticsearch-river-email

创建river的方式:

RTF已经包含该插件,并测试通过:
https://github.com/medcl/elasticsearch-rtf/tree/master/elasticsearch/plugins/river-email

本文来自: 发布个插件:elasticsearch-river-email

elasticsearch插件carrot2发布,版本1.0

<Category: Diving Into ElasticSearch> Comments Off on elasticsearch插件carrot2发布,版本1.0

carrot2是一个对搜索结果聚合的开源项目,做了一个插件,用来实现elasticsearch搜索结果的聚合,carrot2调用的是mahout的库,本插件支持几个简单的参数配置,先发个版本,有时间再改进。
github地址:
https://github.com/medcl/elasticsearch-carrot2/downloads

安装方法:
1.下载stopword词典配置文件(https://github.com/downloads/medcl/elasticsearch-carrot2/config.zip),解压到config目录
2.下载安装插件

3.重启ElasticSearch
4.安装完毕

阅读这篇文章的其余部分 »

本文来自: elasticsearch插件carrot2发布,版本1.0

elasticsearch插件carrot2开发

<Category: Diving Into ElasticSearch> Comments Off on elasticsearch插件carrot2开发

elasticsearch开发carrot2插件

ideaj新建项目,省略102字。
阅读这篇文章的其余部分 »

本文来自: elasticsearch插件carrot2开发

ElasticSearch插件发布:PartialUpdate

<Category: Diving Into ElasticSearch, 搜索> Comments Off on ElasticSearch插件发布:PartialUpdate

地址:https://github.com/medcl/ElasticSearch.PartialUpdate

是否碰到过因为需要修改索引中某个字段,而需要将整个索引文档进行重建,是不是很麻烦啊,昨天弄了个插件,就是方便索引文档局部更新的,使用说明如下:

1.先下载插件,解压到ES的plugin目录:

elasticsearch/plguin/es-partial-update/

2.试一把

先索引一个文档吧

执行修改操作,添加一个字段,修改一个字段

看看修改之后的结果吧

本文来自: ElasticSearch插件发布:PartialUpdate