ElasticSearch的Gateway及存储原理

ES里有一个叫做gateway的东西,今天抽空理一下,前面翻译ES的一篇博文叫做“搜索引擎与时间机器”,既然里面谈到了时间机器,就免不了需要穿越时空的的门咯,I guess,也许gateway这名字就是这么来的,其实在ES里面,gateway的主要职责是用来对数据进行长持久化(持久化了之后加上版本信息,不就可以自由的往还于过去未来之间了吗?),另外,整个集群重启之后可以通过gateway重新恢复数据。

elasticsearch state recovery configs

Issues 404,值得备注一下。 0.12以前,有一个关于state recovery配置,我一直很迷惑,如下: gateway.recover_after_nodes  //设置集群处于多少节点内将会执行cluster recovery gateway.recover_after_time //设置达到上面参数配置的节点数间隔多久开始执行recovery 0.12新增参数expected_nodes来设置集群期待的节点数,完整的配置如下:

上面的配置是说,整个集群期待的节点是2个,当有一个节点启动之后,它会等待5分钟来再进行集群的state recovery,但是如果集群中上线的节点数达到期望的节点数:2,那么就会立即执行state recovery。

elasticsearch0.12版本发布了

From:http://github.com/elasticsearch/elasticsearch/wiki/Release-notes BreakChanges thrift definition params is conflict with c#’s keyword, rename to parameters. (#392) Geo Overhaul (work with multiple locations). (#414) Bulk API: Rename index to _index, type to _type and id to _id. (#421) 新功能及改进: 1.添加_fields来直接访问已经保存的字段,之前只能通过_source来访问,使用方式如下: _fields[‘my_field_name’].value or_fields[‘my_field_name’].values. 2. 支持Mapper动态模板(Dynamic Template),,支持正则、通配符等区配模式,有点solr动态schema的意义,但是更强大,详情 3.新的River插件,Wikipedia River: A river to index wikipedia,默认下载最后一个wiki的dump文件进行索引(好几个G哦),详情 […]

ElasticSearch WebConsole及ElasticSearch.NET客户端

用Fiddler来查看ElasticSearch的服务器状态太让人抓狂了,抽空弄个console面板,可以很方便的设置服务器地址和更新时间,暂时只显示了一部分有用的信息。 github的地址:http://github.com/medcl/ElasticSearch-WebConsole 封装的一个.NET客户端地址,提供了连接池和thrift支持(暂时不支持Framed模式)200w记录时索引操作1-2ms、800w记录50ms,github地址: http://github.com/medcl/ElasticSearch.Net