Jubatus集群测试

http://jubat.us/en/tutorial_distributed.html

随着往训练数据的增加,正确率直线上升,牛逼啊,一边训练,一边还能继续进行预测,互不影响。

How ElasticSearch Tried to Scaling Lucene

拖拖拉拉,终于完成了。 介绍了elasticsearch核心的几个分布式设计概念,对于了解elasticsearch非常有用。 这部分内容是lukas-vlcek 根据shay 的slide Road to a Distributed Search Engine 整理的。 我翻译了下。 链接在此: http://www.elasticsearch.cn/guide/concepts/scaling-lucene/ Scaling Lucene Building Blocks Partitioning Replication Transaction Log

logstash,nginx日志,grok pattern调试

#Nginx日志格式定义

ElasticSearch插件更新

carrot2文本聚类插件 https://github.com/medcl/elasticsearch-carrot2 支持es版本到0.20.x ik分词插件 https://github.com/medcl/elasticsearch-analysis-ik 1.集成最新的ik中文分词 IK Analyzer 2012 FF 版本:http://linliangyi2007.iteye.com/blog/1703916 2.分词模式可配,支持细粒度和智能分词两种切分模式 配置如下(elasticsearch.yml):