write down,forget

gitosis

<Category: Linux, VPS维护日志>

安装 git sudo apt-get install git-core 配置 git服务器

初始化全局设置

安装python的setup tool

获取并安装gitosis

阅读这篇文章的其余部分

本文来自: gitosis

fudanNLP试玩

<Category: NLP, 搜索>

fudannllp,一个不错的NLP开源库:http://code.google.com/p/fudannlp/ 使用LGPL协议(GNU Lesser General Public License)

FudanNLP 是以统计机器学习为基础,并结合人工规则来处 理中文自然语言以及信息检索、信息抽取的各种任务。
阅读这篇文章的其余部分

本文来自: fudanNLP试玩

elasticsearch插件carrot2发布,版本1.0

<Category: Diving Into ElasticSearch>

carrot2是一个对搜索结果聚合的开源项目,做了一个插件,用来实现elasticsearch搜索结果的聚合,carrot2调用的是mahout的库,本插件支持几个简单的参数配置,先发个版本,有时间再改进。
github地址:
https://github.com/medcl/elasticsearch-carrot2/downloads

安装方法:
1.下载stopword词典配置文件(https://github.com/downloads/medcl/elasticsearch-carrot2/config.zip),解压到config目录
2.下载安装插件

3.重启ElasticSearch
4.安装完毕

阅读这篇文章的其余部分

本文来自: elasticsearch插件carrot2发布,版本1.0

elasticsearch插件carrot2开发

<Category: Diving Into ElasticSearch>

elasticsearch开发carrot2插件

ideaj新建项目,省略102字。
阅读这篇文章的其余部分

本文来自: elasticsearch插件carrot2开发

[收藏]DIJ-多旋翼Q/A

<Category: 4轴, 乱搞>

大疆创新上找到的Q/A,对4轴都适用,收藏。
http://www.dji-innovations.com/minisite/index_cn.html
阅读这篇文章的其余部分

本文来自: [收藏]DIJ-多旋翼Q/A

brisk cluster deploy

<Category: cassandra>

… …
阅读这篇文章的其余部分

本文来自: brisk cluster deploy

使用nginx做elasticsearch的proxy

<Category: Diving Into ElasticSearch>

搭建的http://s.medcl.net使用的是nginx来做elasticsearch的proxy反向代理,如何做的呢?
nginx与elasticsearch配置
阅读这篇文章的其余部分

本文来自: 使用nginx做elasticsearch的proxy

flume搭建调试

<Category: 日志分析>

flume搭建调试

Installing CDH3
https://ccp.cloudera.com/display/CDHDOC/CDH3+Installation
流水账,备忘。
阅读这篇文章的其余部分

本文来自: flume搭建调试

cloudra-manager修改使用自定义源

<Category: Hadoop>

使用cloudra-manager来管理hadoop集群,但是官方源太慢了,搭本地源呗,另外repo写死在package里面了,将包解开,修改下,替换repo仓库地址为本地源即可。
阅读这篇文章的其余部分

本文来自: cloudra-manager修改使用自定义源

elasticsearch禁用dynamic mapping

<Category: Diving Into ElasticSearch>

同名字段的问题,不好避免,干脆禁用dynamic mapping,但是又不能全局的禁用,一般情况下,dynamic mapping还是很帅的,那怎样对个别的索引进行关闭呢?
阅读这篇文章的其余部分

本文来自: elasticsearch禁用dynamic mapping