Sphinx 安装使用

  下载安装 http://sphinxsearch.com/downloads/ 最新版是:2.0.4-release (Mar 2012) 快速链接: Source tarball (tar.gz) http://sphinxsearch.com/files/sphinx-2.0.4-release.tar.gz RHEL/CentOS 5.x x86_64 RPM: http://sphinxsearch.com/files/sphinx-2.0.4-1.rhel5.x86_64.rpm Win32 binaries w/MySQL+PgSQL+libstemmer+id64 support: http://sphinxsearch.com/files/sphinx-2.0.4-release-win32-id64-full.zip

R常用命令

R常用命令(Medcl专用精简版) 1.查看base包命令 library(help=”base”) 2.查看帮助 ?lm help(“*”) help(“mean”) help(“bs”, package = “splines”) #在特定包里搜索 help(“bs”,try.all.packages=TRUE) #在所有包中搜索,默认只在内存加载的包中搜索 help.start() help.search(“tree”) help.search(“tree”, rebuild = TRUE)) #新安装包之后,需要rebuild apropos(“length”)  #查找函数

Flume启动失败问题一则

cat /var/log/flume/flume-flume-master-xxx.log 异常:

Jekyll遭遇编码问题

gitosis

安装 git sudo apt-get install git-core 配置 git服务器

初始化全局设置

安装python的setup tool

获取并安装gitosis

fudanNLP试玩

fudannllp,一个不错的NLP开源库:http://code.google.com/p/fudannlp/ 使用LGPL协议(GNU Lesser General Public License) FudanNLP 是以统计机器学习为基础,并结合人工规则来处 理中文自然语言以及信息检索、信息抽取的各种任务。

elasticsearch插件carrot2发布,版本1.0

carrot2是一个对搜索结果聚合的开源项目,做了一个插件,用来实现elasticsearch搜索结果的聚合,carrot2调用的是mahout的库,本插件支持几个简单的参数配置,先发个版本,有时间再改进。 github地址: https://github.com/medcl/elasticsearch-carrot2/downloads 安装方法: 1.下载stopword词典配置文件(https://github.com/downloads/medcl/elasticsearch-carrot2/config.zip),解压到config目录 2.下载安装插件

3.重启ElasticSearch 4.安装完毕