fudanNLP试玩

fudannllp,一个不错的NLP开源库:http://code.google.com/p/fudannlp/ 使用LGPL协议(GNU Lesser General Public License) FudanNLP 是以统计机器学习为基础,并结合人工规则来处 理中文自然语言以及信息检索、信息抽取的各种任务。

python下的两个分词工具

http://code.google.com/p/pychseg/ 基于的MMSEG中文分词算法Python实现,正向最大匹配+多个规则。 需要安装psyco,有点费劲,下面是使用方法:

http://code.google.com/p/pymmseg-cpp/ https://github.com/pluskid/pymmseg-cpp/