write down,forget
分类 Category : NLP

fudanNLP试玩

<Category: NLP, 搜索> Comments Off on fudanNLP试玩

fudannllp,一个不错的NLP开源库:http://code.google.com/p/fudannlp/ 使用LGPL协议(GNU Lesser General Public License)

FudanNLP 是以统计机器学习为基础,并结合人工规则来处 理中文自然语言以及信息检索、信息抽取的各种任务。
阅读这篇文章的其余部分 »

本文来自: fudanNLP试玩

Natural Language Toolkit Install

<Category: NLP> Comments Off on Natural Language Toolkit Install

http://www.nltk.org/download

阅读这篇文章的其余部分 »

本文来自: Natural Language Toolkit Install

python下的两个分词工具

<Category: NLP> Comments Off on python下的两个分词工具

http://code.google.com/p/pychseg/
基于的MMSEG中文分词算法Python实现,正向最大匹配+多个规则。

需要安装psyco,有点费劲,下面是使用方法:

http://code.google.com/p/pymmseg-cpp/
https://github.com/pluskid/pymmseg-cpp/
阅读这篇文章的其余部分 »

本文来自: python下的两个分词工具

机器学习的开源工具

<Category: NLP, 机器学习, 资源分享> Comments Off on 机器学习的开源工具

以下工具绝大多数都是开源的,基于GPL、Apache等开源协议,使用时请仔细阅读各工具的license statement
阅读这篇文章的其余部分 »

本文来自: 机器学习的开源工具