write down,forget

fudanNLP试玩

<Category: NLP, 搜索> 查看评论

fudannllp,一个不错的NLP开源库:http://code.google.com/p// 使用LGPL协议(GNU Lesser General Public License)

FudanNLP 是以统计机器学习为基础,并结合人工规则来处 理中文自然语言以及信息检索、信息抽取的各种任务。

适用: 1.信息检索: 文本分类 新闻聚类 2.中文处理: 中文分词 词性标注 实体名识别 关键词抽取 依存句法分析 时间短语识别 3.结构化学习: 在线学习 层次分类 聚类 精确推理 fudanNLP webservice接口测试 http://jkx.fudan.edu.cn/fudannlp/{seg|ner|pos|key|time|tree}/{input}

分词

查询:

返回结果:

分析:大部分分词都挺精确的,除了“尚未”分词错误

词性标注

结果:

权重分析

结果:

tree(语法树)

结果:

命令行下调用

time识别

结果:

总得来说,很不错,国内高校这种开源的气氛应该搞起来才是嘛,都想着卖钱可不好。

本文来自: fudanNLP试玩