write down,forget
分类 Category : GOPA

一个爬虫:GOPA/狗爬

<Category: GOPA> Comments Off on 一个爬虫:GOPA/狗爬

我以前搭建过一个 elasticsearch 资源的聚合网站,s.medcl.com,聚合了 elasticsearch 的相关资源,有文档,有 Google Group 的讨论(现在换 discuss 了),还有 PPT 等等,方便搜寻资料,因为时间太久,后面不知道死哪里去了,现在发现没有还真是很麻烦,有时候找一些资料很麻烦,要跑好几个网站去找,所以我把这个资源的搜索站重新弄起来。

然后就有了爬虫这个事情,通过爬虫来把这些资源自动收集起来,并且自动更新,然后存放到 elasticsearch 里面来,弄个界面,应该就完事了。
阅读这篇文章的其余部分 »

本文来自: 一个爬虫:GOPA/狗爬