欢迎投稿

今日深度:

nutch和solr,

nutch和solr,


nutch就是用于分布式采集数据源,solr用于建索引和搜索服务。

nutch是分布式爬虫系统,solr是搜索引擎。

lucene是一个做搜索用的类库。
nutch和solr都是基于lucene的,二者都是可直接运行的应用程序。
solr是lucene的服务器化,内嵌了jetty,提供REST接口,
用户可以直接post数据给solr,然后由solr进行索引。
solr不包含下载系统,用户需要负责下载,转成solr所需要的格式。
solr还提供查询接口供用户查询。
nutch可以看成一个out-of-box的搜索引擎,包含了crawler,indexer和查询接口。
但nutch更偏向于下载系统。
一般可以使用nutch做crawler,而使用solr做indexer和查询接口。

www.htsjk.Com true http://www.htsjk.com/solr/34680.html NewsArticle nutch和solr, nutch就是用于分布式采集数据源,solr用于建索引和搜索服务。 nutch是分布式爬虫系统,solr是搜索引擎。 lucene是一个做搜索用的类库。 nutch和solr都是基于lucene的,二者都是可...
相关文章
    暂无相关文章
评论暂时关闭