欢迎投稿

今日深度:

solr学习之(七)_学习solr的理由(solr的特点和应用领域),

solr学习之(七)_学习solr的理由(solr的特点和应用领域),


 Solr是一个可伸缩性的、能够即时部署的、致力于信息检索的、可以处理海量信息的、以处理自然语言文本为中心的、检索结果按相关性排序的企业级搜索引擎。

Solr处理的业务需求有以下4个特点:

1、无结构化的自然语言文本为中心;

2、信息浏览占主导地位的用户需求;

3、以Document这种扁平化并且独立的结构组织信息(区别与关系型数据库);

4、要求组织成的数据模式灵活多变(不像数据库表一样要求统一的字段)。

solr的误解:

1、  Solr是一个类似于Google或者Bing的全文检索引擎,。

2、  Solr是与搜索引擎优化(SEO)相关联的。

Solr通过schema.xml的方式来配置Filed,与Lucene相比,这种方式更为灵活。特别是在团队开发中,更易于团队协同作战。而且solr还提供了Copy FieldDynamic Filed这两种Lucene没有的Filed,这使得文档建模更为灵活,功能更加强大。

作为一个Web应用程序,solr可以轻松地部署在JettyTomcatServlet服务器上。

很多时候,千言万语,比不上一幅图来的直接和易懂(下图截自于Solr In Action)。

我们知道,应用程序的架构应当灵活以适应复杂多变的需求。Solr提供了这样一种方式来满足这一需求:多核。换句话说,同一个服务器上可以有多个Index,每个core独立地维护一个Index

作为一个功能复杂的应用,solr提供插件的方式来管理功能模块。这些功能模块都配置在solrconfig.xml里面,这意味着你可以制定符合自己业务的组件来替换solr原有组件,只需要实现相应的接口就可以了,比如中文分词就是被替换得最频繁的Text Analysis组件。

       Solr继承了Lucene的全部优点,并且可以部署在多服务器上。当并发量增加时,特别是企业快速发展时,通过solr的缓存组件和多核(multicore)机制向外扩展,企业可以轻松应对这种变化带来的压力。

    Solr还提供了备份的方式来进行故障转移,当一个服务器宕机了,solr可以对request进行重定向。这种容错机制使得solr的稳定性有了很好的保证。特别是solr4引入了solrcloudsolrcloud底层用Zookeeper来实现,具有以下新的特性:集成化的配置、解决了单点故障的分布式索引、自动容错、查询时自动负载均衡、近实时搜索。

Solr提供了:拼写检查、自动补全、结果分类、自动文摘、关键词高亮显示、检索结果分页、缓存等搜索引擎必不可少的功能。同时,也提供的地理位置检索这一有特色的功能。换句话说,使用solr,你可以无压力地构建一个企业级的搜索引擎。

转载于:https://blog.51cto.com/sbp810050504/1185871

www.htsjk.Com true http://www.htsjk.com/solr/39332.html NewsArticle solr学习之(七)_学习solr的理由(solr的特点和应用领域),   Solr 是一个可伸缩性的、能够即时部署的、致力于信息检索的、可以处理海量信息的、以处理自然语言文本为中心的、检索...
相关文章
    暂无相关文章
评论暂时关闭