欢迎投稿

今日深度:

Solr学习指南,

Solr学习指南,


Solr简介

Solr 是Apache下的一个顶级开源项目,采用Java开发,它是基于Lucene的全文搜索服
务器。Solr提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展,并对索引、搜索性能进行了优化。
   Solr可以独立运行,运行在Jetty、Tomcat等这些Servlet容器中,Solr 索引的实现方法很简单,用 POST 方法向 Solr 服务器发送一个描述 Field 及其内容的 XML 文档,Solr根据xml文档添加、删除、更新索引 。Solr 搜索只需要发送 HTTP GET 请求,然后对 Solr 返回Xml、json等格式的查询结果进行解析,组织页面布局。Solr不提供构建UI的功能,Solr提供了一个管理界面,通过管理界面可以查询Solr的配置和运行情况。
   基于Solr实现站内搜索扩展性较好并且可以减少程序员的工作量,因为Solr提供了较为完备的搜索引擎解决方案,因此在门户、论坛等系统中常用此方案。

注: Solr从5.x版本开始就不依赖Tomcat等容器了,可以直接部署使用。网上查了很多部署教程,都是老版本的。

Solr的部署和配置:

下载安装包:
CHD安装包下载方法:
复制该地址:http://archive.cloudera.com/cdh5/cdh/5/ + 加上自己要下载的版本.tar.gz就可以下载了。

解压软件包:

tar -zxvf solr-4.10.3-cdh5.13.2.tar.gz ./

将解压后文件中的dist文件夹下的solr-4.10.3-cdh5.13.2.war放到Tomcat的webapps下。
通过启动Tomcat来解压该文件

bin/startup.sh

之后就会在webapps下看到解压好的solr-4.10.3-cdh5.13.2,重命名一下,修改为solr

    <env-entry>
       <env-entry-name>solr/home</env-entry-name>
       <env-entry-value>/home/hadoop/solr-4.10.3-cdh5.13.2/solrhome/</env-entry-value>
       <env-entry-type>java.lang.String</env-entry-type>
    </env-entry>

配置完成后启动tomcat,进入8080端口查看。

Solr操作命令:

bin/sorl -help

可以看到solr有哪些子命令,如start,stop,restart,healthcheck,create,create_core,create_collection,delete,version等

  1. 创建(注:如果是单机版要创建core,如果是分布式的要创建collection)
bin/solr create -c 项目名称

参数说明:

  • -c 要创建的collection名称
  • -d 配置文件目录
  • -shards 该collection要创建的分片数
  • -replicationFactor 每个分片要创建的副本数,建议为奇数
  1. 删除collection
./hbase-indexer delete-indexer --name 'collection_vip'

www.htsjk.Com true http://www.htsjk.com/solr/30494.html NewsArticle Solr学习指南, Solr简介 Solr 是Apache下的一个顶级开源项目,采用Java开发,它是基于Lucene的全文搜索服 务器。Solr提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展,并对索...
相关文章
    暂无相关文章
评论暂时关闭