Apache Solr 9.1-（一）初体验单机模式运行，ApacheSolr

和通数据库htsjk.Com2023-03-25 13:41 来源:未知阅读:359 评论 56 热度4

标签：java solr #solr 初体验

Apache Solr 9.1-（一）初体验单机模式运行，ApacheSolr

Apache Solr 9.1-（一）初体验单机模式运行

Solr是一个基于Apache Lucene的搜索服务器，Apache Lucene是开源的、基于Java的信息检索库，Solr能为用户提供无论在任何时候都可以根据用户的查询请求返回结果，它被设计为一个强大的文档检索引擎。

Apache Solr系列文章：
1、Apache Solr 9.1-（一）初体验单机模式运行
2、Apache Solr 9.1-（二）集群模式运行
3、Apache Solr 9.1-（三）集群模式下通过Http API操作Apache Solr

Apache Solr 9.1-（一）初体验单机模式运行
一、安装Apache Solr 9.1
- 1、各组件版本说明
- 2、下载Apache Solr 9.1
- 3、解压和配置JDK
二、创建Core
- 1、使用solr create命令创建core
三、安装中文分词器
- 1、下载IK-Analyzer
- 2、将ik-analyzer-8.5.0.jar放入solr目录下
- 3、将ik-analyzer中文分词类型加入上步新创建的core_test1中
- 4、重启solr服务
四、安装solr自带的smartcn中文分词器
- 1、将lucene-analysis-smartcn-9.3.0.jar也要放入solr目录下
- 2、将smartcn中文分词类型加入上步新创建的core_test1中
- 3、重启solr服务
- 4、验证smartcn中文分词器
五、解决不能通过其它机器通过http://ip:8983/solr/访问的问题
- 1、编辑solr-9.1.0\bin\solr.cmd
- 2、重启solr服务
- 3、验证
六、配置Core中字段
- 1、各数据类型与solr中类型的对应关系
- 2、为core添加字段
- 3、删除core目录下的data目录并重启solr服务

一、安装Apache Solr 9.1

1、各组件版本说明

序号	软件名称	版本	说明
1	JDK	11	Apache Solr9.1要求JDK的版本最低为11,可以是openjdk
2	Apache Solr	9.1	基于Apache Lucene搜索服务器
3	IK-Analyzer	8.5.0	中文分词器
4	Zookeeper	2.4.15	本文中暂时用不到，在后序关与Apache Solr9.1集群部署的文章中会用到

2、下载Apache Solr 9.1

JDK11也需要提前下载好，在本文中就不再详述JDK11的下载和安装了，可以选择Oracle JDK11,也可以是OPEN JDK11，无论是哪个JDK，版本最低是11。

Apache Solr官方下载地址

3、解压和配置JDK

1）. 解压到目标目录下

2）.配置JDK11的环境变量

如果大家已经将JDK11做为默认的JDK版本（JAVA_HOME环境变量指向JDK11的安装目录）了，就可以跳过此步了，该步骤是针对当前系统环境中默认是JDK版本不是JDK11(我的环境目前仍是JDK8)，但是solr9.1还需要用于JDK11的场景。

通过编辑solr9.1\bin\solr.cmd脚本，在此脚本中设置JDK11的安装路径。

在solr.cmd脚本增加下面的代码，来设置SOLR_JAVA_HOME环境变量，用于指定solr用到的JDK11的安装目录。

set SOLR_JAVA_HOME = "E:\JavaTeam\Java\jdk-11.0.16.1"

3）.启动

solr.cmd start

二、创建Core

通过管理画面http://ip:8983/solr的core Admin模块进行创建会失败，提示在新创建的core目录\conf\下找不到solrconfig.xml和managed-schema.xml，所以我们采用命令行的方式来创建Core。

1、使用solr create命令创建core

 solr9.1安装目录\bin>solr create -c core名称

三、安装中文分词器

Apache Solr中默认没有中文分词器，导致对中文数据做查询时，无法对中文词组做识别和模糊查询，只能将中文每个字做为独立的词组做查询，所以需要为Apache Solr安装中文分词器。
solr中可用的中文分词器有很多，有IK-Analyzer、Smartcn、Jeasy，庖丁，由于我在Apache Solr4.10版本中使用的就是IK-Analyzer中文分词器（注意与Apache Solr的版本要匹配），所以在Apache Solr9.1还是安装IK-Analyzer中文分词器,大家可以根据自己需要安装需要的中文分词器。

1、下载IK-Analyzer

点击此处【下载地址】下载

2、将ik-analyzer-8.5.0.jar放入solr目录下

存放于 solr-9.1.0\server\solr-webapp\webapp\WEB-INF\lib\ 目录下

3、将ik-analyzer中文分词类型加入上步新创建的core_test1中

编辑solr-9.1.0\server\solr\core_test1\conf\managed-schema.xml

<!-- ik分词器 -->
    <fieldType name="text_ik" class="solr.TextField">
      <analyzer type="index" useSmart="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
      <analyzer type="query" useSmart="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
    </fieldType>

4、重启solr服务

1). 通过netstat命令查询占用8983的进程号

netstat -ano | find "8983"

2）.结束进程号为14168的进程

3）.启动solr服务

solr.cmd start

4）.验证ik-analyzer分词

四、安装solr自带的smartcn中文分词器

1、将lucene-analysis-smartcn-9.3.0.jar也要放入solr目录下

从solr-9.1.0\modules\analysis-extras\lib\目录下复制lucene-analysis-smartcn-9.3.0.jar到solr-9.1.0\server\solr-webapp\webapp\WEB-INF\lib\目录下

2、将smartcn中文分词类型加入上步新创建的core_test1中

编辑solr-9.1.0\server\solr\core_test1\conf\managed-schema.xml

<!-- smartcn分词器 -->
<fieldType name="text_smartcn" class="solr.TextField" positionIncrementGap="100">
	<analyzer type="index">
		<tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
	</analyzer>
	<analyzer type="query">
		 <tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
	</analyzer>
</fieldType>

3、重启solr服务

4、验证smartcn中文分词器

五、解决不能通过其它机器通过http://ip:8983/solr/访问的问题

solr默认只能通过http://127.0.0.1:8983/solr来访问，如果要允许其它机器通过网络ip来访问，需要修改设置

1、编辑solr-9.1.0\bin\solr.cmd

set "SOLR_JETTY_HOST=192.168.2.51"

2、重启solr服务

3、验证

然后就可以通过http://ip:8983/solr来访问solr服务了

六、配置Core中字段

1、各数据类型与solr中类型的对应关系

序号	基本数据类型	Solr中数据类型	说明
1	int	pint
2	fload	pfloat
3	long	plong
4	double	pdouble
5	String	string	无需中文分词
6	String	text_ik、text_smartcn	需要中文分词
7	date	pdate

更多的数据类型定义请参阅官方文档或solr-9.1.0\server\solr\core_test1\conf\managed-schema.xml文件中fieldType的定义

2、为core添加字段

编辑solr-9.1.0\server\solr\core_test1\conf\managed-schema.xml，在文档中schema节点下添加field节点定义

3、删除core目录下的data目录并重启solr服务

本站文章为和通数据库网友分享或者投稿，欢迎任何形式的转载，但请务必注明出处.
同时文章内容如有侵犯了您的权益，请联系QQ：970679559，我们会在尽快处理。

返回首页

评论暂时关闭