欢迎投稿

今日深度:

solr(十一):CDH创建solr 添加ik中文分词器,

solr(十一):CDH创建solr 添加ik中文分词器,


一、功能

在cdh集群的solr环境中添加ik分词器,从而可以实现对中文的友好分词。

二、环境

1.centos7.4

2.cdh5.15.2

三、步骤

1.上传ik分词器jar包到

cd /opt/cloudera/parcels/CDH/lib/solr/webapps/solr/WEB-INF/lib/IKAnalyzer2012FF_u1.jar
chmod 777 IKAnalyzer2012FF_u1.jar

ll | grep IKAnalyzer2012FF_u1

2.上传配置文件到所有solr服务器节点
(1)在/data/cloudera/parcels/CDH-5.10.0-1.cdh5.10.0.p0.41/lib/solr/webapps/solr/WEB-INF/下创建classes

mkdir classes

(2)上传ik分词器的三个文件

ext.dic  IKAnalyzer.cfg.xml  stopword.dic

(3)修改权限

chmod 777 ./*

3.重启cdh solr服务

切记一定做这一步,否则会报错

4.在主节点上执行创建instancedir;

solrctl instancedir --generate /var/lib/solr/test_ik_conf

5.修改schema

cd /var/lib/solr/test_ik_conf/conf
vi schema.xml

在schema.xml的types标签中添加

<!-- IKAnalyzer-->
<fieldType name="text_ik" class="solr.TextField">
  <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>
</types>

6.添加域名

标签fields中添加一个域

<field name="content_ik" type="text_ik" indexed="true" stored="true" />

7.创建实例并且上传配置文件:

solrctl instancedir --create test_ik /var/lib/solr/test_ik_conf

8.创建分片:

solrctl collection --create test_ik -s 2 -c test_ik -r 2 -m 3
-c:指的是配置文件

9.更新配置
(1)更新上传配置文件

solrctl instancedir --update test_ik /var/lib/solr/test_ik_conf

(2)重新加载collection

solrctl collection --reload test_ik #重新加载collection

(3)重新创建collection

solrctl collection --create test_ik5 -s 2 -c test_ik -r 1 -m 3


    


 

www.htsjk.Com true http://www.htsjk.com/solr/26246.html NewsArticle solr(十一):CDH创建solr 添加ik中文分词器, 一、功能 在cdh集群的solr环境中添加ik分词器,从而可以实现对中文的友好分词。 二、环境 1.centos7.4 2.cdh5.15.2 三、步骤 1.上传ik分词器jar包到...
相关文章
    暂无相关文章
评论暂时关闭