solr中文分词，

和通数据库htsjk.Com2019-10-01 23:25 来源:未知阅读:14672 评论 477 热度3

标签：

solr中文分词，

1.使用solr5.1自带的中文分词器
2.首先将下载解压后的solr-4.9.0的目录里面F:\tools\开发工具\Lucene\solr-4.9.0\contrib\analysis-extras\lucene-libs找到lucene-analyzers-smartcn-4.9.0.jar文件,
3.将它复制到solr的Web应用程序里面D:\apache-tomcat-7.0.54\webapps\solr\WEB-INF\lib，
4.修改schema.xml，让solr能够支持中文的分词
<fieldType name="text_smart" class="solr.TextField" positionIncrementGap="100">
<analyzer type="index">

<tokenizer class="solr.SmartChineseSentenceTokenizerFactory"/>


<filter class="solr.SmartChineseWordTokenFilterFactory"/>
</analyzer>
<analyzer type="query">

<tokenizer class="solr.SmartChineseSentenceTokenizerFactory"/>

<filter class="solr.SmartChineseWordTokenFilterFactory"/>
</analyzer>
</fieldType>

schema.xml