今日深度：

solr中文分词，

和通数据库htsjk.Com2019-09-20 23:17 来源:未知阅读:16963 评论 315 热度4

标签：

solr中文分词，

solr中文分词。
solr5.0 自带一个中文分词包，lucene-analyzers-smartcn-5.0.0.jar。在安装目录下搜寻找到，并copy到solr提供的web服务目录的lib目录下。
修改collection配置里面的schema.xml。新增字段类型。


<fieldType name="text_cn" class="solr.TextField" positionIncrementGap="100">  
      <analyzer type="index">  
       <!-- 此处需要配置主要的分词类 -->  
        <tokenizer class="solr.SmartChineseSentenceTokenizerFactory"/>  
        <filter class="solr.SmartChineseWordTokenFilterFactory"/>  
      </analyzer>  
      <analyzer type="query">  
      <!-- 此处配置同上 -->  
        <tokenizer class="solr.SmartChineseSentenceTokenizerFactory"/>  
        <filter class="solr.SmartChineseWordTokenFilterFactory"/>  
      </analyzer>  
    </fieldType>

启动solr cloud服务，新建collection就好。

本站文章为和通数据库网友分享或者投稿，欢迎任何形式的转载，但请务必注明出处.
同时文章内容如有侵犯了您的权益，请联系QQ：970679559，我们会在尽快处理。

返回首页

暂无相关文章

评论暂时关闭