Elasticsearch之数据类型，elasticsearch

和通数据库htsjk.Com2019-08-05 06:18 来源:未知阅读:6880 评论 361 热度4

标签：

Elasticsearch之数据类型，elasticsearch

一, 字符串数据类型

字符串数据类型的字段接受文本值可以分为两种:

1, 全文本

全文本通常用于基于文本的相关性进行搜索,全文本字段可以分词,即在索引执行之前通过一个分词器将字符串转换为单词列表. 分词操作使得Elasticsearch可以在全文本字段上搜索单词. 全文本字段不能用于排序而且很少用于聚合

2, 关键字

关键字是精确值,通常用于过滤(例如, 为Tom的博客文章获取所有status字段值), 排序, 参与聚合. 关键字字段不参与分词

字符串数据类型的字段可以接受的参数
参数	说明
analyzer	用于可分词的字符串字段. 默认为默认的索引分词器或者标准分词器
boost	字段级别索引加权. 接受浮点型数字, 默认是1.0
doc_values	定义字段是否应该以列跨度的方式存储在磁盘上, 以便用于排序, 聚合, 或者脚本. 接受true或false参数. 对于不可分词字段, 默认值是true. 可分词字段不支持这个参数
fielddate	决定字段是否可以使用内存字段值进行排序, 聚合或者在脚本中使用. 接受disabled或者paged_bytes(默认)参数. 没有分析过的字段会优先使用文档值
ignore_above	不要索引或执行任何长于这个值的字符串. 默认为0(禁用)
include_in_all	决定字段是否应该包含在_all字段中. 接受true或false参数. 如果索引被设置为no或者父对象字段设置include_in_all为false; 其他情况下,默认值为true
index	决定字段是否可以被用户搜索, 接受参数analyzed(默认, 视为全文本字段),not_analyzed(作为关键字字段)以及no
index_options	定义存储在索引中,用于搜索和突出用途的信息
norms	计算查询得分的时候是否应该考虑字段长度. 默认依赖于索引设置: analyzed字段默认为{"enabled":true,"loading":"lazy"}. not_analyzed字段默认为{"enabled":"false"}
null_value	接受一个字符串值替换所有null值. 默认为null, 意味着字段作为缺失字段. 如果字段是可分词(analyzed)的, null_value也会被分词
position_increment_gap	定义字符串数组中应该插入的虚拟索引词的数量. 默认值为100, 以一个较合理的值来阻止短语查询在跨字段匹配索引词的时候溢出
store	决定字段值是否应该被存储以及从_source字段分别获取. 接受参数true或者false(默认)
search_analyzer	指定搜索时用在可分词字段上的分词器
search_quote_analyzer	指定搜索短语时使用的分词器
similarity	指定使用的相似度评分算法, 默认为TF/IDF
term_vector	定义一个可分词字段是否应该存储索引词向量. 默认为no

二, 数字型数据类型

数字型数据类型
参数	说明
long	一个有符号的64位整数, 最小值为-2^63, 最大值为2^63-1
integer	一个有符号的32位整数, 最小值为-2^31, 最大值为2^31-1
short	一个有符号的16位整数, 最小值为-32768, 最大值为32767
byte	一个有符号的8位整数, 最小值为-128, 最大值为127
double	64位双精度浮点数
float	32位单精度浮点数

数字型字段参数
参数	说明
coerce	试着将字符串型数据转换为整数型数字数据
boost	字段级索引加权,接受浮点型数字参数,默认是1.0
doc_values	定义字段是否应该以列跨度的方式存储在磁盘上, 以便用于排序, 聚合或脚本. 接受true(默认)或false参数
ignore_malformed	如果是true, 畸形的数字会被忽略. 如果是false(默认), 畸形数字会抛出异常并丢弃整个文档
include_in_all	决定字段是否应该包含在_all字段中. 接受true或false参数. 如果索引被设置为no或父对象字段设置include_in_all为false, 参数默认值为false; 其他情况下. 默认值为true
index	决定字段是否可以被用户搜索. 接受参数not_analyzed(默认)以及no
null_value	接受与字段同类型的数字型值来代替null值. 默认是null, 意味着字段作为缺失字段
precision_step	控制索引的额外索引词的数量来使范围查询更快速. 默认值取决于数字类型
store	决定字段值是否应该存储以及从_source字段分别获取. 接受参数true或false(默认)