Elasticsearch之数据类型,elasticsearch
一, 字符串数据类型
字符串数据类型的字段接受文本值可以分为两种:
1, 全文本
全文本通常用于基于文本的相关性进行搜索,全文本字段可以分词,即在索引执行之前通过一个分词器将字符串转换为单词列表. 分词操作使得Elasticsearch可以在全文本字段上搜索单词. 全文本字段不能用于排序而且很少用于聚合
2, 关键字
关键字是精确值,通常用于过滤(例如, 为Tom的博客文章获取所有status字段值), 排序, 参与聚合. 关键字字段不参与分词
参数 | 说明 |
analyzer | 用于可分词的字符串字段. 默认为默认的索引分词器或者标准分词器 |
boost | 字段级别索引加权. 接受浮点型数字, 默认是1.0 |
doc_values | 定义字段是否应该以列跨度的方式存储在磁盘上, 以便用于排序, 聚合, 或者脚本. 接受true或false参数. 对于不可分词字段, 默认值是true. 可分词字段不支持这个参数 |
fielddate | 决定字段是否可以使用内存字段值进行排序, 聚合或者在脚本中使用. 接受disabled或者paged_bytes(默认)参数. 没有分析过的字段会优先使用文档值 |
ignore_above | 不要索引或执行任何长于这个值的字符串. 默认为0(禁用) |
include_in_all | 决定字段是否应该包含在_all字段中. 接受true或false参数. 如果索引被设置为no或者父对象字段设置include_in_all为false; 其他情况下,默认值为true |
index | 决定字段是否可以被用户搜索, 接受参数analyzed(默认, 视为全文本字段),not_analyzed(作为关键字字段)以及no |
index_options | 定义存储在索引中,用于搜索和突出用途的信息 |
norms |
计算查询得分的时候是否应该考虑字段长度. 默认依赖于索引设置: analyzed字段默认为{"enabled":true,"loading":"lazy"}. not_analyzed字段默认为{"enabled":"false"} |
null_value | 接受一个字符串值替换所有null值. 默认为null, 意味着字段作为缺失字段. 如果字段是可分词(analyzed)的, null_value也会被分词 |
position_increment_gap | 定义字符串数组中应该插入的虚拟索引词的数量. 默认值为100, 以一个较合理的值来阻止短语查询在跨字段匹配索引词的时候溢出 |
store | 决定字段值是否应该被存储以及从_source字段分别获取. 接受参数true或者false(默认) |
search_analyzer | 指定搜索时用在可分词字段上的分词器 |
search_quote_analyzer | 指定搜索短语时使用的分词器 |
similarity |
指定使用的相似度评分算法, 默认为TF/IDF |
term_vector | 定义一个可分词字段是否应该存储索引词向量. 默认为no |
二, 数字型数据类型
参数 | 说明 |
long | 一个有符号的64位整数, 最小值为-2^63, 最大值为2^63-1 |
integer | 一个有符号的32位整数, 最小值为-2^31, 最大值为2^31-1 |
short | 一个有符号的16位整数, 最小值为-32768, 最大值为32767 |
byte | 一个有符号的8位整数, 最小值为-128, 最大值为127 |
double | 64位双精度浮点数 |
float | 32位单精度浮点数 |
参数 | 说明 |
coerce | 试着将字符串型数据转换为整数型数字数据 |
boost | 字段级索引加权,接受浮点型数字参数,默认是1.0 |
doc_values | 定义字段是否应该以列跨度的方式存储在磁盘上, 以便用于排序, 聚合或脚本. 接受true(默认)或false参数 |
ignore_malformed | 如果是true, 畸形的数字会被忽略. 如果是false(默认), 畸形数字会抛出异常并丢弃整个文档 |
include_in_all | 决定字段是否应该包含在_all字段中. 接受true或false参数. 如果索引被设置为no或父对象字段设置include_in_all为false, 参数默认值为false; 其他情况下. 默认值为true |
index | 决定字段是否可以被用户搜索. 接受参数not_analyzed(默认)以及no |
null_value | 接受与字段同类型的数字型值来代替null值. 默认是null, 意味着字段作为缺失字段 |
precision_step |
控制索引的额外索引词的数量来使范围查询更快速. 默认值取决于数字类型 |
store | 决定字段值是否应该存储以及从_source字段分别获取. 接受参数true或false(默认) |
本站文章为和通数据库网友分享或者投稿,欢迎任何形式的转载,但请务必注明出处.
同时文章内容如有侵犯了您的权益,请联系QQ:970679559,我们会在尽快处理。