一、基本概念
ES(Elasticsearch)是一个分布式、RESTful风格的搜索和分析引擎,可以解决海量数据的存储和检索问题。ES中的基本存储单元是文档,而每个文档可以包含一个或多个字段。在ES中,基于查询语句可以完成对文档的修改、删除、排序、分页等操作。
ES中的数组查询,即对于文档中的数组字段(如成绩单、标签等),可以通过查询语句完成其对应的检索、聚合、过滤等操作。
二、数组查询方式
ES提供了多种方式来完成对于数组字段的查询,主要有以下几种:
1、term查询
{
"query": {
"term": {
"tags": "happy"
}
}
}
该查询会匹配文档中包含”tags”字段,并且该字段中包含值为”happy”的元素。
2、terms查询
{
"query": {
"terms": {
"tags": ["happy", "angry"]
}
}
}
该查询会匹配文档中包含”tags”字段,并且该字段中包含值为”happy”或”angry”任意一个元素。
3、match查询
{
"query": {
"match": {
"tags": "happy angry"
}
}
}
该查询会匹配文档中包含”tags”字段,并且该字段中包含同时包含”happy”和”angry”的元素。
4、match_phrase查询
{
"query": {
"match_phrase": {
"tags": "happy angry"
}
}
}
该查询会匹配文档中包含”tags”字段,并且该字段中包含相邻同时包含”happy”和”angry”的元素。
5、nested查询
{
"query": {
"nested": {
"path": "grades",
"query": {
"bool": {
"must": [
{"match": {"grades.grade": "A"}}
],
"filter": [
{"term": {"grades.student": "john"}}
]
}
}
}
}
}
该查询会查询出文档中包含”grades”字段,并且该字段中存在元素”grade”等于”A”,且”student”等于”john”的文档。
三、查询结果的优化
在ES中,对于多字段的查询,可以通过以下方式优化查询结果:
1、source属性过滤字段
{
"_source": ["title", "content"],
"query": {
"match": {
"title": "hello"
}
}
}
该查询结果中,只会返回”title”和”content”字段。
2、size属性限制返回结果数量
{
"size": 10,
"query": {
"match_all": {}
}
}
该查询结果中,只会返回符合条件的前10条文档。
3、from属性进行分页操作
{
"from": 10,
"size": 10,
"query": {
"match_all": {}
}
}
该查询结果中,只会返回符合条件的第10条到第20条文档。
四、数组的聚合操作
在ES中,聚合(Aggregations)是将多个文档集合起来,对于其中的某些字段进行计算和统计。对于数组字段,也可以使用聚合完成类似“统计每个标签的出现次数”等操作。
1、terms聚合
{
"aggs": {
"tags_count": {
"terms": {"field": "tags"}
}
}
}
该聚合会计算出”tags”字段中每个元素出现的次数。
2、range聚合
{
"aggs": {
"age_groups": {
"range": {
"field": "age",
"ranges": [
{"to": 10},
{"from": 10, "to": 20},
{"from": 20}
]
}
}
}
}
该聚合会将”age”字段根据不同的范围进行划分,然后计算每个范围内的文档数量。
3、nested聚合
{
"aggs": {
"student_count": {
"nested": {"path": "grades"},
"aggs": {
"student_name": {"terms": {"field": "grades.student"}}
}
}
}
}
该聚合会计算出每个学生的成绩数量。
五、总结
ES中的数组查询方式有很多种,可以根据查询需求来选择不同的方式。同时,通过限制查询结果数量、分页、进行字段过滤等方式,可以优化查询效率。在完成文档的聚合计算时,也可以使用ES提供的聚合操作。
原创文章,作者:EKKC,如若转载,请注明出处:https://www.506064.com/n/149683.html
微信扫一扫
支付宝扫一扫