Elasticsearch(ES)聚合

Elasticsearch(ES)的聚合(Aggregation)功能类似于 SQL 中的 GROUP BY + 聚合函数(如 COUNT、AVG、SUM),是进行统计分析的核心机制。


聚合(Aggregation)概述

Elasticsearch 的聚合分为三大类:

类别说明
Metric 聚合计算数值(如:count、avg、sum、max、min)
Bucket 聚合类似于 SQL 的 GROUP BY,把文档分类
Pipeline 聚合对前面聚合结果再次聚合或计算(比如平均值的平均值)

常见聚合类型详解


1️⃣ Bucket 聚合:分类统计

🔹 terms(词项分组)

用途:按字段值分组统计

{
  "aggs": {
    "group_by_tag": {
      "terms": {
        "field": "tag.keyword"
      }
    }
  }
}

🔎 类似 SQL:

SELECT tag, COUNT(*) FROM table GROUP BY tag;

🔹 range(范围分组)

用途:按数值范围分组

{
  "aggs": {
    "price_ranges": {
      "range": {
        "field": "price",
        "ranges": [
          { "to": 100 },
          { "from": 100, "to": 200 },
          { "from": 200 }
        ]
      }
    }
  }
}

🔹 date_histogram(按时间分桶)

用途:按时间分组(如天、小时)

{
  "aggs": {
    "by_day": {
      "date_histogram": {
        "field": "timestamp",
        "calendar_interval": "day"
      }
    }
  }
}

2️⃣ Metric 聚合:数值计算

🔹 avg(平均值)

{
  "aggs": {
    "avg_price": {
      "avg": {
        "field": "price"
      }
    }
  }
}

🔹 sum(求和)、max、min、count(文档数默认统计)

{
  "aggs": {
    "sum_price": {
      "sum": { "field": "price" }
    },
    "max_price": {
      "max": { "field": "price" }
    }
  }
}

3️⃣ 嵌套聚合:桶中嵌套度量 or 桶中嵌套桶

按 tag 分组后,再计算每组价格平均值:

{
  "aggs": {
    "group_by_tag": {
      "terms": { "field": "tag.keyword" },
      "aggs": {
        "avg_price": {
          "avg": { "field": "price" }
        }
      }
    }
  }
}

4️⃣ Pipeline 聚合(进阶)

例如统计每个 tag 的平均值,再算它们的平均值:

{
  "aggs": {
    "group_by_tag": {
      "terms": { "field": "tag.keyword" },
      "aggs": {
        "avg_price": {
          "avg": { "field": "price" }
        }
      }
    },
    "avg_of_avg": {
      "avg_bucket": {
        "buckets_path": "group_by_tag>avg_price"
      }
    }
  }
}

返回结果结构说明

聚合的返回结果长这样:

{
  "aggregations": {
    "group_by_tag": {
      "buckets": [
        {
          "key": "tag1",
          "doc_count": 10,
          "avg_price": {
            "value": 99.5
          }
        },
        ...
      ]
    }
  }
}

实战小技巧

需求方案
查询结果 + 聚合size: 0 只返回聚合结果
排序后 top N 分组terms + order + size
聚合条件过滤使用 filter 聚合

示例:综合案例

统计每个产品分类的销量总和,筛选价格大于 100 的商品:

{
  "query": {
    "range": {
      "price": { "gt": 100 }
    }
  },
  "aggs": {
    "by_category": {
      "terms": {
        "field": "category.keyword",
        "size": 10
      },
      "aggs": {
        "total_sales": {
          "sum": {
            "field": "sales"
          }
        }
      }
    }
  },
  "size": 0
}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

思静鱼

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值