SQL里的“分类汇总”黑魔法：从抓狂报表到一眼看穿，GROUP BY与HAVING的实战心得-CSDN博客

本文链接：https://blog.csdn.net/dongxiaod1/article/details/149144409

SQL里的“分类汇总”黑魔法：从抓狂报表到一眼看穿，GROUP BY与HAVING的实战心得 😎

嘿，各位在代码与数据之间穿梭的伙伴们！

我是你们的老朋友，一个热爱SQL胜过一切的老码农。今天不聊Java，不聊框架，咱们来聊聊数据库里最实用、也最容易让人“既爱又恨”的功能——数据分组与筛选。

你是否也经历过这样的场景：产品经理或老板拿着一张Excel截图，兴致勃勃地跑过来对你说：“嘿，我想要个这样的报表！看看每个部门的平均工资是多少？”“统计一下每个班级里，男生和女生各有多少人？”“把平均分超过80分的学习小组给我列出来！”

面对一堆原始数据表，这些需求听起来就让人头大 😫。你最初的反应是不是想把数据一股脑全查出来，然后在Java或Python里写一堆循环和判断来处理？打住！快打住！那样做不仅慢得像蜗牛，还会让你的内存原地爆炸。

今天，我就带你走进SQL的聚合世界，通过几个我亲身经历的场景，让你彻底掌握 GROUP BY 和 HAVING 这对王炸组合。保证让你从一脸懵圈到拍案叫绝！

场景一：老板的“常规”报表——初识 `GROUP BY`

那是一个普通的下午，老板突然发来消息：“小王，你给我拉个数据，我想看看咱们公司里，每个职位有多少人，以及他们的平均工资是多少。”

这是一个典型的“分类汇总”需求。我的数据表 teacher 里存着所有老师的记录，像这样：

id	name	salary	title
1	张三	8000	讲师
2	李四	9000	教授
3	王五	7500	讲师
4	赵六	12000	教授
…	…	…	…

我要的不是零散的列表，而是按“职位”（title）分组后的统计结果。

“分类”的魔法咒语：`GROUP BY`

这时候，GROUP BY 闪亮登场！它的作用就像它的名字一样，就是用来分组的。

SELECT 
    COUNT(*) AS '人数',       -- 聚合函数：计算每个组有多少条记录
    AVG(salary) AS '平均工资', -- 聚合函数：计算每个组的平均工资
    title AS '职位'            -- 分组字段
FROM 
    teacher
GROUP BY 
    title;                    -- 告诉数据库，请按照 title 字段的值来分组

执行一下，完美的结果就出来了：

人数	平均工资	职位
2	7750.00	讲师
2	10500.00	教授

✨ 恍然大悟的瞬间： 我明白了，GROUP BY title 的核心就是把 teacher 表里 title 字段值相同的记录（比如所有“讲师”）“捏”成一个小组，然后再用聚合函数（COUNT, AVG）对这个小组进行统一计算。

🚨 踩坑警告：GROUP BY 的黄金法则

新手最容易在这里犯错！记住这条铁律：在SELECT子句中，凡是没有被聚合函数（如 COUNT, AVG, MAX, MIN, SUM）包裹的字段，都必须出现在 GROUP BY 子句中！

比如你写了 SELECT name, title FROM teacher GROUP BY title，数据库会立刻给你报错！因为它完全懵了：我把所有“讲师”分为一组了，但这一组里有好几个 name（张三、王五），你到底要我显示哪一个？我不知道啊！🤯

升级挑战：多字段分组

老板看了报表很满意，又说：“不错！那你再给我看看，每个班级里，男女生各有多少人？”

这个需求需要同时按“班级”和“性别”两个维度来分组。小菜一碟！

SELECT 
    COUNT(*) AS '人数',
    class_id AS '班级ID',
    gender AS '性别'
FROM 
    student
GROUP BY 
    class_id, gender; -- 多个字段用逗号隔开即可

这个查询会把 class_id 和 gender 都相同的记录分为一组。比如“1班的男生”是一组，“1班的女生”是另一组，“2班的男生”又是一组。

场景二：带“排名”的报表——`ORDER BY` 与聚合函数联手

老板又双叒叕来了：“可以可以！现在我想知道，哪个科目的老师平均工资最高？给我排个序！”

很简单，在 GROUP BY 之后加上 ORDER BY 就行了。

SELECT 
    AVG(salary) AS avg_sal, -- 给聚合函数起个别名，是个好习惯！
    subject_id
FROM 
    teacher
GROUP BY 
    subject_id
ORDER BY 
    avg_sal DESC; -- 按照别名排序，DESC表示降序（从高到低）

💡 老兵技巧： 一定要给聚合函数起一个清晰的别名（AS avg_sal），然后在 ORDER BY 里使用这个别名。这样不仅让SQL更易读，在某些复杂的数据库系统中还能避免重复计算，提升效率！

场景三：带“条件”的终极报表—— `HAVING` 登场，与 `WHERE` 的爱恨情仇

正当我以为可以摸鱼了，老板发来了终极挑战：“我只关心那些**‘高薪’科目**，你把平均工资高于9000元的科目给我列出来。”

我的第一反应，过滤嘛，WHERE 呗！于是我自信地敲下了：

-- 这是一个错误的示范！❌
SELECT AVG(salary), subject_id
FROM teacher
WHERE AVG(salary) > 9000  -- 我想用WHERE来过滤平均工资
GROUP BY subject_id;

结果，数据库无情地给了我一个大大的错误：Error: aggregate functions are not allowed in WHERE clause（聚合函数不允许在WHERE子句中使用）。

这是为什么呢？！我当时也卡了很久。

✨ 终极“恍然大悟”：`WHERE` 和 `HAVING` 的过滤时机

问题的关键在于SQL的执行顺序！我们可以把数据库处理查询想象成一个流水线：

FROM teacher：首先，工人（数据库）跑到 teacher 这张表的仓库里。
WHERE ...：然后，他在仓库门口设了个安检（WHERE子句）。每一条原始记录进来时，他都会检查一下，不符合条件的直接扔掉。注意：这个时候还没有分组，他看到的是一条条独立的记录，根本不知道“平均工资”是多少！
GROUP BY subject_id：通过安检的记录进入车间，被按照 subject_id 分成不同的小组。
HAVING ...：分组完成后，车间主任（HAVING子句）登场！他对已经分好的小组进行审查，把不符合条件的小组整个淘汰掉。比如，“这个小组的平均工资不到9000，淘汰！”
SELECT ...：最后，留存下来的小组被送到打包部门，进行最终的计算和展示。
ORDER BY ...：打包好的产品，在出厂前进行最后的排序。

看明白了吗？WHERE 是在分组前对单条记录进行过滤，而 HAVING 是在分组后对整个分组进行过滤！所以，涉及到聚合函数（AVG, COUNT等）的条件判断，必须用 HAVING！

正确的写法应该是：

SELECT 
    AVG(salary) AS avg_sal, 
    subject_id
FROM 
    teacher
GROUP BY 
    subject_id
HAVING 
    avg_sal > 9000; -- 用HAVING来过滤分组后的结果！

或者直接写 HAVING AVG(salary) > 9000 也可以。

`WHERE` 与 `HAVING` 的区别总结

对比项	`WHERE`	`HAVING`
过滤时机	分组前 ⏰	分组后 ⏳
作用对象	原始的单条记录 (Rows)	分组后的整个组 (Groups)
能否用聚合函数	不能 ❌	可以 ✅
位置	在`GROUP BY`之前	在`GROUP BY`之后