mysql 分组内取前几条数据

本文介绍如何在SQL中选取每组前N名记录,包括正序和倒序两种情况,并提供MySQL 8.0以上版本的窗口函数解决方案。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

项目中很常见的一个需求就是取出每个种类的前n条数据,这是我们通常想到分组(group by),但是group by后伴随着数据的聚合 每个种类只保留了一条数据,这并不满足我们的需求取前n条数据,这时候我们可以采用以下方式

  • 场景:有这样一张学生信息表,取每科成绩的前两名 (建表语句见文末)

  

代码实现:

select * from score a 
		 where 2 > (select count(*) from score b 
		 							where b.subject = a.subject 
		 							and b.score > a.score
		 			) order by a.subject ,a.score desc

 

 核心思想:

where中的条件可以理解为把原表多加一列排序列,使得每个学科的成绩都有一个排名,这样我们只需要取出排名靠前的两个人就可以实现

 

那么排名是怎么实现的呢? 这时候我们看 b.subject = a.subject and b.score > a.score 语句 

第一条数据执行 替换为数据 是不是就是 math = math and 100 > 100 这个时候很显然 100>100是不成立的,所以 count(*)统计出来的就是0 

第二条数据执行 替换为数据 math = math and 100 > 98 此时条件成立可以得出 count(*) = 1 以此类推;其实b.subject = a.subject作用可以理解为分组但未聚合,b.score > a.score相当于给组内排序;此方法适应数据量不大的场景,否则速度会很低

那如果取得是倒数两名同学的成绩呢? 只需要b.score < a.score即可

select * from score a 
		 where 2 > (select count(*) from score b 
		 							where b.subject = a.subject 
		 							and b.score < a.score
		 			) order by a.subject ,a.score desc

如果是mysql8.0以上可以使用窗口函数 row_number()

select * from (select *
				,row_number() over(partition by subject order by score desc) rs 
				from score)	a
	     where a.rs < 3

 

 

建表语句:

create table score(
id int PRIMARY KEY  auto_increment,
name varchar(20) comment '姓名',
subject varchar(20) comment '学科',
score int comment '成绩'
);

insert into score(name, subject, score) values('史珍香','math',100);
insert into score(name, subject, score) values('史珍香','chinese',90);
insert into score(name, subject, score) values('史珍香','English',80);
insert into score(name, subject, score) values('杜紫藤','math',98);
insert into score(name, subject, score) values('杜紫藤','chinese',98);
insert into score(name, subject, score) values('杜紫藤','English',90);
insert into score(name, subject, score) values('沈京兵','math',95);
insert into score(name, subject, score) values('沈京兵','chinese',87);
insert into score(name, subject, score) values('沈京兵','English',95);
insert into score(name, subject, score) values('倪世竹','math',70);
insert into score(name, subject, score) values('倪世竹','chinese',80);
insert into score(name, subject, score) values('倪世竹','English',60);

今日分享到此结束啦,希望能帮到各位小伙伴

### MySQL 5.7 中获每个分组的最新一条数据MySQL 5.7 中,可以通过多种方式来查询每个分组的最新一条记录。以下是几种常见的方法: #### 方法一:使用子查询 通过子查询的方式可以先找到每个分组的最大时间戳或其他唯一标识字段,然后再关联原表出完整的记录。 ```sql SELECT t.* FROM table_name AS t JOIN ( SELECT group_column, MAX(timestamp_column) as max_time FROM table_name GROUP BY group_column ) AS sub_t ON t.group_column = sub_t.group_column AND t.timestamp_column = sub_t.max_time; ``` 这种方法适用于大多数场景,并且易于理解[^1]。 #### 方法二:利用窗口函数(仅限于支持窗口函数的版本) 虽然 MySQL 8.0 开始正式引入了窗口函数的支持,在 MySQL 5.7 版本中并不直接支持这些功能。但是这里提供一种思路供参考未来升级后的解决方案: ```sql WITH RankedData AS ( SELECT *, ROW_NUMBER() OVER (PARTITION BY group_column ORDER BY timestamp_column DESC) row_num FROM table_name ) SELECT * FROM RankedData WHERE row_num = 1; ``` 对于 MySQL 5.7 用户来说,此方案不可行,因为缺少必要的语法特性[^2]。 #### 方法三:基于自连接实现 另一种常用的方法是采用自连接的形式来进行筛选。这种方式不需要依赖特定的功能扩展,因此非常适合应用于较旧版的 MySQL 数据库环境中。 ```sql SELECT a.* FROM table_name AS a LEFT JOIN table_name AS b ON a.group_column = b.group_column AND a.timestamp_column < b.timestamp_column WHERE b.id IS NULL; ``` 上述 SQL 语句会返回每一个 `group_column` 下面具有最大 `timestamp_column` 值的那一行数据[^3]。 以上三种方法都可以有效地帮助用户从 MySQL 表中提出按某个条件划分之后各部分最晚更新过的那条记录。具体选择哪种决于实际的应用环境和个人偏好等因素。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值