1、时间可以进行排序,也可以用聚合函数对时间求最大值max(时间)
例如下面的例子:取最晚入职的人,那就是将入职时间倒序排序,然后limit 1
表:
场景:查找最晚入职员工的所有信息
select * from employees order by hire_date desc limit 1
方法二:子查询
select * from employees where hire_date=(select max(hire_date) from employees)
2、 limit可以单独两个参数使用,也可以和offset一起使用
例如:
表:
业务需求:
代码:limit两个参数单独使用:倒序排序,从第三行开始显示,显示一行数据
select * from employees order by hire_date desc limit 2,1
或者:结合offset使用:
select * from employees order by hire_date desc limit 1 offset 2
3、内连接、左连接、右连接的连接后表的合并情况:
(1)两表内连接的结果是将后面的表拼接在前面的表后面
看例子:两个表:
内连接代码:
select *
from salaries sa join dept_manager de on sa.emp_no=de.emp_no
结果:
(2)右连接
两个表:
上面的表右连接下面的表,代码如下:
select *
from employees e right join dept_emp d on e.emp_no=d.emp_no
结果:
虽然是右连接,但是上面的表在right join的前面,前面的表右连接后面的表,那前面的表就在最后的结果中在前面展示,后面的表在后面展示,但是右连接是保留后面的表的所有行
4、新型思路:找第二大的数据,先把第一大的数据筛选掉,然后再在表格中找第一大也就是原本表格的第二大的数据了
表:
需求:
代码:
select e.emp_no,s.salary,e.last_name,e.first_name
from employees e join salaries s on e.emp_no=s.emp_no
where s.salary=(
select max(s2.salary)
from salaries s2
where s2.salary<(select max(salary) from salaries)
)
题解:
结果:
5、两个表连接,输出在职员工自入职以来的薪水涨幅情况
业务需求:
表:
思路:
用两次join,连接三个表,先连接前两个表,后连接第三个表,然后用当前工资减去入职工资。
结果:
6、MySql在处理group by和非聚合列的关系上有变动:一定的版本或者关系允许,使用group by时有select后面有非聚合列的出现:
官方解释:
官网链接:MySQL :: MySQL 5.7 Reference Manual :: 12.19.3 MySQL Handling of GROUP BY
例子:
表:
业务需求:
代码:
select de.dept_no,dep.dept_name,count(de.dept_no)
from dept_emp de
right join departments dep on de.dept_no=dep.dept_no
join salaries s on de.emp_no=s.emp_no
group by de.dept_no
order by de.dept_no
结果:
解释:
7、字段按照窗口函数倒序排序,窗口内的本字段值相同的按照另外一个字段升序排序
也就是用dense_rank()排序,出现1223的情况,那22这两个字段值是相等的,就按照另外一个字段排序,就是dense_rank只能保证整体按照一个字段排序,但是相同的它不能管是不是按照另外一个字段升序排序,所以要用到order by 进行整体升序排序,然后按另外一个字段升序排序
例如下面这道题:
业务需求:
表:
代码:
select emp_no,salary,dense_rank()over(order by salary desc) r
from salaries
order by r,emp_no asc
红色框里面是按照工资进行降序排序,但是只能进行工资降序排序,他管不到相同序号里面是否是按照员工编号升序排序,所以用绿色框里order by进行排序,因为order by在窗口函数后执行,直接写order by emp_no asc按照编号排序的话,整个排序就会乱掉,不会按照薪资降序排序了,所以要先按照order by r asc升序排序,保证整个表是先按照薪资降序排序的,然后按照编号升序排序。
结果:
8、group by可以根据两个字段进行分组,是去除重复的,而窗口函数不去重复,是计算累积值:
例子:
业务需求:
原表:
代码:
select dpm.dept_no,dpm.dept_name,t.title,count(t.title)
from departments dpm inner join
dept_emp de on dpm.dept_no=de.dept_no inner join
titles t on t.emp_no=de.emp_no
group by dept_no,title
order by dept_no,title asc
结果:
9、思路分享:当多个用户有多个订单的时候,怎么找到这个用户的第一个订单
解答:根据用户id分组,然后用min函数,min(商品下单时间)找到第一个商品
举例:
字段介绍:
delivery_id:订单id
customer_id:用户id
order_date:商品下定日期
customer_pref_delivery_date: 商品配送日期
需求:现在要找出当前用户的所有第一个订单输出
代码:
select customer_id,min(order_date) first_id
from Delivery
group by customer_id
结果:
10、编写解决方案,报告在首次登录的第二天再次登录的玩家的 比率,四舍五入到小数点后两位。换句话说,你需要计算从首次登录日期开始至少连续两天登录的玩家的数量,然后除以玩家总数。
题目:
代码:
select
round(sum(case when a2.event_date=date_add(a1.first_time,interval 1 day) then 1 else 0 end)/count(distinct(a1.player_id)),2) as fraction
from (
select player_id,min(event_date) first_time
from Activity
group by player_id
) a1
left join Activity a2
on a1.player_id = a2.player_id
结果:
11、关于null值的筛选
null值的结果是不会被筛选的,但是null值在where 字段 not in 中尤其注意,是会被筛选出来的
举例:
代码:
select p.product_id,p.product_name
from Product p join Sales s
on p.product_id=s.product_id
where s.product_id not in
(
select product_id
from Sales
where sale_date<'2019-01-01' or sale_date>'2019-03-31'
)
group by p.product_id,p.product_name
having min(s.sale_date)>='2019-01-01' and max(s.sale_date)<='2019-03-31'
结果:
12、一张表里面的多个数据都在另外一张表的里有
举例:买下所有产品的用户
代码:
select customer_id
from Customer
group by customer_id
having count(distinct(product_key))=(
select count(*) from Product
)
结果:
解题思路:
为了找出 Customer
表中购买了 Product
表中所有产品的客户的 id
,可以通过以下思路来实现:首先统计 Product
表中产品的总数,然后按照 Customer
表中的 customer_id
进行分组,统计每个客户购买的不同产品的数量,最后筛选出购买产品数量等于 Product
表中产品总数的客户。
13、筛选连续出现的数字
代码:
select DISTINCT l1.num as ConsecutiveNums
from Logs l1
join Logs l2 on l1.id=l2.id-1
join Logs l3 on l1.id=l3.id-2
where l1.num = l2.num and l2.num=l3.num
结果:
思路分析:
为了找出 Logs
表中至少连续出现三次的数字,可以使用自连接(Self - Join)的方法,通过将 Logs
表与自身进行多次连接,使得相邻的行能够相互关联,进而判断是否存在连续出现三次的数字。
14、 谁是做多的好友
需求:
编写解决方案,找出拥有最多的好友的人和他拥有的好友数目。生成的测试用例保证拥有最多好友数目的只有 1 个人。
表:
示例 1:
输入:
RequestAccepted 表:
+--------------+-------------+-------------+
| requester_id | accepter_id | accept_date |
+--------------+-------------+-------------+
| 1 | 2 | 2016/06/03 |
| 1 | 3 | 2016/06/08 |
| 2 | 3 | 2016/06/08 |
| 3 | 4 | 2016/06/09 |
+--------------+-------------+-------------+
输出:
+----+-----+
| id | num |
+----+-----+
| 3 | 3 |
+----+-----+
解释:
编号为 3 的人是编号为 1 ,2 和 4 的人的好友,所以他总共有 3 个好友,比其他人都多。
代码:
select id, count(*) num
from
(
(select requester_id id
from RequestAccepted)
union all
(select accepter_id id
from RequestAccepted)
) s
group by id
order by count(*) desc
limit 1
解题思路:
申请好友一个人就可以,而且当一个人申请跟另一个人好友的时候,另外一个人就不会再申请这个人的好友了,所有无论是申请好友的还是接受好友的人的好友都不会重复,所以直接查询连接申请好友的和 接受好友的人员,再计算他们的数量,就是他们的好友数,最后筛选好友最多的就好了!