sql业务场景分析思路参考

本文链接：https://blog.csdn.net/a1598452168YY/article/details/140161620

1、时间可以进行排序，也可以用聚合函数对时间求最大值max（时间）

例如下面的例子：取最晚入职的人，那就是将入职时间倒序排序，然后limit 1

表：

场景：查找最晚入职员工的所有信息

select * from employees order by hire_date desc limit 1

方法二：子查询

select * from employees where hire_date=(select max(hire_date) from employees)

2、 limit可以单独两个参数使用，也可以和offset一起使用

例如：

表：

业务需求：

代码：limit两个参数单独使用：倒序排序，从第三行开始显示，显示一行数据

select * from employees order by hire_date desc limit 2,1

或者：结合offset使用：

select * from employees order by hire_date desc limit 1 offset 2

3、内连接、左连接、右连接的连接后表的合并情况：

（1）两表内连接的结果是将后面的表拼接在前面的表后面

看例子：两个表：

内连接代码：

select *
from salaries sa join dept_manager  de on sa.emp_no=de.emp_no

结果：

（2）右连接

两个表：

上面的表右连接下面的表，代码如下：

select *
from employees e right join dept_emp d on e.emp_no=d.emp_no

结果：

虽然是右连接，但是上面的表在right join的前面，前面的表右连接后面的表，那前面的表就在最后的结果中在前面展示，后面的表在后面展示，但是右连接是保留后面的表的所有行

4、新型思路：找第二大的数据，先把第一大的数据筛选掉，然后再在表格中找第一大也就是原本表格的第二大的数据了

表：

需求：

代码：

select e.emp_no,s.salary,e.last_name,e.first_name
from employees e join salaries s on e.emp_no=s.emp_no
where s.salary=(
    select max(s2.salary)
    from salaries s2
    where s2.salary<(select max(salary) from salaries) 
)

题解：

结果：

5、两个表连接，输出在职员工自入职以来的薪水涨幅情况

业务需求：

表：

思路：

用两次join，连接三个表，先连接前两个表，后连接第三个表，然后用当前工资减去入职工资。

结果：

6、MySql在处理group by和非聚合列的关系上有变动：一定的版本或者关系允许，使用group by时有select后面有非聚合列的出现：

官方解释：

官网链接：MySQL :: MySQL 5.7 Reference Manual :: 12.19.3 MySQL Handling of GROUP BY

例子：

表：

业务需求：

代码：

select de.dept_no,dep.dept_name,count(de.dept_no)
from dept_emp de 
right join departments dep on de.dept_no=dep.dept_no
join salaries s on de.emp_no=s.emp_no
group by de.dept_no
order by de.dept_no

结果：

解释：

7、字段按照窗口函数倒序排序，窗口内的本字段值相同的按照另外一个字段升序排序

也就是用dense_rank()排序，出现1223的情况，那22这两个字段值是相等的，就按照另外一个字段排序，就是dense_rank只能保证整体按照一个字段排序，但是相同的它不能管是不是按照另外一个字段升序排序，所以要用到order by 进行整体升序排序，然后按另外一个字段升序排序

例如下面这道题：

业务需求：

表：

代码：

select emp_no,salary,dense_rank()over(order by salary desc) r
from salaries
order by r,emp_no asc

红色框里面是按照工资进行降序排序，但是只能进行工资降序排序，他管不到相同序号里面是否是按照员工编号升序排序，所以用绿色框里order by进行排序，因为order by在窗口函数后执行，直接写order by emp_no asc按照编号排序的话，整个排序就会乱掉，不会按照薪资降序排序了，所以要先按照order by r asc升序排序，保证整个表是先按照薪资降序排序的，然后按照编号升序排序。

结果：

8、group by可以根据两个字段进行分组，是去除重复的，而窗口函数不去重复，是计算累积值：

例子：

业务需求：

原表：

代码：

select dpm.dept_no,dpm.dept_name,t.title,count(t.title)
from departments dpm inner join
dept_emp de on dpm.dept_no=de.dept_no inner join
titles t on t.emp_no=de.emp_no
group by dept_no,title
order by dept_no,title asc

结果：

9、思路分享：当多个用户有多个订单的时候，怎么找到这个用户的第一个订单

解答：根据用户id分组，然后用min函数，min（商品下单时间）找到第一个商品

举例：

字段介绍：

delivery_id:订单id

customer_id:用户id

order_date:商品下定日期

customer_pref_delivery_date: 商品配送日期

需求：现在要找出当前用户的所有第一个订单输出

代码：

select customer_id,min(order_date) first_id
from Delivery
group by customer_id

结果：

10、编写解决方案，报告在首次登录的第二天再次登录的玩家的比率，四舍五入到小数点后两位。换句话说，你需要计算从首次登录日期开始至少连续两天登录的玩家的数量，然后除以玩家总数。

题目：

代码：

select 
    round(sum(case when a2.event_date=date_add(a1.first_time,interval 1 day) then 1 else 0 end)/count(distinct(a1.player_id)),2) as fraction
from (
    select player_id,min(event_date) first_time
    from Activity
    group by player_id
) a1
left join Activity a2
on a1.player_id = a2.player_id

结果：

11、关于null值的筛选

null值的结果是不会被筛选的，但是null值在where 字段 not in 中尤其注意，是会被筛选出来的

举例：

代码：

select p.product_id,p.product_name
from Product p join Sales s
on p.product_id=s.product_id
where s.product_id not in 
(  
    select product_id
    from Sales
    where sale_date<'2019-01-01' or sale_date>'2019-03-31'
) 
group by p.product_id,p.product_name
having min(s.sale_date)>='2019-01-01' and max(s.sale_date)<='2019-03-31'

结果：

12、一张表里面的多个数据都在另外一张表的里有

举例：买下所有产品的用户

代码：

select customer_id
from Customer
group by customer_id
having count(distinct(product_key))=(
    select count(*) from Product
)

结果：

解题思路：

为了找出 Customer 表中购买了 Product 表中所有产品的客户的 id，可以通过以下思路来实现：首先统计 Product 表中产品的总数，然后按照 Customer 表中的 customer_id 进行分组，统计每个客户购买的不同产品的数量，最后筛选出购买产品数量等于 Product 表中产品总数的客户。

13、筛选连续出现的数字

代码：

select DISTINCT l1.num as ConsecutiveNums
from Logs l1
join Logs l2 on l1.id=l2.id-1
join Logs l3 on l1.id=l3.id-2
where l1.num = l2.num and l2.num=l3.num

结果：

思路分析：

为了找出 Logs 表中至少连续出现三次的数字，可以使用自连接（Self - Join）的方法，通过将 Logs 表与自身进行多次连接，使得相邻的行能够相互关联，进而判断是否存在连续出现三次的数字。

14、谁是做多的好友

需求：

编写解决方案，找出拥有最多的好友的人和他拥有的好友数目。生成的测试用例保证拥有最多好友数目的只有 1 个人。

表：

示例 1：

输入：
RequestAccepted 表：
+--------------+-------------+-------------+
| requester_id | accepter_id | accept_date |
+--------------+-------------+-------------+
| 1            | 2           | 2016/06/03  |
| 1            | 3           | 2016/06/08  |
| 2            | 3           | 2016/06/08  |
| 3            | 4           | 2016/06/09  |
+--------------+-------------+-------------+
输出：
+----+-----+
| id | num |
+----+-----+
| 3  | 3   |
+----+-----+
解释：
编号为 3 的人是编号为 1 ，2 和 4 的人的好友，所以他总共有 3 个好友，比其他人都多。

代码：

select id, count(*) num
from
(
    (select requester_id id
    from RequestAccepted)
    union all
    (select accepter_id id
    from RequestAccepted)
) s
group by id
order by count(*) desc
limit 1

解题思路：

申请好友一个人就可以，而且当一个人申请跟另一个人好友的时候，另外一个人就不会再申请这个人的好友了，所有无论是申请好友的还是接受好友的人的好友都不会重复，所以直接查询连接申请好友的和接受好友的人员，再计算他们的数量，就是他们的好友数，最后筛选好友最多的就好了！