1. 首页
  2. 技术知识

Mysql 8 新特性 window functiоns 的作用

MySQL 8.0的新特性包括:

    对Unicode 9.0的开箱即用的完整支持支持窗口函数和递归SQL语法,这在以往是不可能或者很难才能编写这样的查询语句对原生JSON数据和文档存储功能的增强支持MySQL 8.0的发布,跳过了多个版本号(从5.5开始),由于6.0修改和7.0是用来保留做MySQL的集群版本,因此采用了8.0的版本号。

1. 问题

Mysql 8.0.2 中新增加了一个主要功能 –
窗口函数 window functiоn

这个功能具体是解决什么问题?下面先看一个SQL查询的场景,看一下平时我们是怎么做的,然后再看一下如何使用窗口函数来更方便的解决


(1)准备测试表和数据

建一个简单的电影信息表,字段有:

ID

release_year(发行年份)

category_id(所属分类ID)

rating(评分)

CREATE TABLE films (

id int(11),

release_year int(11),

category_id int(11),

rating decimal(3,2)

)插入测试数据

insert into films2 values

(1,2022,1,8.00),

(2,2022,2,8.50),

(3,2022,3,9.00),

(4,2022,2,8.20),

(5,2022,1,8.40),

(6,2022,2,7.00);整体形式如下


(2)查询需求

查询每一年中的平均评分,要求每条记录后面都显示当年的平均评分

例如 2022 年,有3条记录,8.00, 8.50, 9.00 的平均分是 8.5,2022年有2条记录,平均分是 8.3,2022年有1条记录,平均分为 7.00

最终结果的形式如下:

我们可以使用子查询来计算各年的平均分,然后使用 join 把结果连接回去

SELECT

f.id, f.release_year,

f.rating, years.year_avg

FROM films f

LEFT JOIN (

SELECT f.release_year,

  АVG(rating) AS year_avg

FROM films f

GROUP BY f.release_year

) years

ON f.release_year = years.release_year是不是有点复杂,下面看下窗口函数的处理方式


2. window functiоns 的解决方案

什么是 window functiоns

window functiоns 是对一组数据进行计算,与使用 group by 时不同,不会进行单行的结果输出,而是与每条记录相关联

语法示例:

SELECT

functiоn_name OVER ( window_definition )

FROM (…)window_definition 是定义要计算的记录集合,就像是一个小窗口,在整体数据集合上显示出一部分

functiоn_name 指定了对于窗口中的数据集合执行什么计算

回头看下上面的那个查询,需要计算每部电影所在年份的所有电影平均评分,下面使用窗口函数来处理

SELECT

f.id, f.release_year,

f.category_id, f.rating,

АVG(rating) OVER

(PARTITION BY release_year) AS year_avg

FROM films fwindow_definition 部分使用了 PARTITION BY 从句,它告诉数据库把结果数据集合分割成更小的部分,把 release_year 相同的放在一起,函数 АVG(rating) 会对每个窗口数据进行计算,然后把结果放到每一行中


查询示例1

计算每部电影在所属年份中的评分排行位置


查询语句

SELECT

f.id, f.release_year,

f.category_id, f.rating,

RANK() OVER (PARTITION BY release_year

  ORDER BY rating DESC) AS year_rank

FROM films fwindow_definition 部分使用 PARTITION BY 来根据 release_year 划分窗口,使用 ORDER BY 在窗口内排序

RANK() 函数可以返回一行数据在本窗口中的位置

查询结果


查询示例2

查看每部电影在总排行榜中的位置

查询语句

SELECT

f.id, f.release_year,

f.category_id, f.rating,

RANK() OVER (ORDER BY rating DESC)

  AS general_rank

FROM films f order by id主语句中的 order by 保证了整个数据集的排序

window_definition 中没有使用 PARTITION BY,那么就是把整个结果集合当做一个窗口,ORDER BY 对窗口中的数据根据 rating 做降序排序,把得分最高的放前面

RANK() 函数取得每条记录在窗口中的位置

查询结果


3. 小结

窗口函数是 Mysql 8.0.2 中的高级特性,可以方便的执行聚合计算,而不用对结果集进行实际的聚合,大大增加了灵活性、可读性,更便于维护

原创文章,作者:starterknow,如若转载,请注明出处:https://www.starterknow.com/114730.html

联系我们