SQL Server 窗口(排序)row_number()、rank()、dense_rank()、ntile(n) 函数总结
一、窗口函数语法
<窗口函数> OVER ([PARTITION BY <分组列> [, <分组列>...]]
[ORDER BY <排序列> [ASC | DESC] [, <排序列> [ASC | DESC]]...]
[<rows or range clause>])
其中:
- <窗口函数> : 定义要在窗口中计算的聚合函数或其它分析函数,如COUNT、RANK、SUM等。
- OVER : 窗口函数的核心关键字。
- PARTITION BY : 定义要用来分组的一组列名。
- ORDER BY : 定义用来排序的一组列名。
- <rows or range clause> : 定义窗口的行集合。默认为 ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW ,表示窗口包括从窗口开始到当前行的所有行。
二、准备数据源
创建表:a_jxl_pos_test
IF EXISTS (SELECT * FROM sys.all_objects WHERE object_id = OBJECT_ID(N'[dbo].[a_jxl_pos_test]') AND type IN ('U'))
DROP TABLE [dbo].[a_jxl_pos_test]
GO
CREATE TABLE [dbo].[a_jxl_pos_test] (
[storeName] nvarchar(255) COLLATE Chinese_PRC_CI_AS NULL,
[barcode] nvarchar(255) COLLATE Chinese_PRC_CI_AS NULL,
[quantity] int NULL,
[amount] decimal (20,2),
[year] int NULL,
[month] int NULL,
[name] nvarchar(255) COLLATE Chinese_PRC_CI_AS NULL
)
GO
数据源如下:
三、窗口(排序)函数介绍
SQL Server中的排序函数有四个:row_number(),rank(),dense_rank()及ntile()函数;
1、row_number()函数
特点: row_number()函数可以为每条记录添加递增的顺序数值序号,即使值完全相同也依次递增序号,不会重复。
ROW_NUMBER() OVER (
[PARTITION BY partition_expression, ... ]
ORDER BY sort_expression [ASC | DESC], ...
)
- PARTITION BY子句将结果集划分为分区。 ROW_NUMBER()函数分别应用于每个分区,并重新初始化每个分区的行号。PARTITION BY子句是可选的。如果未指定,ROW_NUMBER()函数会将整个结果集视为单个分区。
- ORDER BY子句定义结果集的每个分区中的行的逻辑顺序。 ORDER BY子句是必需的,因为ROW_NUMBER()函数对顺序敏感。
1)、PARTITION BY 划分规则未指定即不分组,按金额从大到小排序
select row_number() OVER(ORDER BY amount desc) no,* from a_jxl_pos_test
2)、PARTITION BY 划分规则根据门店分组,按金额从大到小排序
select row_number() OVER(PARTITION BY storeName ORDER BY amount desc) no,* from a_jxl_pos_test
3)、找出各分组的前3名
select * from(select row_number() OVER(PARTITION BY storeName ORDER BY amount desc) no,* from a_jxl_pos_test)a where no <= 3
2、rank()函数
特点:rank()函数也是返回每条记录的排名序号,但当值相同时,序号也将相同,同时跳跃排序
RANK() OVER (
[PARTITION BY partition_expression, ... ]
ORDER BY sort_expression [ASC | DESC], ...
)
- PARTITION BY子句划分应用该函数的结果集分区的行。
- ORDER BY子句指定应用该函数每个分区中行的逻辑排序顺序。
select rank() OVER(ORDER BY quantity desc),* from a_jxl_pos_test
3、dense_rank()函数
特点:dense_rank()函数进行排序时,也会将值相同的数据赋予同一个序号,但与rank()函数不同的是,dense_rank()函数为连续排序
DENSE_RANK() OVER (
[PARTITION BY partition_expression, ... ]
ORDER BY sort_expression [ASC | DESC], ...
)
- dense_rank()函数以ORDER BY子句定义的指定顺序应用于PARTITION BY子句定义的每个分区的行。它会在划分分区边界时重置等级。
PARITION BY子句是可选的。如果省略它,该函数会将整个结果集视为单个分区。
select dense_rank() OVER(ORDER BY quantity desc),* from a_jxl_pos_test
4、ntile(n)函数
特点: ntile(n)函数会将数据分为n组,自动进行分组 (每组数量大致相等,若无法均分为n组,则每组的记录数不能大于它上一组的记录数),每组将会分配同一个序号(组号为1-n)。
NTILE(integer_expression) OVER (
[PARTITION BY partition_expression, ... ]
ORDER BY sort_expression [ASC | DESC], ...
)
- integer_expression为数据行划分的组数。
- PARTITION BY子句将结果集的行分配到应用了NTILE()函数的分区中。
- ORDER BY子句指定应用NTILE()的每个分区中行的逻辑顺序。
select ntile(4) OVER(ORDER BY quantity desc),* from a_jxl_pos_test