Trong bài viết này, mình sẽ hướng dẫn các bạn sử dụng các hàm ROW_NUMBER, RANK, và DENSE_RANK().
Trong bài viết này sử dụng AdventureWorks2016, bạn có thể download tại: https://www.microsoft.com/en-us/download/details.aspx?id=49502
Cả 3 hàm đều Order by OrderDate
Hàm ROW_NUMBER dùng để xếp hạng kết quả một cách tuần tự bắt đầu từ 1 và không quan tâm đến các giá trị giống nhau.
Cú pháp:
Tại dòng thứ 9, hàm RANK trực tiếp bắt kịp giá trị của ROW_NUMBER bằng cách bỏ đi giá trị 8. Còn DENSE_RANK thì trả về giá trị tiếp theo dựa trên dòng trước đó.
Tương tự với các dòng 12, 13, và dòng 14.
Cú pháp:
Ví dụ dưới đây dùng để xếp hạng sản phẩm trong kho, với tập kết quả được phân vùng dựa trên LocationID
ProductID = 494 và 495, Location = 3 đều có Quatity = 49, nên cùng hạng là 1.
Dòng 6, ProductID = 495, Location = 4, khác với Location 3, nên Rank được reset về bằng 1.
Trong bài viết này sử dụng AdventureWorks2016, bạn có thể download tại: https://www.microsoft.com/en-us/download/details.aspx?id=49502
Phân biệt ROW_NUMBER, RANK, và DENSE_RANK
Đầu tiên, bạn nhìn ví dụ sau:
SELECT CustomerID, SalesOrderID, CAST(OrderDate AS DATE) AS OrderDate,
ROW_NUMBER() OVER(ORDER BY OrderDate) AS [ROW_NUMBER],
RANK() OVER(ORDER BY OrderDate) AS [RANK],
DENSE_RANK() OVER(ORDER BY OrderDate) AS [DENSE_RANK] FROM Sales.SalesOrderHeader
WHERE CustomerID = 11300;
Kết quả:
Cả 3 hàm đều Order by OrderDate
Hàm ROW_NUMBER dùng để xếp hạng kết quả một cách tuần tự bắt đầu từ 1 và không quan tâm đến các giá trị giống nhau.
Cú pháp:
ROW_NUMBER ( )
OVER ( [ PARTITION BY value_expression , ... [ n ] ] order_by_clause )
Tại dòng thứ 7 và dòng 8, giá trị OrderDate đều giống nhau. RANK và DENSE_RANK đều trả về giá trị là 7.Tại dòng thứ 9, hàm RANK trực tiếp bắt kịp giá trị của ROW_NUMBER bằng cách bỏ đi giá trị 8. Còn DENSE_RANK thì trả về giá trị tiếp theo dựa trên dòng trước đó.
Tương tự với các dòng 12, 13, và dòng 14.
Hàm RANK
Hàm RANK () là một hàm của window dùng để xếp hạng cho mỗi hàng trong một phân vùng của tập kết quả.Cú pháp:
RANK ( ) OVER ( [ partition_by_clause ] order_by_clause )
VD: Ví dụ dưới đây dùng để xếp hạng sản phẩm trong kho, với tập kết quả được phân vùng dựa trên LocationID
SELECT i.ProductID, p.Name, i.LocationID, i.Quantity
,ROW_NUMBER() OVER
(PARTITION BY i.LocationID ORDER BY i.Quantity DESC) AS Row_Number
,RANK() OVER
(PARTITION BY i.LocationID ORDER BY i.Quantity DESC) AS Rank
FROM Production.ProductInventory AS i
INNER JOIN Production.Product AS p
ON i.ProductID = p.ProductID
WHERE i.LocationID BETWEEN 3 AND 4
ORDER BY i.LocationID;
Kết quả:ProductID = 494 và 495, Location = 3 đều có Quatity = 49, nên cùng hạng là 1.
Dòng 6, ProductID = 495, Location = 4, khác với Location 3, nên Rank được reset về bằng 1.
Hàm DENSE_RANK
Hàm DENSE_RANK() dùng để xếp hạng các giá trị của một cột theo quy tắc các giá trị giống nhau thuộc cùng một hạng, giá trị nằm sau các giá trị giống nhau sẽ có hạng lớn hơn 1 đơn vị so với hạng của các giá trị ngay trước nó.DENSE_RANK ( ) OVER ( [ ] < order_by_clause > )
VD
SELECT i.ProductID, p.Name, i.LocationID, i.Quantity
,DENSE_RANK() OVER
(PARTITION BY i.LocationID ORDER BY i.Quantity DESC) AS Rank
FROM Production.ProductInventory AS i
INNER JOIN Production.Product AS p
ON i.ProductID = p.ProductID
WHERE i.LocationID BETWEEN 3 AND 4
ORDER BY i.LocationID;
Kết quả:
Nhận xét
Đăng nhận xét