پارتیشن‌بندی (PARTITION) SQL Server بهینه‌سازی عملکرد و مدیریت داده

بهینه‌سازی عملکرد و مدیریت داده‌ها در SQL Server با تکنیک پارتیشن‌بندی (PARTITION)

پارتیشن‌بندی (PARTITION) یکی از ویژگی‌های بسیار قدرتمند SQL Server است که به شما امکان می‌دهد داده‌های خود را در جداول و ایندکس‌های بزرگ به چندین بخش کوچک‌تر و قابل مدیریت تقسیم کنید. این کار بدون نیاز به ایجاد جداول یا ایندکس‌های جداگانه انجام می‌شود و از نظر منطقی جدول همچنان یک واحد واحد باقی می‌ماند.

پارتیشن‌بندی چیست؟
در SQL Server، پارتیشن‌بندی به معنای تقسیم افقی داده‌هاست. به عبارت دیگر، شما سطرهای یک جدول را بر اساس مقادیر یک ستون خاص (که به عنوان ستون پارتیشن‌بندی شناخته می‌شود) به گروه‌های کوچک‌تر تقسیم می‌کنید. هر یک از این گروه‌ها سپس در فایل‌گروپ‌های مختلفی ذخیره می‌شوند که می‌توانند روی دیسک‌های فیزیکی جداگانه قرار گیرند.

چرا از پارتیشن‌بندی استفاده کنیم؟
پارتیشن‌بندی مزایای قابل توجهی، به خصوص برای جداول بزرگ (با میلیون‌ها سطر) ارائه می‌دهد:

* **عملکرد بهبود یافته:** کوئری‌ها می‌توانند سریع‌تر اجرا شوند، زیرا SQL Server تنها نیاز دارد بخش‌های مرتبط از داده‌ها را اسکن کند، نه کل جدول را.
* **مدیریت آسان‌تر:** عملیات نگهداری مانند بازسازی یا reorganize ایندکس‌ها، پشتیبان‌گیری و restore کردن داده‌ها برای بخش‌های کوچک‌تر بسیار سریع‌تر و کارآمدتر است.
* **انتقال سریع داده‌ها:** شما می‌توانید به سرعت بلاک‌های بزرگی از داده‌ها را بین جداول جابجا کنید. این کار با استفاده از قابلیت `SWITCH` انجام می‌شود که به جای کپی کردن فیزیکی داده‌ها، متادیتا را تغییر می‌دهد و بسیار سریع است.
* **کاهش زمان داون‌تایم:** عملیات نگهداری روی بخش‌های کوچک‌تر تاثیر کمتری بر کل سیستم دارد و زمان داون‌تایم را کاهش می‌دهد.

چه زمانی باید از پارتیشن‌بندی استفاده کنیم؟
پارتیشن‌بندی برای همه جداول مناسب نیست. بهترین کاندیداها برای پارتیشن‌بندی عبارتند از:

* جداول بسیار بزرگ (چندین میلیون سطر یا بیشتر).
* جداول با داده‌های تاریخی که کمتر به آن‌ها دسترسی پیدا می‌شود اما باید برای گزارش‌گیری در دسترس باشند.
* جداول که عملیات نگهداری آن‌ها (مانند بازسازی ایندکس) زمان زیادی می‌برد.
* زمانی که نیاز به حذف سریع بلاک‌های بزرگ از داده‌های قدیمی دارید.

مولفه‌های پارتیشن‌بندی
برای پیاده‌سازی پارتیشن‌بندی، شما به دو عنصر اصلی نیاز دارید:

1. **تابع پارتیشن (Partition Function):** این تابع چگونگی تقسیم سطرها را بر اساس مقادیر یک ستون مشخص می‌کند.
2. **طرح پارتیشن (Partition Scheme):** این طرح نگاشت پارتیشن‌های ایجاد شده توسط تابع پارتیشن را به فایل‌گروپ‌های مختلف در پایگاه داده شما تعریف می‌کند.

برای استفاده از پارتیشن‌بندی، باید فایل‌گروپ‌های اضافی در پایگاه داده خود ایجاد کنید. فایل‌گروپ `PRIMARY` (اصلی) به طور پیش‌فرض ایجاد می‌شود و می‌توانیم فایل‌گروپ‌های بیشتری برای هر پارتیشن ایجاد کنیم.

مثال پیاده‌سازی پارتیشن‌بندی در SQL Server
فرض کنید می‌خواهیم یک جدول را بر اساس سال `OrderDate` پارتیشن‌بندی کنیم.

گام 1: ایجاد فایل‌گروپ‌ها
ابتدا فایل‌گروپ‌های مورد نیاز را برای نگهداری پارتیشن‌ها ایجاد می‌کنیم. ما چهار فایل‌گروپ برای سال‌های 2005، 2006، 2007، 2008 و یک فایل‌گروپ `FutureFG` برای داده‌های آینده ایجاد می‌کنیم.


USE [master]
GO
ALTER DATABASE [AdventureWorks] ADD FILEGROUP [2005FG]
GO
ALTER DATABASE [AdventureWorks] ADD FILEGROUP [2006FG]
GO
ALTER DATABASE [AdventureWorks] ADD FILEGROUP [2007FG]
GO
ALTER DATABASE [AdventureWorks] ADD FILEGROUP [2008FG]
GO
ALTER DATABASE [AdventureWorks] ADD FILEGROUP [FutureFG]
GO
ALTER DATABASE [AdventureWorks] ADD FILE ( NAME = N'2005_Data', FILENAME = N'C:\Program Files\Microsoft SQL Server\MSSQL10.SQLEXPRESS\MSSQL\DATA\2005_Data.ndf' , SIZE = 3072KB , FILEGROWTH = 1024KB ) TO FILEGROUP [2005FG]
GO
ALTER DATABASE [AdventureWorks] ADD FILE ( NAME = N'2006_Data', FILENAME = N'C:\Program Files\Microsoft SQL Server\MSSQL10.SQLEXPRESS\MSSQL\DATA\2006_Data.ndf' , SIZE = 3072KB , FILEGROWTH = 1024KB ) TO FILEGROUP [2006FG]
GO
ALTER DATABASE [AdventureWorks] ADD FILE ( NAME = N'2007_Data', FILENAME = N'C:\Program Files\Microsoft SQL Server\MSSQL10.SQLEXPRESS\MSSQL\DATA\2007_Data.ndf' , SIZE = 3072KB , FILEGROWTH = 1024KB ) TO FILEGROUP [2007FG]
GO
ALTER DATABASE [AdventureWorks] ADD FILE ( NAME = N'2008_Data', FILENAME = N'C:\Program Files\Microsoft SQL Server\MSSQL10.SQLEXPRESS\MSSQL\DATA\2008_Data.ndf' , SIZE = 3072KB , FILEGROWTH = 1024KB ) TO FILEGROUP [2008FG]
GO
ALTER DATABASE [AdventureWorks] ADD FILE ( NAME = N'Future_Data', FILENAME = N'C:\Program Files\Microsoft SQL Server\MSSQL10.SQLEXPRESS\MSSQL\DATA\Future_Data.ndf' , SIZE = 3072KB , FILEGROWTH = 1024KB ) TO FILEGROUP [FutureFG]
GO

این کد فایل‌گروپ‌های جدید و فایل‌های داده مرتبط با آن‌ها را در مسیر مشخص شده ایجاد می‌کند. مسیر فایل را باید بر اساس پیکربندی سرور خود تغییر دهید.

گام 2: ایجاد تابع پارتیشن
تابع پارتیشن تعیین می‌کند که داده‌ها چگونه تقسیم شوند. در این مثال، از `RANGE RIGHT` استفاده می‌کنیم که به این معنی است که مقدار مرزی (مثلاً ‘2005-01-01’) به پارتیشن بعدی تعلق دارد.


CREATE PARTITION FUNCTION [PF_OrderDateByYear](datetime) AS RANGE RIGHT FOR VALUES (N'2005-01-01T00:00:00.000', N'2006-01-01T00:00:00.000', N'2007-01-01T00:00:00.000', N'2008-01-01T00:00:00.000')
GO

این تابع پارتیشن `PF_OrderDateByYear` را ایجاد می‌کند که داده‌های `datetime` را به پارتیشن‌ها تقسیم می‌کند. این پارتیشن‌ها به صورت زیر خواهند بود:
* پارتیشن 1: `OrderDate` < ‘2005-01-01’
* پارتیشن 2: ‘2005-01-01’ <= `OrderDate` < ‘2006-01-01’
* پارتیشن 3: ‘2006-01-01’ <= `OrderDate` < ‘2007-01-01’
* پارتیشن 4: ‘2007-01-01’ <= `OrderDate` < ‘2008-01-01’
* پارتیشن 5: ‘2008-01-01’ <= `OrderDate`

گام 3: ایجاد طرح پارتیشن
طرح پارتیشن، تابع پارتیشن را به فایل‌گروپ‌های مشخص شده نگاشت می‌کند.


CREATE PARTITION SCHEME [PS_OrderDateByYear] AS PARTITION [PF_OrderDateByYear] TO ([2005FG], [2006FG], [2007FG], [2008FG], [FutureFG])
GO

این طرح `PS_OrderDateByYear` را ایجاد می‌کند که به ترتیب پارتیشن‌های تولید شده توسط `PF_OrderDateByYear` را در فایل‌گروپ‌های `2005FG`, `2006FG`, `2007FG`, `2008FG`, `FutureFG` ذخیره می‌کند.

گام 4: ایجاد یا بازسازی جدول/ایندکس با استفاده از طرح پارتیشن
حالا می‌توانیم یک جدول جدید ایجاد کنیم یا یک جدول موجود را تغییر دهیم تا از طرح پارتیشن استفاده کند. در اینجا، یک کپی از جدول `SalesOrderDetail` را با پارتیشن‌بندی ایجاد می‌کنیم.


USE [AdventureWorks]
GO
SELECT * INTO Sales.SalesOrderDetail_Partitioned FROM Sales.SalesOrderDetail
GO
CREATE CLUSTERED INDEX [IX_SalesOrderDetail_Partitioned_OrderDate] ON [Sales].[SalesOrderDetail_Partitioned]
(
	[OrderDate] ASC
)
ON [PS_OrderDateByYear](OrderDate)
GO

این کد ابتدا یک کپی از جدول `SalesOrderDetail` ایجاد می‌کند. سپس یک ایندکس کلاستر شده (Clustered Index) روی ستون `OrderDate` ایجاد می‌کند و آن را روی طرح پارتیشن `PS_OrderDateByYear` قرار می‌دهد. این بدان معناست که داده‌های جدول بر اساس `OrderDate` پارتیشن‌بندی خواهند شد.

مشاهده جزئیات پارتیشن‌ها
می‌توانید با استفاده از نماهای سیستمی (System Views) اطلاعات مربوط به پارتیشن‌ها را مشاهده کنید:


SELECT ps.name AS PartitionSchemeName, pf.name AS PartitionFunctionName,
       p.partition_number, fg.name AS FileGroupName,
       prv.value AS RangeBoundaryValue, p.rows AS NumberOfRows
FROM sys.partition_schemes ps
JOIN sys.partition_functions pf ON ps.function_id = pf.function_id
JOIN sys.data_spaces ds ON ps.data_space_id = ds.data_space_id
JOIN sys.destination_data_spaces dds ON ps.data_space_id = dds.data_space_id
JOIN sys.filegroups fg ON dds.data_space_id = fg.data_space_id
LEFT JOIN sys.partition_range_values prv ON pf.function_id = prv.function_id AND p.partition_number = prv.boundary_id
JOIN sys.partitions p ON p.hobt_id IN (SELECT hobt_id FROM sys.indexes WHERE object_id = OBJECT_ID('Sales.SalesOrderDetail_Partitioned') AND index_id < 2)
WHERE ps.name = 'PS_OrderDateByYear'
ORDER BY p.partition_number;

این کوئری اطلاعات جامعی در مورد طرح پارتیشن، تابع پارتیشن، شماره هر پارتیشن، فایل‌گروپ مرتبط، مقدار مرزی و تعداد سطرهای موجود در هر پارتیشن را نمایش می‌دهد. این به شما کمک می‌کند تا وضعیت پارتیشن‌بندی خود را نظارت کنید.

پارتیشن‌بندی ایندکس‌های غیرکلاستر شده (Non-Clustered Indexes)
ایندکس‌های غیرکلاستر شده نیز می‌توانند پارتیشن‌بندی شوند. دو گزینه اصلی وجود دارد:

1. **هم‌تراز با ایندکس کلاستر شده (Aligned):** ایندکس غیرکلاستر شده دقیقاً به همان روش ایندکس کلاستر شده پارتیشن‌بندی می‌شود. این بهترین روش است، زیرا به SQL Server اجازه می‌دهد تا به سرعت با پرش به پارتیشن صحیح، به داده‌ها دسترسی پیدا کند.
2. **مستقل (Non-Aligned):** ایندکس غیرکلاستر شده روی یک فایل‌گروپ یا طرح پارتیشن متفاوت قرار می‌گیرد. این می‌تواند منجر به کاهش عملکرد شود زیرا SQL Server ممکن است مجبور شود چندین پارتیشن را برای یافتن داده‌ها اسکن کند.


-- ایجاد یک ایندکس غیرکلاستر شده هم‌تراز
CREATE NONCLUSTERED INDEX [IX_SalesOrderDetail_Partitioned_ProductID] ON [Sales].[SalesOrderDetail_Partitioned]
(
	[ProductID] ASC
)
ON [PS_OrderDateByYear](OrderDate)
GO

-- ایجاد یک ایندکس غیرکلاستر شده مستقل (روی فایل‌گروپ PRIMARY)
CREATE NONCLUSTERED INDEX [IX_SalesOrderDetail_Partitioned_CarrierTrackingNumber] ON [Sales].[SalesOrderDetail_Partitioned]
(
	[CarrierTrackingNumber] ASC
)
ON [PRIMARY]
GO

همانطور که می‌بینید، برای ایندکس هم‌تراز، همان طرح پارتیشن (`PS_OrderDateByYear`) و ستون پارتیشن‌بندی (`OrderDate`) استفاده می‌شود. برای ایندکس مستقل، آن را به سادگی روی فایل‌گروپ `PRIMARY` (یا هر فایل‌گروپ دیگری) قرار می‌دهیم.

مدیریت پارتیشن‌ها: تقسیم و ادغام
یکی از مزایای کلیدی پارتیشن‌بندی، انعطاف‌پذیری در مدیریت داده‌ها است.

* **تقسیم پارتیشن (SPLIT RANGE):** برای اضافه کردن یک پارتیشن جدید برای داده‌های آینده استفاده می‌شود. این عمل یک پارتیشن موجود را به دو پارتیشن تقسیم می‌کند.


ALTER PARTITION SCHEME [PS_OrderDateByYear] NEXT USED [FutureFG];
GO
ALTER PARTITION FUNCTION [PF_OrderDateByYear]() SPLIT RANGE (N'2009-01-01T00:00:00.000');
GO

دستور اول (`NEXT USED`) مشخص می‌کند که فایل‌گروپ `FutureFG` برای پارتیشن جدیدی که ایجاد می‌شود، استفاده شود. دستور دوم (`SPLIT RANGE`) یک مرز جدید در ‘2009-01-01’ ایجاد می‌کند و پارتیشن نهایی موجود را به دو پارتیشن تقسیم می‌کند: یکی برای داده‌های تا قبل از 2009 و دیگری برای داده‌های از 2009 به بعد. فایل‌گروپ `FutureFG` اکنون برای پارتیشن داده‌های 2009 به بعد استفاده می‌شود.

* **ادغام پارتیشن (MERGE RANGE):** برای حذف یک پارتیشن قدیمی استفاده می‌شود. این عمل دو پارتیشن مجاور را در یک پارتیشن ادغام می‌کند و داده‌ها را به فایل‌گروپ پارتیشن باقی‌مانده منتقل می‌کند.


ALTER PARTITION FUNCTION [PF_OrderDateByYear]() MERGE RANGE (N'2005-01-01T00:00:00.000');
GO

این دستور مرز ‘2005-01-01’ را حذف می‌کند و پارتیشن‌های مربوط به آن مرز را ادغام می‌کند. داده‌هایی که قبل از این مرز بودند، اکنون در پارتیشن مجاور بعدی قرار می‌گیرند و فایل‌گروپ مرتبط با پارتیشن حذف شده آزاد می‌شود.

سوییچ پارتیشن (Partition Switching)
قابلیت `SWITCH` یکی از قدرتمندترین ویژگی‌های پارتیشن‌بندی است که به شما امکان می‌دهد به سرعت داده‌ها را به داخل یا خارج از یک جدول پارتیشن‌بندی شده منتقل کنید. این عملیات تنها متادیتا را تغییر می‌دهد و به همین دلیل بسیار سریع و کارآمد است، حتی برای میلیون‌ها سطر.

برای مثال، اگر بخواهید داده‌های سال 2005 را از جدول اصلی حذف کنید، می‌توانید مراحل زیر را انجام دهید:
1. یک جدول staging (موقت) با طرح (schema) مشابه جدول پارتیشن‌بندی شده ایجاد کنید.
2. اطمینان حاصل کنید که جدول staging و پارتیشن مورد نظر قوانین و ایندکس‌های سازگار دارند.
3. با استفاده از `ALTER TABLE … SWITCH PARTITION`، داده‌های پارتیشن 2005 را به جدول staging منتقل کنید.


-- گام 1: ایجاد یک جدول Staging
CREATE TABLE Sales.SalesOrderDetail_2005_Staging
(
    SalesOrderID int NOT NULL,
    SalesOrderDetailID int NOT NULL,
    CarrierTrackingNumber nvarchar(25) NULL,
    OrderQty smallint NOT NULL,
    ProductID int NOT NULL,
    SpecialOfferID int NOT NULL,
    UnitPrice money NOT NULL,
    UnitPriceDiscount money NOT NULL,
    LineTotal numeric(38,6) NOT NULL,
    rowguid uniqueidentifier NOT NULL,
    ModifiedDate datetime NOT NULL,
    OrderDate datetime NOT NULL -- ستون پارتیشن‌بندی
) ON [2005FG]; -- مهم: جدول Staging باید روی فایل‌گروپی باشد که پارتیشن هدف روی آن است.
GO

-- گام 2: اضافه کردن Constraints به جدول Staging برای شبیه‌سازی مرزهای پارتیشن
ALTER TABLE Sales.SalesOrderDetail_2005_Staging
ADD CONSTRAINT CK_SalesOrderDetail_2005_Staging_OrderDate
CHECK (OrderDate >= '2005-01-01' AND OrderDate < '2006-01-01');
GO

-- گام 3: SWITCH کردن پارتیشن
ALTER TABLE Sales.SalesOrderDetail_Partitioned
SWITCH PARTITION 2 TO Sales.SalesOrderDetail_2005_Staging;
GO

پس از اجرای این دستورات، تمام سطرهای مربوط به سال 2005 از `Sales.SalesOrderDetail_Partitioned` به `Sales.SalesOrderDetail_2005_Staging` منتقل می‌شوند. سپس می‌توانید جدول staging را حذف یا آرشیو کنید.

جمع‌بندی
پارتیشن‌بندی در SQL Server ابزاری قدرتمند برای بهینه‌سازی عملکرد و مدیریت جداول و ایندکس‌های بزرگ است. با تقسیم منطقی داده‌ها به واحدهای کوچک‌تر و قابل مدیریت، می‌توانید عملیات نگهداری را کارآمدتر کنید، زمان داون‌تایم را کاهش دهید و زمان پاسخگویی کوئری‌ها را بهبود بخشید. برنامه‌ریزی دقیق برای تابع پارتیشن، طرح پارتیشن و مدیریت فایل‌گروپ‌ها کلید موفقیت در پیاده‌سازی پارتیشن‌بندی مؤثر است.