مقایسه عملکرد JSON و XML در SQL Server انتخاب بهینه

مقایسه عملکرد JSON و XML در SQL Server: کدام یک برای پایگاه داده شما بهینه‌تر است؟

در دنیای امروز داده‌ها که به سرعت در حال تغییر است، انتخاب فرمت مناسب برای ذخیره‌سازی و پردازش اطلاعات در SQL Server می‌تواند تأثیر چشمگیری بر عملکرد کلی سیستم شما داشته باشد. در این مقاله به بررسی عمیق و مقایسه عملکرد دو فرمت محبوب، JSON و XML، در سناریوهای مختلف پایگاه داده SQL Server می‌پردازیم. با ما همراه باشید تا دریابید کدام فرمت برای نیازهای شما مناسب‌تر است و چگونه می‌توانید عملکرد پایگاه داده خود را بهینه‌سازی کنید.

در طول سال‌ها، توسعه‌دهندگان و مدیران پایگاه داده به طور فزاینده‌ای به سمت فرمت‌های داده‌ای منعطف‌تر مانند XML و به تازگی JSON روی آورده‌اند تا ساختارهای داده پیچیده را در پایگاه داده‌های رابطه‌ای ذخیره و مدیریت کنند. SQL Server از هر دو فرمت پشتیبانی قوی می‌کند، اما دانستن تفاوت‌های عملکردی آن‌ها برای تصمیم‌گیری آگاهانه ضروری است.

**راه‌اندازی و داده‌های آزمایشی**

برای مقایسه دقیق عملکرد، ابتدا یک پایگاه داده آزمایشی ایجاد کرده و دو جدول مشابه برای ذخیره‌سازی داده‌های JSON و XML آماده می‌کنیم. این رویکرد به ما امکان می‌دهد تا تأثیر مستقیم هر فرمت بر عملیات مختلف را مشاهده کنیم.

برای ایجاد پایگاه داده و جداول، کدهای زیر را اجرا کنید:


USE master;
GO
DROP DATABASE IF EXISTS JSONXMLTestDB;
GO
CREATE DATABASE JSONXMLTestDB;
GO
USE JSONXMLTestDB;
GO

سپس، جداول `CustomersJSON` برای داده‌های JSON و `CustomersXML` برای داده‌های XML را ایجاد می‌کنیم. این جداول ساختاری ساده دارند که شامل یک شناسه مشتری (CustomerID) و یک ستون برای ذخیره‌سازی داده‌های مربوط به مشتری (CustomerData) است.


CREATE TABLE dbo.CustomersJSON (
    CustomerID INT IDENTITY(1,1) PRIMARY KEY,
    CustomerData NVARCHAR(MAX)
);

CREATE TABLE dbo.CustomersXML (
    CustomerID INT IDENTITY(1,1) PRIMARY KEY,
    CustomerData XML
);

حال، داده‌های نمونه را برای هر دو جدول ایجاد می‌کنیم. این داده‌ها شامل اطلاعات سفارش مشتریان مانند `OrderID`، `ProductName`، `Quantity` و `Price` هستند که به ترتیب در فرمت‌های JSON و XML ذخیره می‌شوند. تعداد ۱۰۰۰۰ ردیف داده برای هر جدول تولید می‌شود تا بتوانیم عملکرد را در مقیاس مناسبی ارزیابی کنیم.

برای تولید داده‌های JSON، از اسکریپت زیر استفاده می‌کنیم:


INSERT INTO dbo.CustomersJSON (CustomerData)
SELECT (
    SELECT
        NEWID() AS OrderID,
        CONCAT('Product', ABS(CHECKSUM(NEWID())) % 100) AS ProductName,
        ABS(CHECKSUM(NEWID())) % 100 + 1 AS Quantity,
        CAST(RAND(CHECKSUM(NEWID())) * 1000 AS DECIMAL(10,2)) AS Price
    FOR JSON PATH, WITHOUT_ARRAY_WRAPPER
)
FROM sys.all_objects AS a
CROSS JOIN sys.all_objects AS b
WHERE a.object_id < 100 AND b.object_id < 100; -- Generates 100*100 = 10,000 rows

برای تولید داده‌های XML، اسکریپت زیر را اجرا می‌کنیم:


INSERT INTO dbo.CustomersXML (CustomerData)
SELECT (
    SELECT
        NEWID() AS OrderID,
        CONCAT('Product', ABS(CHECKSUM(NEWID())) % 100) AS ProductName,
        ABS(CHECKSUM(NEWID())) % 100 + 1 AS Quantity,
        CAST(RAND(CHECKSUM(NEWID())) * 1000 AS DECIMAL(10,2)) AS Price
    FOR XML PATH('Order'), ROOT('CustomerOrders'), TYPE
)
FROM sys.all_objects AS a
CROSS JOIN sys.all_objects AS b
WHERE a.object_id < 100 AND b.object_id < 100; -- Generates 10,000 rows

**تست عملکرد – عملیات خواندن (Read Operations)**

یکی از مهم‌ترین جنبه‌های عملکرد پایگاه داده، سرعت بازیابی داده‌ها است. در این بخش، کوئری‌های خواندن را برای هر دو فرمت اجرا می‌کنیم تا ببینیم کدام یک در استخراج اطلاعات خاص، سریع‌تر عمل می‌کند. از `SET STATISTICS IO ON` و `SET STATISTICS TIME ON` برای اندازه‌گیری منابع مصرفی و زمان اجرا استفاده می‌کنیم.

برای خواندن داده‌ها از جدول JSON (برای آیتم‌هایی با `Quantity` بیشتر از ۵۰)، از کوئری زیر استفاده می‌شود:


SET STATISTICS IO ON;
SET STATISTICS TIME ON;
SELECT
    JSON_VALUE(CustomerData, '$.OrderID') AS OrderID,
    JSON_VALUE(CustomerData, '$.ProductName') AS ProductName,
    JSON_VALUE(CustomerData, '$.Quantity') AS Quantity,
    JSON_VALUE(CustomerData, '$.Price') AS Price
FROM dbo.CustomersJSON
WHERE JSON_VALUE(CustomerData, '$.Quantity') > 50;
SET STATISTICS IO OFF;
SET STATISTICS TIME OFF;

و برای خواندن داده‌ها از جدول XML (با همان شرط `Quantity` بیشتر از ۵۰)، از کوئری زیر استفاده می‌کنیم:


SET STATISTICS IO ON;
SET STATISTICS TIME ON;
SELECT
    T.c.value('(OrderID)[1]', 'UNIQUEIDENTIFIER') AS OrderID,
    T.c.value('(ProductName)[1]', 'NVARCHAR(100)') AS ProductName,
    T.c.value('(Quantity)[1]', 'INT') AS Quantity,
    T.c.value('(Price)[1]', 'DECIMAL(10,2)') AS Price
FROM dbo.CustomersXML
CROSS APPLY CustomerData.nodes('/CustomerOrders/Order') AS T(c)
WHERE T.c.value('(Quantity)[1]', 'INT') > 50;
SET STATISTICS IO OFF;
SET STATISTICS TIME OFF;

در تست‌های ما، عملیات خواندن JSON معمولاً سریع‌تر از XML است. این امر به دلیل توابع بومی و بهینه‌سازی شده SQL Server برای تجزیه JSON است که پیچیدگی کمتری نسبت به متدهای `XQuery` برای XML دارد.

**تست عملکرد – عملیات نوشتن (Write Operations)**

سرعت درج داده‌های جدید نیز برای بسیاری از برنامه‌ها حیاتی است. در این بخش، عملکرد درج یک ردیف داده جدید را برای هر دو فرمت بررسی می‌کنیم.

برای درج یک ردیف جدید در جدول JSON، از این کوئری استفاده کنید:


SET STATISTICS IO ON;
SET STATISTICS TIME ON;
INSERT INTO dbo.CustomersJSON (CustomerData)
VALUES (N'{"OrderID": "C8765432-ABCD-EFGH-1234-567890ABCDEF", "ProductName": "Widget", "Quantity": 15, "Price": 123.45}');
SET STATISTICS IO OFF;
SET STATISTICS TIME OFF;

و برای درج یک ردیف جدید در جدول XML، کوئری زیر را اجرا کنید:


SET STATISTICS IO ON;
SET STATISTICS TIME ON;
INSERT INTO dbo.CustomersXML (CustomerData)
VALUES (N'C8765432-ABCD-EFGH-1234-567890ABCDEFWidget15123.45');
SET STATISTICS IO OFF;
SET STATISTICS TIME OFF;

در عملیات نوشتن، JSON اغلب عملکردی مشابه یا کمی بهتر از XML از خود نشان می‌دهد. ساختار ساده‌تر JSON و عدم نیاز به بررسی‌های پیچیده Schema (که در XML رایج است) می‌تواند به این امر کمک کند.

**تست عملکرد – عملیات به‌روزرسانی (Update Operations)**

به‌روزرسانی داده‌ها در فرمت‌های نیمه‌ساخت‌یافته می‌تواند چالش‌برانگیز باشد. در این بخش، نحوه به‌روزرسانی یک فیلد خاص را در هر دو فرمت ارزیابی می‌کنیم.

برای به‌روزرسانی قیمت یک محصول خاص (مثلاً ‘Product50’) در جدول JSON:


SET STATISTICS IO ON;
SET STATISTICS TIME ON;
UPDATE dbo.CustomersJSON
SET CustomerData = JSON_MODIFY(CustomerData, '$.Price', 999.99)
WHERE JSON_VALUE(CustomerData, '$.ProductName') = 'Product50';
SET STATISTICS IO OFF;
SET STATISTICS TIME OFF;

برای به‌روزرسانی قیمت همان محصول در جدول XML:


SET STATISTICS IO ON;
SET STATISTICS TIME ON;
UPDATE dbo.CustomersXML
SET CustomerData.modify('replace value of (/CustomerOrders/Order/Price/text())[1] with 999.99')
WHERE CustomerData.exist('/CustomerOrders/Order[ProductName="Product50"]') = 1;
SET STATISTICS IO OFF;
SET STATISTICS TIME OFF;

عملیات به‌روزرسانی در XML می‌تواند به دلیل پیچیدگی `XQuery` و متدهای `modify()` به طور قابل توجهی کندتر باشد. JSON با استفاده از تابع `JSON_MODIFY()` که به طور مستقیم روی متن JSON کار می‌کند، اغلب کارآمدتر است.

**اندازه ذخیره‌سازی داده (Data Storage Size)**

میزان فضای ذخیره‌سازی مورد نیاز نیز یک فاکتور مهم در مدیریت پایگاه داده است. معمولاً JSON به دلیل نحو فشرده‌تر و عدم نیاز به تگ‌های پایانی مکرر (که در XML رایج است) حجم کمتری را اشغال می‌کند.

برای بررسی حجم داده‌های JSON بر حسب مگابایت، کوئری زیر را اجرا کنید:


SELECT SUM(DATALENGTH(CustomerData)) / 1024.0 / 1024.0 AS JSON_Data_Size_MB
FROM dbo.CustomersJSON;

برای بررسی حجم داده‌های XML بر حسب مگابایت، کوئری زیر را اجرا کنید:


SELECT SUM(DATALENGTH(CustomerData)) / 1024.0 / 1024.0 AS XML_Data_Size_MB
FROM dbo.CustomersXML;

در اکثر سناریوها، داده‌های JSON به طور قابل توجهی فشرده‌تر از XML ذخیره می‌شوند که به کاهش فضای دیسک و بهبود عملکرد I/O کمک می‌کند.

**نتیجه‌گیری**

با توجه به تست‌های عملکردی انجام شده، JSON در SQL Server معمولاً برتری‌هایی در سرعت خواندن، نوشتن و به‌روزرسانی داده‌ها نسبت به XML دارد. علاوه بر این، JSON حجم ذخیره‌سازی کمتری را اشغال می‌کند که می‌تواند در محیط‌های بزرگ داده، به صرفه‌جویی در منابع کمک کند.

SQL Server از سال ۲۰۱۶ به بعد پشتیبانی بومی و قدرتمندی از JSON ارائه می‌دهد که آن را به یک انتخاب جذاب برای توسعه‌دهندگان تبدیل کرده است. سادگی، خوانایی و تطابق با استانداردهای وب مدرن، JSON را به گزینه‌ای ایده‌آل برای اکثر پروژه‌های جدید تبدیل می‌کند. در حالی که XML هنوز کاربردهای خاص خود را دارد (به ویژه در سیستم‌های قدیمی‌تر یا در مواردی که به اعتبارسنجی Schema دقیق نیاز است)، برای اکثر سناریوهای جدید توسعه و بهینه‌سازی عملکرد در SQL Server، استفاده از JSON توصیه می‌شود.

برای بهینه‌سازی بیشتر عملکرد، اطمینان حاصل کنید که از آخرین نسخه‌های SQL Server استفاده می‌کنید و از ایندکس‌های مناسب (از جمله ایندکس‌های Full-Text برای جستجو در متن JSON/XML) بهره می‌برید. با انتخاب صحیح فرمت داده و به‌کارگیری بهترین شیوه‌ها، می‌توانید سرعت و کارایی پایگاه داده خود را به میزان قابل توجهی افزایش دهید.

من علی دستجردی‌ام؛ عاشق کار با دیتا، از SQL Server تا بیگ‌دیتا و هوش مصنوعی. دغدغه‌ام کشف ارزش داده‌ها و به‌اشتراک‌گذاری تجربه‌هاست. ✦ رزومه من: alidastjerdi.com ✦

عضویت
منو باخبر کن!!!
guest
نام
ایمیل

0 دیدگاه
Inline Feedbacks
دیدن تمامی کامنتها

فوتر سایت

ورود به سایت

sqlyar

هنوز عضو نیستید؟

ورود به سایت

هنوز تبت نام نکردید ؟