نرمال سازی پایگاه داده راهنمای کامل از 1NF تا 5NF و BCNF

راهنمای جامع نرمال سازی پایگاه داده: بهینه‌سازی و یکپارچگی داده

نرمال سازی پایگاه داده فرآیندی حیاتی در طراحی پایگاه داده رابطه‌ای است که هدف آن سازماندهی ستون‌ها و جداول یک پایگاه داده برای کاهش افزونگی داده‌ها و بهبود یکپارچگی داده‌ها است. این فرآیند داده‌ها را به چندین جدول تقسیم می‌کند و روابط بین آن‌ها را با کلیدهای اصلی و خارجی ایجاد می‌کند. درک نرمال‌سازی برای هر متخصص داده و توسعه‌دهنده پایگاه داده ضروری است، زیرا به ساخت پایگاه‌های داده کارآمدتر و قابل نگهداری‌تر کمک می‌کند.

چرا نرمال‌سازی اهمیت دارد؟ دلایل متعددی برای استفاده از نرمال‌سازی وجود دارد:

کاهش افزونگی داده (Data Redundancy): از تکرار داده‌ها جلوگیری می‌کند که منجر به صرفه‌جویی در فضای ذخیره‌سازی و کاهش احتمال بروز ناهماهنگی می‌شود.
بهبود یکپارچگی داده (Data Integrity): اطمینان حاصل می‌کند که داده‌ها منطقی و دقیق هستند. با حذف افزونگی، احتمال خطا در هنگام به‌روزرسانی، حذف یا درج داده‌ها به حداقل می‌رسد.
انعطاف‌پذیری پایگاه داده (Database Flexibility): طراحی نرمال شده، افزودن، حذف یا اصلاح داده‌ها را آسان‌تر می‌کند بدون اینکه بر سایر بخش‌های پایگاه داده تأثیر منفی بگذارد.
پرس و جوهای کارآمدتر (More Efficient Queries): اگرچه در برخی موارد نیاز به JOIN کردن چندین جدول وجود دارد، اما پایگاه داده‌های نرمال شده معمولاً خواندن و نگهداری آسان‌تری دارند.
کاهش ناهنجاری‌ها (Reduction of Anomalies): از ناهنجاری‌های درج (insertion anomaly)، حذف (deletion anomaly) و به‌روزرسانی (update anomaly) که در پایگاه‌های داده غیرنرمال شده رایج هستند، جلوگیری می‌کند.

اجازه دهید فرم‌های مختلف نرمال‌سازی را بررسی کنیم.

فرم نرمال اول (1NF)

یک جدول در فرم نرمال اول است اگر:
هر ستون دارای مقادیر اتمی باشد (یعنی نمی‌توان آن را به بخش‌های کوچک‌تر تقسیم کرد).
هیچ گروه تکرارشونده‌ای در سطرها وجود نداشته باشد. هر سطر باید دارای یک کلید اصلی منحصر به فرد باشد.

تصور کنید جدولی داریم که چندین محصول برای یک سفارش در یک فیلد یا چندین شماره تلفن در یک فیلد لیست شده است. این نقض 1NF است. برای مطابقت با 1NF، باید این مقادیر را به ستون‌ها یا جداول جداگانه تقسیم کنیم.

مثال نقض 1NF (قبل از نرمال‌سازی):


Orders (OrderID, OrderDate, CustomerID, CustomerName, ProductList)

در اینجا، `ProductList` می‌تواند شامل چندین محصول باشد. برای تبدیل به 1NF:


CREATE TABLE Orders (
    OrderID INT PRIMARY KEY,
    OrderDate DATE,
    CustomerID INT
);

CREATE TABLE OrderDetails (
    OrderDetailID INT PRIMARY KEY,
    OrderID INT FOREIGN KEY REFERENCES Orders(OrderID),
    ProductID INT,
    Quantity INT,
    UnitPrice DECIMAL(10,2)
);

در این ساختار، `OrderDetails` محصولات جداگانه برای هر سفارش را نگه می‌دارد و هر ستون دارای مقادیر اتمی است.

فرم نرمال دوم (2NF)

یک جدول در فرم نرمال دوم است اگر:
در فرم نرمال اول باشد.
هیچ وابستگی جزئی (partial dependency) وجود نداشته باشد. به این معنی که تمام ستون‌های غیرکلید باید به کلید اصلی کامل وابسته باشند، نه فقط به بخشی از آن. این قانون عمدتاً برای جداولی با کلید اصلی مرکب (composite primary key) کاربرد دارد.

برای مثال، جدولی مانند زیر را در نظر بگیرید:


Order (OrderID, ProductID, OrderDate, CustomerID, CustomerName, Quantity)

در این جدول، کلید اصلی مرکب است:

PRIMARY KEY (OrderID, ProductID)

وابستگی‌های تابعی در این جدول ممکن است شامل موارد زیر باشد:

OrderID, ProductID -> Quantity

این وابستگی کامل است، زیرا `Quantity` به کلید اصلی کامل (`OrderID, ProductID`) وابسته است.

OrderID -> OrderDate, CustomerID, CustomerName

این یک وابستگی جزئی است، زیرا `OrderDate`, `CustomerID` و `CustomerName` فقط به `OrderID` (بخشی از کلید اصلی) وابسته هستند، نه به کلید اصلی کامل. برای رفع این وابستگی جزئی و آوردن جدول به 2NF، اطلاعات مربوط به سفارش (Order) را از اطلاعات مربوط به جزئیات سفارش (Order Details) جدا می‌کنیم.

جدول‌های در 2NF:


CREATE TABLE Orders (
    OrderID INT PRIMARY KEY,
    OrderDate DATE,
    CustomerID INT
);

CREATE TABLE OrderDetails (
    OrderID INT,
    ProductID INT,
    Quantity INT,
    PRIMARY KEY (OrderID, ProductID),
    FOREIGN KEY (OrderID) REFERENCES Orders(OrderID)
);

اکنون `OrderDate` و `CustomerID` به طور کامل به `OrderID` در جدول `Orders` وابسته هستند و `Quantity` به طور کامل به `OrderID` و `ProductID` در جدول `OrderDetails` وابسته است.

فرم نرمال سوم (3NF)

یک جدول در فرم نرمال سوم است اگر:
در فرم نرمال دوم باشد.
هیچ وابستگی گذرا (transitive dependency) وجود نداشته باشد. یعنی هیچ ستون غیرکلیدی نباید به ستون غیرکلیدی دیگری وابسته باشد. اگر A -> B و B -> C باشد، وابستگی A -> C یک وابستگی گذرا است.

به جدول `Orders` که در 2NF بود، بازگردیم:


Orders (OrderID, OrderDate, CustomerID, CustomerName)

در اینجا `OrderID` کلید اصلی است. وابستگی‌ها را بررسی می‌کنیم:

OrderID -> OrderDate, CustomerID, CustomerName

اما ممکن است یک وابستگی دیگر نیز وجود داشته باشد:

CustomerID -> CustomerName

این یک وابستگی گذرا است، زیرا `CustomerName` به `CustomerID` (یک ستون غیرکلیدی) وابسته است و `CustomerID` به نوبه خود به `OrderID` (کلید اصلی) وابسته است. برای رفع این مشکل و رسیدن به 3NF، اطلاعات مشتری را به یک جدول جداگانه منتقل می‌کنیم.

جدول‌های در 3NF:


CREATE TABLE Orders (
    OrderID INT PRIMARY KEY,
    OrderDate DATE,
    CustomerID INT,
    FOREIGN KEY (CustomerID) REFERENCES Customers(CustomerID)
);

CREATE TABLE Customers (
    CustomerID INT PRIMARY KEY,
    CustomerName VARCHAR(255)
);

CREATE TABLE OrderDetails (
    OrderID INT,
    ProductID INT,
    Quantity INT,
    PRIMARY KEY (OrderID, ProductID),
    FOREIGN KEY (OrderID) REFERENCES Orders(OrderID)
);

اکنون `CustomerName` فقط در جدول `Customers` وجود دارد و به `CustomerID` (کلید اصلی آن جدول) وابسته است.

فرم نرمال بویز-کاد (BCNF)

BCNF نسخه‌ای سختگیرانه‌تر از 3NF است. یک جدول در BCNF است اگر:
در فرم نرمال سوم باشد.
هر تعیین‌کننده (determinant) یک کلید کاندید (candidate key) باشد. (یک تعیین‌کننده، هر ستونی است که مقدار یک ستون دیگر را مشخص می‌کند.)

BCNF تمام مشکلاتی را که 3NF حل می‌کند، حل می‌کند و همچنین موارد خاصی را که 3NF نتواند پوشش دهد، برطرف می‌کند. این فرم زمانی مفید است که یک جدول دارای چندین کلید کاندید مرکب همپوشانی‌دار باشد.

فرض کنید جدولی داریم که در آن دانشجویان، دوره‌ها و اساتید مشخص شده‌اند. هر دانشجو می‌تواند یک دوره را فقط با یک استاد بگذراند، اما یک استاد می‌تواند چندین دوره را تدریس کند.


Enrollment (StudentID, CourseID, ProfessorID)

در اینجا کلید اصلی `(StudentID, CourseID)` است. فرض کنید وابستگی زیر وجود دارد:

ProfessorID -> CourseID

این به این معنی است که یک استاد فقط می‌تواند یک دوره خاص را تدریس کند (سناریویی خاص). `ProfessorID` یک تعیین‌کننده است اما یک کلید کاندید نیست. این وضعیت BCNF را نقض می‌کند. برای رسیدن به BCNF باید این وابستگی را جدا کنیم.

فرم نرمال چهارم (4NF)

یک جدول در فرم نرمال چهارم است اگر:
در فرم نرمال بویز-کاد باشد.
هیچ وابستگی چند مقداری (multi-valued dependency – MVD) غیربدیهی وجود نداشته باشد. MVD زمانی اتفاق می‌افتد که چندین ستون غیرکلیدی مستقل از یکدیگر به بخشی از کلید اصلی وابسته باشند.

به عنوان مثال، فرض کنید یک جدول `Employee_Skills` داریم که مهارت‌ها و سرگرمی‌های هر کارمند را ذخیره می‌کند:


Employee_Skills (EmployeeID, Skill, Hobby)

در این جدول، `EmployeeID` کلید اصلی است. فرض کنید:

EmployeeID ->> Skill
EmployeeID ->> Hobby

این به معنای وابستگی چند مقداری است: یک کارمند می‌تواند چندین مهارت و چندین سرگرمی داشته باشد، و مجموعه مهارت‌ها از مجموعه سرگرمی‌ها مستقل است. برای تبدیل به 4NF، باید این دو وابستگی چند مقداری را به جداول جداگانه تقسیم کنیم:


CREATE TABLE Employee_Skills (
    EmployeeID INT,
    Skill VARCHAR(255),
    PRIMARY KEY (EmployeeID, Skill)
);

CREATE TABLE Employee_Hobbies (
    EmployeeID INT,
    Hobby VARCHAR(255),
    PRIMARY KEY (EmployeeID, Hobby)
);

فرم نرمال پنجم (5NF)

یک جدول در فرم نرمال پنجم است اگر:
در فرم نرمال چهارم باشد.
هیچ وابستگی پیوندی (join dependency) بدون ضرر (lossless join dependency) وجود نداشته باشد. به این معنی که اگر جدول را به جداول کوچک‌تر تجزیه کنید، نتوانید با JOIN کردن آن‌ها به طور کامل جدول اصلی را بدون از دست دادن اطلاعات یا تولید سطرهای تکراری بازیابی کنید.

این فرم کمتر رایج است و در اکثر سناریوهای عملی به ندرت به آن می‌رسند. وابستگی پیوندی به این صورت نمایش داده می‌شود:

R = R1 JOIN R2 JOIN … JOIN Rn

در اینجا `R` جدول اصلی است و `R1` تا `Rn` جداول تجزیه شده هستند. 5NF اطمینان حاصل می‌کند که هیچ اطلاعاتی در هنگام تجزیه از بین نمی‌رود.

غیرنرمال‌سازی (Denormalization)

در حالی که نرمال‌سازی برای یکپارچگی و کاهش افزونگی داده‌ها حیاتی است، گاهی اوقات برای بهبود عملکرد، به خصوص در سیستم‌های گزارش‌دهی یا انبارهای داده، نیاز به “غیرنرمال‌سازی” داریم. غیرنرمال‌سازی فرآیند اضافه کردن افزونگی عمدی به یک پایگاه داده است. این کار معمولاً شامل:
افزودن ستون‌های تکراری: برای کاهش JOINهای پیچیده.
ایجاد جداول summary/aggregation: برای گزارش‌گیری سریع.
ادغام جداول: که در حالت نرمال‌سازی شده جداگانه بودند.

تصمیم برای غیرنرمال‌سازی باید با دقت اتخاذ شود، زیرا می‌تواند منجر به افزایش افزونگی و خطر ناهماهنگی داده‌ها شود. این کار معمولاً زمانی انجام می‌شود که مزایای عملکردی آن بر معایب بالقوه غلبه کند.

نتیجه‌گیری

نرمال‌سازی ستون فقرات طراحی کارآمد و نگهداری‌پذیر پایگاه داده است. با رعایت فرم‌های نرمال، می‌توانیم از افزونگی داده‌ها جلوگیری کرده، یکپارچگی داده‌ها را تضمین کنیم و پایگاه‌های داده‌ای انعطاف‌پذیر و مقیاس‌پذیر بسازیم. درک هر فرم نرمال، از 1NF ساده گرفته تا 5NF پیچیده‌تر، به شما کمک می‌کند تا تصمیمات آگاهانه‌تری در مورد ساختار پایگاه داده خود بگیرید. با این حال، به یاد داشته باشید که نرمال‌سازی ۱۰۰٪ همیشه بهترین راه حل نیست و گاهی اوقات برای بهینه‌سازی عملکرد، غیرنرمال‌سازی هوشمندانه می‌تواند مفید باشد. انتخاب صحیح همیشه به نیازهای خاص و الزامات عملکردی پروژه شما بستگی دارد.

نرمال سازی پایگاه داده راهنمای کامل از 1NF تا 5NF و BCNF

راهنمای جامع نرمال سازی پایگاه داده: بهینه‌سازی و یکپارچگی داده

فرم نرمال اول (1NF)

فرم نرمال دوم (2NF)

فرم نرمال سوم (3NF)

فرم نرمال بویز-کاد (BCNF)

فرم نرمال چهارم (4NF)

فرم نرمال پنجم (5NF)

غیرنرمال‌سازی (Denormalization)

نتیجه‌گیری

Related Posts

انتقال دیتابیس ریپلیکیت شده SQL Server

بهینه‌سازی SQL Server با حذف Cursorها و جایگزین‌های کارآمد

۱۰ مفهوم کلیدی پایگاه داده model راهنمای جامع توسعه‌دهندگان

بهینه‌سازی کوئری SQL Server با SET ROWCOUNT و چالش‌های توابع جدولی TVF

رفع کمبود فضای دیسک در SQLServer

بهبود عملکرد SQL Server با Viewهای ایندکس دار Outer Join راهکار SUM جایگزین COUNT_BIG

آموزش جامع نصب و مدیریت SQLServer Linux