همکاری هوش مصنوعی با پایگاه داده راهنمای عملی LangChain و SQL Agent

همکاری هوش مصنوعی با پایگاه داده: راهنمای عملی LangChain و SQL Agent

در دنیای مدرن داده، توانایی هوش مصنوعی برای درک و تعامل با پایگاه‌های داده‌ای که اطلاعات حیاتی را در خود جای داده‌اند، به یک ضرورت تبدیل شده است. مدل‌های زبان بزرگ (LLM) در تولید متن و پاسخ به سوالات پیچیده عالی هستند، اما اتصال مستقیم آن‌ها به داده‌های ساختاریافته در دیتابیس‌ها چالش‌های خاص خود را دارد. اینجاست که چارچوب‌هایی مانند LangChain با ابزارهای قدرتمند خود وارد عمل می‌شوند تا این شکاف را پر کنند و به هوش مصنوعی اجازه دهند با دیتابیس شما “صحبت کند”.

چرا هوش مصنوعی به کمک برای تعامل با دیتابیس نیاز دارد؟

مدل‌های زبان بزرگ به طور پیش‌فرض برای کار با زبان طبیعی آموزش دیده‌اند، نه زبان پرس‌وجوی ساختاریافته مانند SQL. برای اینکه یک LLM بتواند داده‌ها را از یک پایگاه داده بازیابی، به‌روزرسانی یا تحلیل کند، باید بتواند:

1. ساختار پایگاه داده (جداول، ستون‌ها، روابط) را درک کند.
2. سوالات زبان طبیعی را به دستورات SQL دقیق و صحیح تبدیل کند.
3. دستورات SQL را اجرا کرده و نتایج را تفسیر کند.
4. پاسخ‌ها را به شکلی قابل درک برای کاربر نهایی ارائه دهد.

انجام این مراحل به صورت دستی پیچیده و مستعد خطا است، به همین دلیل نیاز به ابزارهای اتوماتیک‌سازی حیاتی است.

LangChain و عامل پایگاه داده SQL: پلی برای ارتباط

LangChain یک چارچوب قدرتمند است که توسعه برنامه‌های مبتنی بر مدل‌های زبان را آسان می‌کند. این چارچوب با ارائه مفهوم “عامل‌ها” (Agents) و “ابزارک‌ها” (Toolkits)، به LLM‌ها اجازه می‌دهد تا به منابع خارجی مانند پایگاه داده‌ها دسترسی پیدا کنند و وظایف پیچیده‌تری را انجام دهند. عامل پایگاه داده SQL (SQL Database Agent) یکی از این ابزارهای کلیدی است که به LLM امکان می‌دهد با پایگاه داده‌های رابطه‌ای (مانند SQLite, PostgreSQL, MySQL و SQL Server) تعامل کند.

نحوه کار عامل پایگاه داده SQL:

این عامل با استفاده از LLM، سوالات زبان طبیعی کاربر را دریافت می‌کند. سپس، با دسترسی به شمای پایگاه داده (اطلاعاتی در مورد ساختار جداول و ستون‌ها)، LLM یک توالی از “فکر کردن” و “عمل کردن” را آغاز می‌کند:
1. تفکر (Thought): LLM تعیین می‌کند که برای پاسخ به سوال، به چه اطلاعاتی از دیتابیس نیاز دارد.
2. عمل (Action): LLM ابزاری را از “ابزارک پایگاه داده SQL” (SQL Database Toolkit) انتخاب می‌کند (مثلاً ابزاری برای اجرای SQL یا ابزاری برای مشاهده شمای جدول).
3. مشاهده (Observation): LLM نتیجه اجرای ابزار را مشاهده می‌کند (مثلاً نتیجه یک کوئری SQL یا شمای جدول).
4. تکرار: این فرآیند تا زمانی که LLM به یک پاسخ جامع برسد، تکرار می‌شود.

در نهایت، عامل یک کوئری SQL مناسب تولید و اجرا می‌کند، نتیجه را دریافت و آن را به زبانی طبیعی برای کاربر توضیح می‌دهد.

راه‌اندازی محیط و اتصال به پایگاه داده

برای شروع، شما به یک کلید API از یک ارائه‌دهنده LLM مانند OpenAI و نصب کتابخانه‌های لازم نیاز دارید.

برای نصب کتابخانه‌ها، دستورات زیر را اجرا کنید:


pip install langchain openai sqlalchemy "python-dotenv>=1.0.0"

اگر از یک پایگاه داده خاص استفاده می‌کنید (مثلاً PostgreSQL)، درایور آن را نیز نصب کنید. برای این مثال از SQLite استفاده می‌کنیم که نیازی به درایور اضافی ندارد.

پس از نصب، کلید API خود را تنظیم کنید. توصیه می‌شود این کار را از طریق متغیرهای محیطی انجام دهید:


import os
# os.environ["OPENAI_API_KEY"] = "YOUR_API_KEY"
# یا از فایل .env برای مدیریت کلیدها استفاده کنید:
# from dotenv import load_dotenv
# load_dotenv()

برای شروع، یک پایگاه داده نمونه SQLite ایجاد می‌کنیم تا بتوانیم روی آن عملیات انجام دهیم. این پایگاه داده شامل دو جدول `artists` و `albums` است.


import sqlite3

conn = sqlite3.connect('chinook.db')
cursor = conn.cursor()

cursor.execute('''
    CREATE TABLE IF NOT EXISTS artists (
        artist_id INTEGER PRIMARY KEY,
        name TEXT NOT NULL
    )
''')
cursor.execute('''
    CREATE TABLE IF NOT EXISTS albums (
        album_id INTEGER PRIMARY KEY,
        title TEXT NOT NULL,
        artist_id INTEGER,
        FOREIGN KEY (artist_id) REFERENCES artists(artist_id)
    )
''')

cursor.execute("INSERT INTO artists (artist_id, name) VALUES (1, 'Queen')")
cursor.execute("INSERT INTO artists (artist_id, name) VALUES (2, 'The Beatles')")
cursor.execute("INSERT INTO artists (artist_id, name) VALUES (3, 'Led Zeppelin')")

cursor.execute("INSERT INTO albums (album_id, title, artist_id) VALUES (101, 'A Night at the Opera', 1)")
cursor.execute("INSERT INTO albums (album_id, title, artist_id) VALUES (102, 'Bohemian Rhapsody', 1)")
cursor.execute("INSERT INTO albums (album_id, title, artist_id) VALUES (103, 'Abbey Road', 2)")
cursor.execute("INSERT INTO albums (album_id, title, artist_id) VALUES (104, 'Led Zeppelin IV', 3)")
cursor.execute("INSERT INTO albums (album_id, title, artist_id) VALUES (105, 'The White Album', 2)")

conn.commit()
conn.close()

حال که پایگاه داده نمونه ما آماده است، می‌توانیم آن را به LangChain متصل کنیم. از کلاس `SQLDatabase` برای ایجاد یک شیء اتصال به پایگاه داده استفاده می‌شود.


from langchain.utilities import SQLDatabase
from langchain_openai import ChatOpenAI
from langchain.agents import AgentExecutor, create_sql_agent
from langchain.agents.agent_toolkits import SQLDatabaseToolkit

db = SQLDatabase.from_uri("sqlite:///chinook.db")
llm = ChatOpenAI(temperature=0, model="gpt-4")

در خط بالا، `SQLDatabase.from_uri(“sqlite:///chinook.db”)` یک اتصال به پایگاه داده SQLite با نام `chinook.db` ایجاد می‌کند. همچنین، `ChatOpenAI` مدل LLM مورد استفاده ما را با `temperature=0` (برای پاسخ‌های دقیق‌تر و کمتر خلاقانه) و مدل `gpt-4` (یا `gpt-3.5-turbo` برای سرعت بیشتر و هزینه کمتر) مقداردهی اولیه می‌کند.

ساخت عامل SQL و اجرای پرس‌وجوها

با آماده‌سازی اتصال به پایگاه داده و LLM، اکنون می‌توانیم عامل SQL را بسازیم. `SQLDatabaseToolkit` مجموعه‌ای از ابزارها را فراهم می‌کند که عامل برای تعامل با پایگاه داده به آن‌ها نیاز دارد.


toolkit = SQLDatabaseToolkit(db=db, llm=llm)
agent_executor = create_sql_agent(
    llm=llm,
    toolkit=toolkit,
    verbose=True
)

`create_sql_agent` یک شیء `AgentExecutor` را برمی‌گرداند که عامل اصلی ما برای اجرای پرس‌وجوهاست. پارامتر `verbose=True` به ما اجازه می‌دهد تا فرآیند تفکر و عمل عامل را در کنسول مشاهده کنیم که برای اشکال‌زدایی و درک چگونگی رسیدن عامل به پاسخ بسیار مفید است.

حالا می‌توانید سوالات خود را به زبان طبیعی از عامل بپرسید:

می‌خواهیم بدانیم که چند هنرمند در پایگاه داده ما ثبت شده‌اند:


print(agent_executor.run("How many artists are there?"))

این دستور از عامل می‌پرسد “چند هنرمند وجود دارد؟” و عامل با تبدیل این سوال به یک کوئری SQL (مانند `SELECT COUNT() FROM artists;`)، اجرای آن و سپس ارائه پاسخ به زبان طبیعی، به شما پاسخ می‌دهد.

حالا سوالی پیچیده‌تر می‌پرسیم، مثلاً “آلبوم‌های گروه Queen را لیست کن”:


print(agent_executor.run("List all albums by Queen."))

عامل این سوال را به کوئری SQL مناسب ترجمه می‌کند که شامل JOIN بین جداول `artists` و `albums` است، آن را اجرا می‌کند و نتایج را به شکلی خوانا برمی‌گرداند.

ملاحظات پیشرفته و امنیتی

امنیت (Security): هنگام اتصال هوش مصنوعی به پایگاه داده، امنیت از اهمیت بالایی برخوردار است. اطمینان حاصل کنید که LLM به حداقل امتیازات لازم برای انجام وظایف خود دسترسی دارد (اصل حداقل دسترسی). همچنین، محافظت در برابر حملات SQL Injection با استفاده از پارامترسازی کوئری‌ها در ابزارهای زیربنایی ضروری است. LangChain به طور پیش‌فرض این موارد را مدیریت می‌کند، اما هوشیاری در استفاده از LLM‌ها برای تولید کوئری همچنان مهم است.
عملکرد (Performance): برای پایگاه داده‌های بزرگ، کوئری‌های تولید شده توسط LLM ممکن است همیشه بهینه‌ترین نباشند. نظارت بر عملکرد و در صورت لزوم، بهینه‌سازی دستی کوئری‌ها یا راهنمایی LLM از طریق ابزارهای سفارشی می‌تواند مفید باشد.
خطاها و اعتبارسنجی (Error Handling and Validation): عامل ممکن است گاهی اوقات کوئری‌های SQL نامعتبر تولید کند. پیاده‌سازی مکانیزم‌های قوی برای مدیریت خطاها و اعتبارسنجی خروجی‌ها قبل از اجرای آن‌ها در پایگاه داده تولیدی حیاتی است.
ابزارهای سفارشی (Custom Tools): LangChain به شما اجازه می‌دهد تا ابزارهای سفارشی خود را تعریف کنید. این ویژگی برای افزودن منطق تجاری خاص یا محدود کردن دسترسی عامل به بخش‌های خاصی از پایگاه داده مفید است.

نتیجه‌گیری

توانایی هوش مصنوعی برای تعامل مستقیم و هوشمندانه با پایگاه‌های داده، فرصت‌های بی‌نظیری را برای اتوماسیون و تحلیل داده‌ها فراهم می‌کند. با استفاده از چارچوب‌هایی مانند LangChain و عامل پایگاه داده SQL، می‌توانیم برنامه‌هایی بسازیم که به کاربران اجازه می‌دهند با استفاده از زبان طبیعی به داده‌های خود دسترسی پیدا کرده و آن‌ها را دستکاری کنند، که این امر به دموکراتیزه شدن دسترسی به اطلاعات کمک شایانی می‌کند. این فناوری نه تنها کارایی را افزایش می‌دهد، بلکه تجربه کاربری را نیز متحول می‌سازد.

همکاری هوش مصنوعی با پایگاه داده راهنمای عملی LangChain و SQL Agent