درون ChatGPT: نحوه عملکرد چت‌بات‌های هوش مصنوعی

نحوه عملکرد ChatGPT

مقدمه: انقلابی به نام ChatGPT

مدل‌های زبانی بزرگ مانند ChatGPT از مجموعه‌ای پیچیده از معادلات برای درک و پاسخ به درخواست‌های شما استفاده می‌کنند. این سیستم‌ها توانسته‌اند در آزمون‌های مدرسه کسب‌وکار قبول شوند، معلمان را در تشخیص تقلب گیج کنند و به افراد در نوشتن ایمیل‌های کاری و شخصی کمک کنند.

اما نکته جالب اینجاست که دقت در پاسخ‌دهی هدف اصلی ChatGPT نیست، بلکه این دقت بیشتر یک محصول جانبی از هدف اصلی آن یعنی تولید متن طبیعی و انسانی است.

در این مقاله قصد داریم نحوه عملکرد ChatGPT را به زبانی ساده بیاموزیم.

فناوری پشت پرده مدل‌های زبانی بزرگ

فناوری مورد استفاده در مدل‌هایی مانند ChatGPT شبیه به پیش‌بینی متن در تلفن همراه شماست. وقتی در حال تایپ پیامی هستید، تلفن شما با بررسی متن تایپ شده و الگوهای یادگرفته از رفتارهای قبلی شما، احتمالات بعدی را محاسبه می‌کند.

اما برخلاف سیستم پیش‌بینی متن تلفن، ChatGPT یک مدل تولیدی (Generative) است. این مدل نه تنها یک پیش‌بینی واحد انجام می‌دهد، بلکه می‌تواند رشته‌های متنی معنادار در چندین جمله و پاراگراف تولید کند.

چگونه ChatGPT کلمات را انتخاب می‌کند؟

درون این سیستم هیچ پایگاه داده یا فرهنگ لغتی برای “درک” کلمات وجود ندارد. در عوض، کلمات به صورت ریاضی و به عنوان مجموعه‌ای از مقادیر پردازش می‌شوند. این مقادیر می‌توانند ویژگی‌های مختلف کلمه را نشان دهند، مثلاً:
– آیا کلمه مثبت است یا منفی؟
– شیرین است یا تلخ؟
– پایین است یا بالا؟

این تکنیک که تعبیه کلمه (Word Embedding) نام دارد، از دهه ۱۹۵۰ در زبان‌شناسی استفاده می‌شده است. در مدل‌های زبانی بزرگ، هر کلمه با صدها ویژگی نمایش داده می‌شود که دقت بالایی در شناسایی کلمات ایجاد می‌کند.

فرآیند آموزش مدل

وقتی مدل جدید است، ویژگی‌های مرتبط با هر کلمه به صورت تصادفی تنظیم می‌شوند. برای بهبود این تنظیمات، مدل باید روی حجم عظیمی از داده آموزش ببیند. اینجاست که بخش “بزرگ” در مدل زبانی بزرگ معنا پیدا می‌کند.

یک سیستم مانند ChatGPT ممکن است روی میلیون‌ها صفحه وب و اسناد دیجیتال آموزش ببیند (مثل ویکی‌پدیا، سایت‌های خبری بزرگ، وبلاگ‌ها و کتاب‌های دیجیتال). مدل با بررسی این داده‌ها، کلمات را پیش‌بینی و تنظیمات خود را اصلاح می‌کند.

زمان و هزینه آموزش

– آموزش مدل GPT-3 (نسخه قبلی ChatGPT) با استفاده از ۱,۰۲۴ واحد پردازش گرافیکی، حدود ۳۴ روز زمان برده است.
– هزینه منابع محاسباتی برای آموزش و اجرای مدل‌های زبانی بزرگ ممکن است به میلیون‌ها دلار برسد.

آموزش اضافی: یادگیری تقویتی از بازخورد انسانی

ChatGPT یک لایه آموزش اضافی دارد که یادگیری تقویتی از بازخورد انسانی نامیده می‌شود. در این مرحله، افراد پاسخ‌های مدل را ارزیابی و موارد نادرست یا بی‌ربط را علامت‌گذاری می‌کنند. این بازخوردها به مدل کمک می‌کنند تا پاسخ‌هایی منسجم، دقیق و مکالمه‌ای تولید کند.

محدودیت‌های ChatGPT

عدم تضمین دقت: این ابزارها برای مواقعی که به دقت بالا نیاز دارید، توصیه نمی‌شوند.
تاریخ قطع دانش: برخی مدل‌ها مانند ChatGPT به اینترنت متصل نیستند و اطلاعات جدید را یاد نمی‌گیرند.
وابستگی به داده‌های آموزشی: اگر داده‌های آموزشی حاوی مطالب خطرناک یا نژادپرستانه باشند، مدل نیز این الگوها را یاد می‌گیرد.

کاربردهای مفید ChatGPT

– نوشتن نامه‌های cover
– خلاصه‌نویسی جلسات
– برنامه‌ریزی وعده‌های غذایی

سوال بزرگ آینده

آیا پیشرفت‌های آینده می‌توانند بر برخی از نقاط ضعف این فناوری غلبه کنند و آن را به ابزاری واقعاً قابل اعتماد تبدیل کنند؟

 

منبع: https://www.nbcnews.com/data-graphics/chat-gpt-artificial-intelligence-how-chatbot-work-rcna83266

دیدگاه‌ها

آدرس ایمیل شما منتشر نخواهد شد. فیلدهای ضروری علامت گذاری شده اند.