بهبود دقت مدلهای زبانی بزرگ (LLM) با سیستم CodeSteer
پژوهشگران امآیتی (MIT) سیستمی به نام CodeSteer توسعه دادهاند که به عنوان یک کوچ هوشمند مدلهای زبانی عمل میکند و به آنها کمک میکند تا بین تولید متن و تولید کد بهینه سوئیچ کنند. این سیستم دقت مدلها را در حل مسائل پیچیده مانند برنامهریزی زنجیره تأمین یا مسیریابی رباتها تا ۳۰٪ افزایش میدهد.
چرا مدلهای زبانی در حل مسائل محاسباتی ضعیف هستند؟
مدلهای زبانی بزرگ (LLM) مانند ChatGPT و Claude در درک و پردازش زبان طبیعی عالی عمل میکنند، اما اغلب در حل حتی سادهترین مسائل ریاضی یا نمادین (Symbolic) دچار خطا میشوند. دلیل این ضعف، تکیهی بیشازحد این مدلها به استدلال متنی است، درحالیکه بسیاری از مسائل با کدنویسی (مثلاً پایتون) بهتر حل میشوند.
راهحل: سیستم CodeSteer به عنوان کوچ هوشمند
CodeSteer یک مدل زبانی کوچکتر است که به عنوان مربی هوشمند برای مدلهای بزرگتر عمل میکند. عملکرد آن به این صورت است:
1. تشخیص روش بهینه (متن یا کد) برای حل مسئله
2. هدایت مدل اصلی به سمت تولید کد یا متن مناسب
3. بررسی پاسخها و اصلاح خطاها با تکرار فرآیند
این سیستم نهتنها دقت مدلها را افزایش میدهد، بلکه حتی مدلهای سادهتر را قادر میسازد از مدلهای پیشرفتهتر پیشی بگیرند.
کاربردهای عملی CodeSteer
– بهینهسازی زنجیره تأمین (مانند زمانبندی حملونقل کالا)
– مسیریابی رباتها در محیطهای پویا
– حل مسائل پیچیده ریاضی و منطقی (مانند سودوکو)
– افزایش کارایی مدلهای هوش مصنوعی بدون نیاز به آموزش مجدد
آینده سیستمهای کوچ هوشمند برای LLMها
پژوهشگران امآیتی در حال کار روی بهینهسازی فرآیند تکرار در CodeSteer هستند تا سرعت آن را افزایش دهند. همچنین، آنها به دنبال ادغام قابلیت سوئیچ بین متن و کد در یک مدل واحد هستند تا نیاز به سیستم جداگانه کاهش یابد.
جینسونگ یون، پژوهشگر هوش مصنوعی گوگل، درباره این سیستم میگوید:
“این راهحل ساده اما تأثیرگذار، عملکرد مدلهای زبانی را در کاربردهای واقعی بهطور چشمگیری بهبود میبخشد.”
چی وانگ از دیپمایند گوگل نیز اضافه میکند:
“همکاری هوشمندانه بین مدلهای مختلف هوش مصنوعی، راه را برای حل مسائل پیچیدهتر در دنیای واقعی باز میکند.”
این پژوهش با حمایت آزمایشگاه هوش مصنوعی MIT-IBM و دفتر تحقیقات نیروی دریایی آمریکا انجام شده است.
منبع: https://news.mit.edu/2025/smart-coach-helps-llms-switch-between-text-and-code-0717

