آینده هوش مصنوعی؛ گذر از مدل‌های زبانی به مدل‌های رفتاری

هوش مصنوعی مسیری طولانی را پیموده و مدل‌های زبانی بزرگ (LLMs) قابلیت‌های چشمگیری را در پردازش زبان طبیعی به نمایش گذاشته‌اند. این مدل‌ها طرز تفکر ما را درباره توانایی هوش مصنوعی در درک و تولید زبان انسانی تغییر داده‌اند. هرچند مدل‌های مذکور در شناسایی الگوها و ترکیب دانش مکتوب بسیار مؤثرند، اما در تقلید از شیوه یادگیری و رفتار انسان‌ها ناتوان هستند. با ادامه تکامل هوش مصنوعی، شاهد انتقالی از مدل‌های صرفاً پردازش کننده اطلاعات به مدل‌هایی هستیم که همچون انسان‌ها یاد می‌گیرند، سازگار می‌شوند و رفتار می‌کنند.
مدل‌های رفتاری بزرگ (LBMs) به‌عنوان یک مرز جدید در هوش مصنوعی ظاهر شده‌اند. این مدل‌ها از زبان فراتر رفته و بر شبیه‌سازی نحوه تعامل انسان‌ها با جهان متمرکز هستند. برخلاف مدل‌های زبانی بزرگ که عمدتاً با داده‌های ایستا آموزش می‌بینند، مدل‌های رفتاری بزرگ از طریق تجربه به‌صورت پیوسته یاد می‌گیرند و این امر به آن‌ها اجازه می‌دهد تا در شرایط پویا و واقعی تطبیق یابند و استدلال کنند. مدل‌های رفتاری بزرگ با ایجاد توانایی برای ماشین‌ها در یادگیری مشابه انسان‌ها، آینده هوش مصنوعی را شکل می‌دهند.
چرا هوش مصنوعی رفتاری مهم است؟
مدل‌های زبانی بزرگ قدرت بی‌نظیری از خود نشان داده‌اند، اما توانایی آن‌ها به‌طور ذاتی به داده‌های آموزشی وابسته است. این مدل‌ها تنها قادر به انجام وظایفی هستند که با الگوهای آموخته‌شده مطابقت دارد. این مدل‌ها درحالی‌که در انجام وظایف ایستا برتری دارند، با محیط‌های پویایی که نیاز به تصمیم‌گیری آنی یا یادگیری از تجربه دارند، ضعیف عمل می‌کنند.
علاوه بر این، مدل‌های زبانی عمدتاً بر پردازش زبان تمرکز دارند. آن‌ها نمی‌توانند اطلاعات غیرزبانی مانند نشانه‌های بصری، احساسات فیزیکی یا تعاملات اجتماعی را پردازش کنند؛ عناصری که برای درک و واکنش به جهان ضروری هستند. این محدودیت به‌ویژه در مواردی مانند تفسیر زمینه‌های پیچیده بصری یا اجتماعی که نیاز به استدلال چندوجهی دارند، آشکار می‌شود.در مقابل، انسان‌ها یادگیرندگان همیشگی هستند. ما از دوران کودکی، با محیط تعامل می‌کنیم، ایده‌های جدید را آزمایش کرده و به شرایط غیرمنتظره واکنش نشان می‌دهیم. یادگیری انسانی در سازگاری و کارایی خود بی‌نظیر است. برخلاف ماشین‌ها، ما نیازی به تجربه تمام سناریوهای ممکن برای تصمیم‌گیری نداریم. بلکه از تجربیات گذشته خود استنتاج کرده، ورودی‌های حسی مختلف را ترکیب می‌کنیم و نتایج را پیش‌بینی می‌نماییم.
هوش مصنوعی رفتاری تلاش می‌کند این شکاف‌ها را پر کند و سیستم‌هایی ایجاد کند که نه‌تنها داده‌های زبانی را پردازش نمایند، بلکه درست مانند انسان‌ها از تعاملات یاد بگیرند و بتوانند به‌راحتی با محیط‌های جدید سازگار شوند. این رویکرد پارادایم را از «مدل چه می‌داند؟» به «مدل چگونه یاد می‌گیرد؟» تغییر می‌دهد.
ماهیت مدل‌های رفتاری بزرگ
مدل‌های رفتاری بزرگ تلاش می‌کنند فراتر از بازتولید صرف گفتار انسانی حرکت کنند و بر درک چرایی و چگونگی رفتار انسان‌ها تمرکز داشته باشند. برخلاف مدل‌های زبانی که بر داده‌های ایستا متکی هستند، مدل‌های رفتاری بزرگ  به صورت آنی و از طریق تعامل مداوم با محیط خود یاد می‌گیرند. این فرآیند یادگیری فعال به آن‌ها کمک می‌کند تا رفتار خود را مانند انسان‌ها از طریق آزمایش، مشاهده و اصلاح تطبیق دهند. برای مثال، کودکی که دوچرخه‌سواری یاد می‌گیرد، صرفاً با خواندن دستورالعمل‌ها یا تماشای ویدئوها آموزش نمی‌بیند؛ بلکه با تعامل فیزیکی با جهان، زمین خوردن، تنظیم و تلاش مجدد این مهارت را می‌آموزد. این دقیقاً همان فرایند یادگیری مورد استفاده برای مدل‌های رفتاری بزرگ است.
مدل‌های رفتاری بزرگ همچنین از متن فراتر می‌روند. آن‌ها می‌توانند مجموعه‌ای گسترده از داده‌ها از جمله تصاویر، صداها و ورودی‌های حسی را پردازش کنند؛ امری که به آن‌ها امکان می‌دهد محیط پیرامون خود را به شکلی جامع‌تر درک نمایند. این توانایی در تفسیر و واکنش به محیط‌های پیچیده و پویا، مدل‌های رفتاری بزرگ را به‌ویژه برای کاربردهایی که نیاز به تطبیق‌پذیری و آگاهی از زمینه دارند، مفید می‌سازد.
ویژگی‌های مهم مدل‌های رفتاری بزرگ عبارت‌اند از:
•یادگیری تعاملی: مدل‌های رفتاری برای انجام اقدامات و دریافت بازخورد آموزش می‌بینند. این ویژگی به آن‌ها امکان می‌دهد تا از پیامدها یاد بگیرند، نه از داده‌های ایستا.
•درک چندوجهی:  آن‌ها اطلاعات را از منابع متنوع، مانند تصاویر، صداها و تعاملات فیزیکی پردازش می‌کنند تا درکی جامع از محیط بسازند.
•تطبیق‌پذیری: این مدل‌ها می‌توانند دانش و استراتژی‌های خود را در لحظه به‌روزرسانی کنند؛ امری که آن‌ها را برای سناریوهای غیرقابل پیش‌بینی بسیار پویا و مناسب می‌سازد.
چگونه مدل‌های رفتاری بزرگ مانند انسان‌ها یاد می‌گیرند
مدل‌های رفتاری بزرگ یادگیری مشابه انسان‌ها را با ادغام ویژگی‌هایی نظیر یادگیری پویا، درک چندوجهی از زمینه و توانایی تعمیم دانش به حوزه‌های مختلف امکان‌پذیر می‌کنند.
•یادگیری پویا: انسان‌ها صرفاً حقایق را حفظ نمی‌کنند، بلکه خود را با موقعیت‌های جدید سازگار می‌سازند. به‌عنوان مثال، کودک با حل معماها تنها از طریق حفظ  کردن پاسخ‌ها یاد نمی‌گیرد، بلکه با شناسایی الگوها و تنظیم روش خود این مهارت را کسب می‌کند.مدل‌های رفتاری بزرگ تلاش می‌کنند این فرآیند را تقلید نموده و با استفاده از حلقه‌های بازخورد، دانش خود را در تعامل با جهان بهبود بخشند. برخلاف یادگیری از داده‌های ایستا، مدل‌های مذکور قادر هستند در مواجهه با موقعیت‌های جدید، دانش خود را تنظیم و تقویت نمایند. برای نمونه، رباتی که از یک مدل رفتاری بزرگ استفاده می‌کند، می‌تواند به‌جای اینکه صرفاً به نقشه‌های از پیش بارگذاری‌شده متکی باشد، با کاوش، مسیرهای یک ساختمان را بیاموزد.
•درک چندوجهی از زمینه: برخلاف مدل‌های زبانی بزرگ که به پردازش متن محدود هستند، انسان‌ها به‌طور یکپارچه تصاویر، صداها، لامسه و احساسات را برای درک جهان ترکیب می‌کنند. مدل‌های رفتاری بزرگ با هدف دستیابی به این درک چندبعدی طراحی شده‌اند؛ آن‌ها می‌توانند علاوه بر درک دستورات گفتاری، حرکات، لحن صدا و حالات چهره را نیز تشخیص دهند.
•تعمیم دانش به حوزه‌های مختلف: یکی از ویژگی‌های بارز یادگیری انسان، توانایی اعمال دانش در زمینه‌های مختلف است. برای مثال، فردی که رانندگی خودرو را می‌آموزد، می‌تواند به‌سرعت این دانش را به توانمندی کنترل یک قایق تبدیل کند. یکی از چالش‌های هوش مصنوعی سنتی، انتقال دانش بین حوزه‌های گوناگون است. درحالی‌که مدل‌های زبانی می‌توانند برای حوزه‌های مختلف مانند حقوق، پزشکی یا سرگرمی متن تولید کنند، در تعمیم دانش به زمینه‌های دیگر دچار مشکل هستند. اما مدل‌های رفتاری بزرگ برای تعمیم دانش طراحی شده‌اند. به‌عنوان مثال، مدلی که برای کمک در کارهای خانگی آموزش دیده است، می‌تواند به‌راحتی به انجام وظایف صنعتی در محیط‌هایی نظیر انبارها تطبیق یابد و در تعامل با محیط، به‌جای نیاز به آموزش مجدد، خود به یادگیری بپردازد.