به طور خلاصه
- سیستم از مدل جیمینی گوگل برای استدلال درباره اهداف، توضیح برنامههایش و عمل در بازیهای ناآشنا استفاده کرد.
- سیمای ۲ از طریق بازی خودراهبر مهارتهای جدیدی آموخت و به جهانهایی که لحظاتی پیش توسط جنای ۳ خلق شده بودند سازگار شد.
- دیپمایند یک پیشنمایش تحقیقاتی محدود برای توسعهدهندگان و دانشگاهیان برنامهریزی کرد.
گوگل دیپمایند معرفی کردسیما ۲روز پنجشنبه — یکعامل هوش مصنوعیکه این شرکت ادعا میکند مانند یک “همراه” در دنیاهای مجازی رفتار میکند. با راهاندازی سیمای ۲، دیپمایند قصد دارد فراتر از کنشهای ساده روی صفحه پیش رفته و به سوی هوش مصنوعی حرکت کند که بتواند برنامهریزی کند، خود را توضیح دهد و از طریق تجربه بیاموزد.
این گامی مهم در مسیر دستیابی به هوش مصنوعی عمومی است که پیامدهای بزرگی برای آینده رباتیک و تجسم هوش مصنوعی در کلیت خود خواهد داشت.
نسخه اول سیما (عامل چندجهانی آموزشپذیر مقیاسپذیر) که در مارس ۲۰۲۴ منتشر شد، صدها مهارت اولیه را با تماشای صفحه و استفاده از کنترلهای مجازی صفحهکلید و ماوس فرا گرفت. گوگل اعلام کرد نسخه جدید سیما با اجازه دادن به هوش مصنوعی برای فکر کردن مستقل، یک گام فراتر میگذارد.
« توانمندترین عامل هوش مصنوعی ما برای جهانهای سهبعدی مجازی است.» گوگل دیپمایندنوشتدر ایکس. «قدرتگرفته از جیمینی، فراتر از پیروی از دستورالعملهای ساده میرود تا در محیطهای تعاملی بیندیشد، درک کند و اقدام کند – یعنی میتوانید از طریق متن، صدا یا حتی تصاویر با آن صحبت کنید.»
با استفاده ازجمینیگوگل گفت مدل هوش مصنوعی میتواند اهداف سطح بالا را درک کند، مراحل مورد نظر خود را توضیح دهد و درون بازیها با سطحی از استدلال که سیستم اصلی قادر به دستیابی به آن نبود، همکاری کند.
دیپمایند گزارش داد که تعمیمپذیری قویتری در محیطهای مجازی وجود داشته و سیمای ۲ وظایف طولانیتر و پیچیدهتری را تکمیل کرده که شامل دستورهای منطقی، طرحهای ترسیمشده روی صفحه و ایموجیها بوده است.
در نتیجه این قابلیت، عملکرد سیمای ۲ بهطور قابل توجهی به عملکرد یک بازیکن انسانی در طیف گستردهای از وظایف نزدیکتر است. گوگل با اشاره به اینکه سیمای ۲ نرخ تکمیل وظیفهای معادل ۶۵ درصد داشته در مقایسه با ۳۱ درصد توسط سیمای ۱، این مطلب را نوشت.
این سامانه همچنین دستورالعملها را تفسیر و درون جهانهای سهبعدی کاملاً جدید تولیدشده عمل کرد.جن ۳یکی دیگر از پروژههای دیپمایند که سال گذشته منتشر شد و محیطهای تعاملی را از روی یک تصویر یا دستور متنی خلق میکند. سیمای ۲ خود را جهتدهی کرد، اهداف را درک نمود و در دنیاهایی که تا لحظاتی قبل از آزمایش با آنها مواجه نشده بود، اقدامات معناداری انجام داد.
«سیمای ۲ اکنون در اجرای دستورالعلامت دقیق بسیار بهتر عمل میکند، حتی در دنیاهایی که قبلاً ندیده است.» گوگل نوشت. «این سیستم میتواند مفاهیم یادگرفتهشده مانند «استخراج» در یک بازی را به «برداشت محصول» در بازی دیگر انتقال دهد و بین کارهای مشابه ارتباط برقرار کند.»
پس از یادگیری از نمایشهای انسانی، محققان گفتند که عامل به بازی خودراهبر تغییر حالت داد و با استفاده از روش سعی و خطا و بازخورد تولیدشده توسط جمینی، تجربه جدیدی خلق کرد.دادهشامل یک چرخه آموزشی که در آن وظایفی را تولید کرد، آنها را انجام داد و سپس دادههای مسیر حرکت خود را به نسخه بعدی مدل بازگرداند.
در حالی که گوگل از سایما ۲ به عنوان گامی به پیش برای هوش مصنوعی استقبال کرد، این پژوهش همچنین شکافهایی را شناسایی کرد که هنوز باید مورد توجه قرار گیرند؛ از جمله مشکل در انجام وظایف بسیار طولانی و چندمرحلهای، کار در حافظه محدود، و مواجهه با چالشهای تفسیر بصری که در سامانههای هوش مصنوعی سهبعدی متداول است.
با این حال، دیپمایند اعلام کرد که این پلتفرم به عنوان یک بستر آزمایشی برای مهارتهایی عمل کرده که در نهایت میتوانند به حوزه رباتیک منتقل شوند وناوبریدر اینجا یک راهنمای گامبهگام برای شروع کار با این ابزار آورده شده است.
تحقیق سیمای ۲ ما مسیری قدرتمند به سمت کاربردها در رباتیک و گامی دیگر به سوی هوش مصنوعی عمومی در دنیای واقعی ارائه میدهد.
خبرنامه جیجی
جدیدترین اخبار بازیهای وب۳ را دریافت کنید، مستقیماً از استودیوهای بازیسازی و تأثیرگذاران فعال در این حوزه بشنوید و پاورآپهایی از شرکای ما دریافت نمایید.