Artificial Intelligence

گوگل قدرتمندترین مدل هوش مصنوعی خود به نام جِمینی ۳ را منتشر کرد — آنچه باید بدانید

گوگل امروز جیمینی ۳ پرو را در یک پیش‌نمایش عمومی منتشر کرد و آن را تواناترین مدل هوش مصنوعی این شرکت تا به امروز نامید. این سیستم به طور همزمان متن، تصاویر، صدا و ویدیو را پردازش می‌کند و تا ۱ میلیون توکن از محتوا را پردازش می‌کند که تقریباً معادل ۷۰۰۰۰۰ کلمه یا حدود ۱۰ رمان کامل است.

مدل پیش‌نمایش به صورت رایگان برای امتحان کردن در دسترس همه است.

گوگل اعلام کرد که این مدل در تقریباً تمام معیارهای تست شده توسط شرکت، از نسخه قبلی خود، جیمینی ۲.۵ پرو، بهتر عمل کرد. در آزمون استدلال آکادمیک Humanity’s Last Exam، جیمینی ۳ پرو امتیاز ۳۷.۵ درصد را به دست آورد در حالی که امتیاز ۲.۵ پرو ۲۱.۶ درصد بود. در معیار سنجش پازل استدلال بصری ARC-AGI-2، این فاصله بیشتر شد: ۳۱.۱ درصد در مقابل ۴.۹ درصد.

من یک مترجم حرفه‌ای هستم و دقیقاً طبق قوانین شما عمل خواهم کرد. با این حال، متنی که شما ارائه داده‌اید، یک URL تصویر و لیستی از آدرس‌های مختلف برای سایزهای مختلف همان تصویر است، نه یک “متن مقاله” برای ترجمه.

این محتوا شامل:
– یک آدرس اصلی تصویر
– لیستی از آدرس‌های مشابه برای رزولوشن‌های مختلف (64w, 96w, 128w و غیره)

هیچ محتوای متنی مقاله‌ای در این ورودی وجود ندارد که بتوان آن را ترجمه کرد.

اگر متن مقاله اصلی را ارائه دهید، من بلافاصله آن را دقیقاً و بدون هیچ تغییری به فارسی ترجمه خواهم کرد.

البته، چالش واقعی در این مرحله از رقابت هوش مصنوعی، بیشتر کسب سهم بازار تجاری است تا مسائل فنی.

گوگل که زمانی در حوزه جستجو شکست‌ناپذیر به نظر می‌رسید، مقدار قابل توجهی از عرصه را به اوپن‌ای‌آی واگذار کرده است که ادعا می‌کند حدود ۸۰۰ میلیون کاربر هفتگی برای چت‌جی‌پی‌تی دارد، در مقابل جمینی که طبق گزارش‌ها حدود ۶۵۰ میلیون کاربر *ماهانه* دارد. گوگل تعداد کاربران هفتگی خود را اعلام نکرده است، اما این عدد قطعاً بسیار کمتر از تعداد ماهانه آن خواهد بود.

با این حال، دستاوردهای فنی جمینی ۳ چشمگیر هستند.

جمینی ۳ پرو از چیزی استفاده می‌کند که گوگل

گوگل این معماری را یک معماری ترکیبی خلوت از متخصصان می‌نامد. به جای فعال کردن تمام ۱ تریلیون پارامتر به‌علاوه برای هر درخواست، سیستم هر ورودی را به زیرشبکه‌های تخصصی هدایت می‌کند. تنها بخشی از مدل—متخصص در آن وظیفه خاص—در هر زمان معین اجرا می‌شود که هزینه‌های محاسباتی را کاهش می‌دهد در حالی که عملکرد حفظ می‌شود.

برخلاف GPT و Claude که مدل‌های بزرگ و متراکمی هستند (همه‌کاره اما هیچ‌کاره)، رویکرد گوگل مانند یک سازمان بزرگ عمل می‌کند. یک شرکت با ۱۰۰۰ کارمند، همه را به هر جلسه‌ای فرا نمی‌خواند؛ تیم‌های خاصی مشکلات خاص را مدیریت می‌کنند. Gemini 3 Pro نیز به همین صورت عمل می‌کند و سوالات را به شبکه‌های متخصص مناسب هدایت می‌کند.

گوگل این مدل را بر روی اسناد وب، مخازن کد، تصاویر، فایل‌های صوتی و ویدیو—به‌علاوه داده‌های مصنوعی تولید شده توسط سایر سیستم‌های هوش مصنوعی آموزش داد. این شرکت داده‌های آموزشی را از نظر کیفیت و ایمنی فیلتر کرد و محتوای مستهجن، مطالب خشونت‌آمیز و هر چیزی که قوانین ایمنی کودکان را نقض می‌کند حذف نمود. آموزش بر روی واحدهای پردازش تنسور گوگل با استفاده از نرم‌افزارهای JAX و ML Pathways انجام شد.

یک آزمایش سریع از مدل نشان داد که بسیار تواناست. در آزمایش کدنویسی معمول ما که خواستار تولید یک بازی استیلث بود، این اولین مدلی بود که به جای یک تجربه دو‌بعدی، یک بازی سه‌بعدی تولید کرد. اجراهای دیگر نسخه‌های دو‌بعدی ارائه دادند، اما همه عملکردی و سریع بودند.

متأسفانه محتوای مقاله‌ای برای ترجمه ارائه نشده است. کدی که مشاهده می‌کنید مربوط به یک تصویر است و متنی برای ترجمه در آن وجود ندارد. لطفاً متن اصلی مقاله را ارائه دهید.

این رویکرد از سبک چت‌جی‌پی‌تی یا پرپلکسیتی پیروی می‌کند که با به اشتراک‌گذاری سوالات و پیشنهادات پیگیری، تعاملات بیشتر را تشویق می‌کنند، اما پیاده‌سازی گوگل بسیار تمیزتر و مفیدتر است.

در حالی که جنرال موتورز در حال حاضر از فناوری بلاک چین برای ردیابی خودروهای اجاره‌ای استفاده می‌کند، این غول خودروسازی آمریکایی اکنون در حال بررسی استفاده از آن برای ردیابی قطعات یدکی خودرو است.

این شرکت در حال حاضر از پلتفرم بلاک چین وی پرو (Vechain) برای ردیابی خودروهای اجاره‌ای در هنگ کنگ استفاده می‌کند و اکنون در حال بررسی امکان استفاده از این فناوری برای ردیابی قطعات یدکی در سراسر زنجیره تأمین است.

این اطلاعات در یک پست وبلاگی توسط وی پرو در روز دوشنبه منتشر شد. در این پست آمده است که جنرال موتورز قصد دارد از بلاک چین عمومی وی پرو برای ردیابی قطعات یدکی در سراسر چرخه عمر آن‌ها، از تولید تا بازیافت، استفاده کند.

این پست می‌افزاید: «این امر به جنرال موتورز امکان می‌دهد تا منشأ، تاریخچه و وضعیت هر قطعه را به طور شفاف و تغییرناپذیر ردیابی کند.»

وی پرو یک پلتفرم بلاک چین است که بر مدیریت زنجیره تأمین و فرآیندهای تجاری متمرکز است. این پلتفرم از توکن‌های غیرمثلی (NFT) برای نمایش دارایی‌های فیزیکی در بلاک چین استفاده می‌کند.

این پست ادعا می‌کند که این قابلیت ردیابی می‌تواند به کاهش تقلب در قطعات یدکی تقلبی کمک کند، ایمنی را با اطمینان از استفاده از قطعات اصلی بهبود بخشد، و کارایی را در مدیریت موجودی افزایش دهد.

این پست می‌افزاید: «این ابتکار عمل نشان می‌دهد که چگونه بلاک چین می‌تواند فراتر از برنامه‌های مالی، صنایع سنتی را متحول کند.»

این اولین همکاری جنرال موتورز با وی پرو نیست. این خودروساز در حال حاضر از پلتفرم وی پرو برای مدیریت ناوگان خودروهای اجاره‌ای در هنگ کنگ استفاده می‌کند.

بر اساس این پست، جنرال موتورز از وی پرو برای ایجاد پروفایل‌های دیجیتال برای هر وسیله نقلیه استفاده می‌کند که اطلاعاتی از جمله تاریخچه خدمات، استفاده و شرایط اجاره را ثبت می‌کند.

این پست ادعا می‌کند که این سیستم به شرکت اجازه می‌دهد تا ناوگان خودروهای اجاره‌ای خود را به طور مؤثرتری مدیریت کند و به مشتریان اطلاعات شفافی در مورد وسیله نقلیه‌ای که اجاره می‌کنند، ارائه دهد.

وی پرو در پست خود ادعا کرد که این سیستم مدیریت ناوگان در نهایت می‌تواند به مدل کسب و کار جدیدی برای جنرال موتورز تبدیل شود.

این پست می‌گوید: «این زیرساخت نه تنها عملیات داخلی را تقویت می‌کند، بلکه پتانسیل ایجاد جریان‌های درآمدی جدید از طریق ارائه خدمات مدیریت ناوگان به کسب و کارهای شخص ثالث را نیز دارد.»

با این حال، جنرال موتورز بلافاصله به درخواست دکریپت برای اظهار نظر در این مورد پاسخ نداد.

این غول خودروسازی قبلاً از بلاک چین برای اهداف دیگری نیز استفاده کرده است. در سال ۲۰۲۱، جنرال موتورز با فراری و سایر برندهای بزرگ برای ایجاد کنسرسیومی برای مبارزه با تقلب در مارک‌های تجاری همکاری کرد.

این کنسرسیوم که «اطلس آفیس فدرال اطلاعاتی» (AURA) نام دارد، از بلاک چین برای ردیابی محصولات و مبارزه با جعل استفاده می‌کند.

در سال ۲۰۱۹، جنرال موتورز همچنین حق امتیاز یک سیستم را دریافت کرد که از بلاک چین برای مدیریت داده‌های وسایل نقلیه autonomous (خودران) استفاده می‌کند.

ایجاد کد، رابط نکاتی را ارائه می‌دهد تا در درخواست‌های بعدی کمک کند، بنابراین کاربر می‌تواند مدل را برای تولید کد بهتر، رفع اشکالات و بهبود منطق برنامه، رابط کاربری و غیره راهنمایی کند. همچنین به کاربران گزینه استقرار کد و برنامه‌های مبتنی بر Gemini را می‌دهد.

به طور کلی، به نظر می‌رسد این مدل به ویژه بر روی وظایف کدنویسی متمرکز است. خلاقیت نقطه قوت آن نیست، اما با یک دستور سیستم خوب و مثال‌ها می‌توان آن را به راحتی راهنمایی کرد، زیرا یک پنجره زمینه توکن بسیار بزرگ دارد.

یک نسخه بایگانی شده از کارت مدل Gemini 3 – سندی که اطلاعات ضروری در مورد طراحی مدل، استفاده مورد نظر، عملکرد و محدودیت‌ها را ارائه می‌دهد – منتشر شده توسط Google DeepMind نشان می‌دهد که Gemini 3 Pro می‌تواند تا ۶۴۰۰۰ توکن خروجی تولید کند و قطع دانش آن ژانویه ۲۰۲۵ را حفظ می‌کند. گوگل تأیید کرد که این مدل ممکن است دچار توهم شود و گاهی اوقات کندی یا زمان‌بندی را تجربه کند.

یک کارت مدل رسمی در حال حاضر در دسترس نیست.

همانطور که ذکر شد، Google AI Studio در حال حاضر دسترسی رایگان به Gemini 3 Pro را به همه ارائه می‌دهد. Vertex AI و Gemini API نیز از این مدل پشتیبانی می‌کنند. با این حال، Gemini 3 Pro هنوز از طریق برنامه Gemini در دسترس نیست – حتی برای مشترکین پرداخت کننده Gemini Pro نیز نیست.

انتشار نوامبر گوگل را در مقابل کلاد سونت ۴.۵ از آنتروپیک، گراک ۴.۱ و حتی جی‌پی‌تی ۵.۱ از اوپن‌ای‌ای قرار می‌دهد. نمرات معیار نشان می‌دهد که جمینی ۳ پرو در وظایف استدلالی و چندوجهی پیشتاز است، اگرچه عملکرد در دنیای واقعی بسته به مورد استفاده متفاوت است.

گوگل جیمینی ۳ پرو را از طریق پلتفرم‌های ابری خود و مشمول شرایط استفاده موجود توزیع کرد. سیاست ممنوعیت استفاده از هوش مصنوعی تولیدی این شرکت اعمال می‌شود که استفاده در فعالیت‌های خطرناک، به خطر انداختن امنیت، محتوای صراحتاً جنسی، خشونت، سخنان نفرت‌پرآمیز و اطلاعات نادرست را مسدود می‌کند.

متأسفانه محتوای قابل ترجمه‌ای در متن ورودی شما وجود ندارد. محتوای ارائه شده عمدتاً شامل کدهای HTML و کلاس‌های CSS است که بخشی از ساختار ظاهری یک خبرنامه بوده و حاوی متن مقاله یا محتوای واقعی برای ترجمه نیست.

مشاهده بیشتر

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا