گوگل قدرتمندترین مدل هوش مصنوعی خود به نام جِمینی ۳ را منتشر کرد — آنچه باید بدانید

گوگل امروز جیمینی ۳ پرو را در یک پیشنمایش عمومی منتشر کرد و آن را تواناترین مدل هوش مصنوعی این شرکت تا به امروز نامید. این سیستم به طور همزمان متن، تصاویر، صدا و ویدیو را پردازش میکند و تا ۱ میلیون توکن از محتوا را پردازش میکند که تقریباً معادل ۷۰۰۰۰۰ کلمه یا حدود ۱۰ رمان کامل است.
مدل پیشنمایش به صورت رایگان برای امتحان کردن در دسترس همه است.
گوگل اعلام کرد که این مدل در تقریباً تمام معیارهای تست شده توسط شرکت، از نسخه قبلی خود، جیمینی ۲.۵ پرو، بهتر عمل کرد. در آزمون استدلال آکادمیک Humanity’s Last Exam، جیمینی ۳ پرو امتیاز ۳۷.۵ درصد را به دست آورد در حالی که امتیاز ۲.۵ پرو ۲۱.۶ درصد بود. در معیار سنجش پازل استدلال بصری ARC-AGI-2، این فاصله بیشتر شد: ۳۱.۱ درصد در مقابل ۴.۹ درصد.
من یک مترجم حرفهای هستم و دقیقاً طبق قوانین شما عمل خواهم کرد. با این حال، متنی که شما ارائه دادهاید، یک URL تصویر و لیستی از آدرسهای مختلف برای سایزهای مختلف همان تصویر است، نه یک “متن مقاله” برای ترجمه.
این محتوا شامل:
– یک آدرس اصلی تصویر
– لیستی از آدرسهای مشابه برای رزولوشنهای مختلف (64w, 96w, 128w و غیره)
هیچ محتوای متنی مقالهای در این ورودی وجود ندارد که بتوان آن را ترجمه کرد.
اگر متن مقاله اصلی را ارائه دهید، من بلافاصله آن را دقیقاً و بدون هیچ تغییری به فارسی ترجمه خواهم کرد.
البته، چالش واقعی در این مرحله از رقابت هوش مصنوعی، بیشتر کسب سهم بازار تجاری است تا مسائل فنی.
گوگل که زمانی در حوزه جستجو شکستناپذیر به نظر میرسید، مقدار قابل توجهی از عرصه را به اوپنایآی واگذار کرده است که ادعا میکند حدود ۸۰۰ میلیون کاربر هفتگی برای چتجیپیتی دارد، در مقابل جمینی که طبق گزارشها حدود ۶۵۰ میلیون کاربر *ماهانه* دارد. گوگل تعداد کاربران هفتگی خود را اعلام نکرده است، اما این عدد قطعاً بسیار کمتر از تعداد ماهانه آن خواهد بود.
با این حال، دستاوردهای فنی جمینی ۳ چشمگیر هستند.
جمینی ۳ پرو از چیزی استفاده میکند که گوگل
گوگل این معماری را یک معماری ترکیبی خلوت از متخصصان مینامد. به جای فعال کردن تمام ۱ تریلیون پارامتر بهعلاوه برای هر درخواست، سیستم هر ورودی را به زیرشبکههای تخصصی هدایت میکند. تنها بخشی از مدل—متخصص در آن وظیفه خاص—در هر زمان معین اجرا میشود که هزینههای محاسباتی را کاهش میدهد در حالی که عملکرد حفظ میشود.
برخلاف GPT و Claude که مدلهای بزرگ و متراکمی هستند (همهکاره اما هیچکاره)، رویکرد گوگل مانند یک سازمان بزرگ عمل میکند. یک شرکت با ۱۰۰۰ کارمند، همه را به هر جلسهای فرا نمیخواند؛ تیمهای خاصی مشکلات خاص را مدیریت میکنند. Gemini 3 Pro نیز به همین صورت عمل میکند و سوالات را به شبکههای متخصص مناسب هدایت میکند.
گوگل این مدل را بر روی اسناد وب، مخازن کد، تصاویر، فایلهای صوتی و ویدیو—بهعلاوه دادههای مصنوعی تولید شده توسط سایر سیستمهای هوش مصنوعی آموزش داد. این شرکت دادههای آموزشی را از نظر کیفیت و ایمنی فیلتر کرد و محتوای مستهجن، مطالب خشونتآمیز و هر چیزی که قوانین ایمنی کودکان را نقض میکند حذف نمود. آموزش بر روی واحدهای پردازش تنسور گوگل با استفاده از نرمافزارهای JAX و ML Pathways انجام شد.
یک آزمایش سریع از مدل نشان داد که بسیار تواناست. در آزمایش کدنویسی معمول ما که خواستار تولید یک بازی استیلث بود، این اولین مدلی بود که به جای یک تجربه دوبعدی، یک بازی سهبعدی تولید کرد. اجراهای دیگر نسخههای دوبعدی ارائه دادند، اما همه عملکردی و سریع بودند.
متأسفانه محتوای مقالهای برای ترجمه ارائه نشده است. کدی که مشاهده میکنید مربوط به یک تصویر است و متنی برای ترجمه در آن وجود ندارد. لطفاً متن اصلی مقاله را ارائه دهید.
این رویکرد از سبک چتجیپیتی یا پرپلکسیتی پیروی میکند که با به اشتراکگذاری سوالات و پیشنهادات پیگیری، تعاملات بیشتر را تشویق میکنند، اما پیادهسازی گوگل بسیار تمیزتر و مفیدتر است.
در حالی که جنرال موتورز در حال حاضر از فناوری بلاک چین برای ردیابی خودروهای اجارهای استفاده میکند، این غول خودروسازی آمریکایی اکنون در حال بررسی استفاده از آن برای ردیابی قطعات یدکی خودرو است.
این شرکت در حال حاضر از پلتفرم بلاک چین وی پرو (Vechain) برای ردیابی خودروهای اجارهای در هنگ کنگ استفاده میکند و اکنون در حال بررسی امکان استفاده از این فناوری برای ردیابی قطعات یدکی در سراسر زنجیره تأمین است.
این اطلاعات در یک پست وبلاگی توسط وی پرو در روز دوشنبه منتشر شد. در این پست آمده است که جنرال موتورز قصد دارد از بلاک چین عمومی وی پرو برای ردیابی قطعات یدکی در سراسر چرخه عمر آنها، از تولید تا بازیافت، استفاده کند.
این پست میافزاید: «این امر به جنرال موتورز امکان میدهد تا منشأ، تاریخچه و وضعیت هر قطعه را به طور شفاف و تغییرناپذیر ردیابی کند.»
وی پرو یک پلتفرم بلاک چین است که بر مدیریت زنجیره تأمین و فرآیندهای تجاری متمرکز است. این پلتفرم از توکنهای غیرمثلی (NFT) برای نمایش داراییهای فیزیکی در بلاک چین استفاده میکند.
این پست ادعا میکند که این قابلیت ردیابی میتواند به کاهش تقلب در قطعات یدکی تقلبی کمک کند، ایمنی را با اطمینان از استفاده از قطعات اصلی بهبود بخشد، و کارایی را در مدیریت موجودی افزایش دهد.
این پست میافزاید: «این ابتکار عمل نشان میدهد که چگونه بلاک چین میتواند فراتر از برنامههای مالی، صنایع سنتی را متحول کند.»
این اولین همکاری جنرال موتورز با وی پرو نیست. این خودروساز در حال حاضر از پلتفرم وی پرو برای مدیریت ناوگان خودروهای اجارهای در هنگ کنگ استفاده میکند.
بر اساس این پست، جنرال موتورز از وی پرو برای ایجاد پروفایلهای دیجیتال برای هر وسیله نقلیه استفاده میکند که اطلاعاتی از جمله تاریخچه خدمات، استفاده و شرایط اجاره را ثبت میکند.
این پست ادعا میکند که این سیستم به شرکت اجازه میدهد تا ناوگان خودروهای اجارهای خود را به طور مؤثرتری مدیریت کند و به مشتریان اطلاعات شفافی در مورد وسیله نقلیهای که اجاره میکنند، ارائه دهد.
وی پرو در پست خود ادعا کرد که این سیستم مدیریت ناوگان در نهایت میتواند به مدل کسب و کار جدیدی برای جنرال موتورز تبدیل شود.
این پست میگوید: «این زیرساخت نه تنها عملیات داخلی را تقویت میکند، بلکه پتانسیل ایجاد جریانهای درآمدی جدید از طریق ارائه خدمات مدیریت ناوگان به کسب و کارهای شخص ثالث را نیز دارد.»
با این حال، جنرال موتورز بلافاصله به درخواست دکریپت برای اظهار نظر در این مورد پاسخ نداد.
این غول خودروسازی قبلاً از بلاک چین برای اهداف دیگری نیز استفاده کرده است. در سال ۲۰۲۱، جنرال موتورز با فراری و سایر برندهای بزرگ برای ایجاد کنسرسیومی برای مبارزه با تقلب در مارکهای تجاری همکاری کرد.
این کنسرسیوم که «اطلس آفیس فدرال اطلاعاتی» (AURA) نام دارد، از بلاک چین برای ردیابی محصولات و مبارزه با جعل استفاده میکند.
در سال ۲۰۱۹، جنرال موتورز همچنین حق امتیاز یک سیستم را دریافت کرد که از بلاک چین برای مدیریت دادههای وسایل نقلیه autonomous (خودران) استفاده میکند.
ایجاد کد، رابط نکاتی را ارائه میدهد تا در درخواستهای بعدی کمک کند، بنابراین کاربر میتواند مدل را برای تولید کد بهتر، رفع اشکالات و بهبود منطق برنامه، رابط کاربری و غیره راهنمایی کند. همچنین به کاربران گزینه استقرار کد و برنامههای مبتنی بر Gemini را میدهد.
به طور کلی، به نظر میرسد این مدل به ویژه بر روی وظایف کدنویسی متمرکز است. خلاقیت نقطه قوت آن نیست، اما با یک دستور سیستم خوب و مثالها میتوان آن را به راحتی راهنمایی کرد، زیرا یک پنجره زمینه توکن بسیار بزرگ دارد.
یک نسخه بایگانی شده از کارت مدل Gemini 3 – سندی که اطلاعات ضروری در مورد طراحی مدل، استفاده مورد نظر، عملکرد و محدودیتها را ارائه میدهد – منتشر شده توسط Google DeepMind نشان میدهد که Gemini 3 Pro میتواند تا ۶۴۰۰۰ توکن خروجی تولید کند و قطع دانش آن ژانویه ۲۰۲۵ را حفظ میکند. گوگل تأیید کرد که این مدل ممکن است دچار توهم شود و گاهی اوقات کندی یا زمانبندی را تجربه کند.
یک کارت مدل رسمی در حال حاضر در دسترس نیست.
همانطور که ذکر شد، Google AI Studio در حال حاضر دسترسی رایگان به Gemini 3 Pro را به همه ارائه میدهد. Vertex AI و Gemini API نیز از این مدل پشتیبانی میکنند. با این حال، Gemini 3 Pro هنوز از طریق برنامه Gemini در دسترس نیست – حتی برای مشترکین پرداخت کننده Gemini Pro نیز نیست.
انتشار نوامبر گوگل را در مقابل کلاد سونت ۴.۵ از آنتروپیک، گراک ۴.۱ و حتی جیپیتی ۵.۱ از اوپنایای قرار میدهد. نمرات معیار نشان میدهد که جمینی ۳ پرو در وظایف استدلالی و چندوجهی پیشتاز است، اگرچه عملکرد در دنیای واقعی بسته به مورد استفاده متفاوت است.
گوگل جیمینی ۳ پرو را از طریق پلتفرمهای ابری خود و مشمول شرایط استفاده موجود توزیع کرد. سیاست ممنوعیت استفاده از هوش مصنوعی تولیدی این شرکت اعمال میشود که استفاده در فعالیتهای خطرناک، به خطر انداختن امنیت، محتوای صراحتاً جنسی، خشونت، سخنان نفرتپرآمیز و اطلاعات نادرست را مسدود میکند.
متأسفانه محتوای قابل ترجمهای در متن ورودی شما وجود ندارد. محتوای ارائه شده عمدتاً شامل کدهای HTML و کلاسهای CSS است که بخشی از ساختار ظاهری یک خبرنامه بوده و حاوی متن مقاله یا محتوای واقعی برای ترجمه نیست.