دسته‌بندی نشده

دیپ‌سیک مدل v3.1 را با استدلال ترکیبی و قیمت‌های پایین‌تر رونمایی کرد

استارتاپ چینی دیپ‌سیک از عرضه یک به‌روزرسانی جدید خبر داد که ادعا می‌شود در معیارهای اصلی عملکرد، از مدل شناخته‌شده R1 پیشی گرفته است. این شرکت هوش مصنوعی در پستی روز پنج‌شنبه در وئی‌چت تأیید کرد که نسخه جدید مدل خود به نام V3.1 پاسخ‌های سریع‌تری به پرسش‌ها ارائه می‌دهد و نشان‌دهنده ورود این شرکت به حوزه توسعه عامل‌های هوش مصنوعی (AI Agent) است.

دیپ‌سیک افزود که این مدل از یک معماری استدلال ترکیبی پشتیبانی می‌کند که شامل هر دو حالت تفکر و بدون تفکر است، قابلیت‌های عامل آن بهبود یافته و عملکرد قوی‌تری در استفاده از ابزار و اجرای وظایف دارد. این شرکت یک دکمه با عنوان تفکر عمیق (Deep Thinking) برای切换 بین حالت‌ها ارائه کرده است.

تاکنون، برنامه و وب‌سایت رسمی دیپ‌سیک به نسخه V3.1 به‌روزرسانی شده‌اند و به کاربران امکان می‌دهند از طریق دکمه تفکر عمیق بین حالت‌های تفکر و بدون تفکر جابجا شوند، مشابه نحوه عملکرد مدل‌های ترکیبی آنتروپیک مانند اپوس و سونت.

گزارش شده است که مدل V3.1 همچنین در معیارهایی مانند SWE و Terminal-Bench و همچنین در کارایی تفکر، عملکرد بهتری نسبت به R1 دارد. علاوه بر این، به گفته Artificial Analysis، این مدل در حالت استدلال به ۶۰ امتیاز در شاخص هوش خود دست یافته که کمی بالاتر از امتیاز ۵۹ مدل R1 است.

با این حال، معماری زیربنایی آن بدون تغییر باقی مانده و در مجموع ۶۷۱ میلیارد پارامتر دارد که ۳۷ میلیارد از آن‌ها فعال هستند. علی‌رغم کارایی بالاتر، در حالت استدلال از تعداد نشانه‌های (Tokens) کمی کمتر نسبت به R1 استفاده می‌کند.

این مدل جدید، اگرچه، از نظر عملکرد کمی از آخرین مدل علی‌بابا و مدل استدلال متن‌باز اوپن‌ای‌آی به نام GPT-OSS عقب‌تر است. همچنین فاقد قابلیت فراخوانی تابع (Function Calling) در حالت استدلال است که یک محدودیت اصلی در گردش کار عامل‌ها (Agentic Workflows) محسوب می‌شود.

این استارتاپ برای اولین بار مدل جدید خود را روز سه‌شنبه معرفی کرد، اگرچه در آن زمان فقط روی Hugging Face در دسترس بود. یک بیانیه جداگانه اضافه کرد که این نسخه برای اجرا روی تراشه‌های هوش مصنوعی نسل بعدی ساخت چین سفارشی شده است.

اکنون، این شرکت یک طرح قیمت‌گذاری جدید برای مدل ارتقایافته V3 خود معرفی کرده است. این طرح برخی هزینه‌ها را افزایش می‌دهد، تخفیف‌های عصرگاهی را حذف می‌کند و هزینه‌ها را در برخی کاربردها کاهش می‌دهد و از ۶ سپتامبر اجرایی می‌شود.

دیپ‌سیک قیمت‌گذاری API ورودی خود را برای hits کش (Cache Hits) ۰.۰۷ دلار به ازای هر میلیون نشانه و برای misses کش (Cache Misses) ۰.۵۶ دلار تعیین کرده است، در حالی که هزینه نشانه‌های خروجی ۱.۶۸ دلار به ازای هر میلیون است.

این نرخ‌ها به شدت کمتر از رقباست: Gemini 2.5 Pro برای هر میلیون نشانه خروجی ۱۰ دلار هزینه دارد (۱۵ دلار برای promptهای طولانی‌تر)، GPT-5 اوپن‌ای‌آی نیز ۱۰ دلار است و Claude Opus 4.1 آنتروپیک تا ۷۵ دلار قیمت دارد.

تحلیلگران انتظار داشتند دیپ‌سیک جانشین مدل R1 را اوایل امسال عرضه کند.

دیپ‌سیک برای اولین بار با عرضه مدل قدرتمند و کم‌هزینه هوش مصنوعی R1 خود در ماه ژانویه، دره سیلیکون را به لرزه درآورد. این مدل از آن زمان در خط مقدم پیشرفت شتابان هوش مصنوعی چین باقی مانده و شرکت‌های آمریکایی مانند اوپن‌ای‌آی را به چالش کشیده است.

با این حال، ناظران بازار هنوز در انتظار مدل پس از R1، که احتمالاً مدل R2 خواهد بود، هستند و بسیاری انتظار داشتند که اوایل امسار راه‌اندازی شود. گزارش‌های محلی حاکی از آن است که تأخیر در راه‌اندازی ناشی از اصرار لیانگ ونفنگ، بنیانگذار شرکت، برای تکمیل و بهبود مدل است. در عین حال، او همچنین کسب‌وکار سودآور مدیریت دارایی های-فایر (High-Flyer Asset Management) خود را مدیریت می‌کند.

همانطور که قبلاً توسط کریپتوپولیتن گزارش شده بود، دیپ‌سیک پس از مواجهه با مشکلات فنی مداوم با پردازنده‌های اسند (Ascend) هوآوی، راه‌اندازی مدل هوش مصنوعی R2 خود را به تأخیر انداخت.

پس از موفقیت مدل R1 در ماه ژانویه، مقامات چینی دیپ‌سیک را تشویق کردند تا به جای محصولات انویدیای ساخت آمریکا، از تراشه‌های هوآوی استفاده کند. با این حال، این شرکت در مرحله آموزش مدل R2 خود با مشکلات قابل توجهی روبرو شد.

منابع مطلع گفتند که دیپ‌سیک مجبور بود برای آموزش به تراشه‌های انویدیا متکی باشد در حالی که فقط برای استنتاج (Inference) از پردازنده‌های اسند هوآوی استفاده می‌کرد. کارشناسان صنعت خاطرنشان می‌کنند که تراشه‌های چینی، از جمله هوآوی، اغلب در اتصال بین تراشه‌ای، پشتیبانی نرم‌افزاری و ثبات کلی از انویدیا عقب‌تر هستند.

هوآوی مهندسانی را به دفتر دیپ‌سیک فرستاد تا به تطبیق مدل کمک کنند. با این وجود، حتی با کمک‌های在场، این استارتاپ نتوانست یک اجرای آموزشی موفق روی سخت‌افزار اسند انجام دهد.

مدل R2 که در ابتدا قرار بود در ماه می راه‌اندازی شود، به دلیل این چالش‌های سخت‌افزاری با تأخیر مواجه شده است. در حالی که برخی رسانه‌های چینی推测 می‌کنند که مدل جدید ممکن است در هفته‌های آینده راه‌اندازی شود، لیانگ ونفنگ، بنیانگذار دیپ‌سیک، ناامیدی داخلی خود را از پیشرفت آن ابراز کرده و به تیم خود urging کرده است که زمان لازم را برای توسعه مدلی که مزیت رقابتی شرکت را حفظ می‌کند، اختصاص دهند.

در همین حال، غول‌های صنعت از جمله علی‌بابا و تنسنت به سرعت به انتشار به‌روزرسانی‌ها ادامه می‌دهند و مدل‌های کیوون (Qwen) علی‌بابا به طور خاص با استقبال قوی‌ای مواجه شده‌اند.

آیا می‌خواهید پروژه شما در معرض دید برترین ذهن‌های حوزه کریپتو قرار گیرد؟ آن را در گزارش صنعتی بعدی ما featured کنید، جایی که داده با تأثیر ملاقات می‌کند.

مشاهده بیشتر

نوشته های مشابه

دکمه بازگشت به بالا