دیپسیک مدل v3.1 را با استدلال ترکیبی و قیمتهای پایینتر رونمایی کرد

استارتاپ چینی دیپسیک از عرضه یک بهروزرسانی جدید خبر داد که ادعا میشود در معیارهای اصلی عملکرد، از مدل شناختهشده R1 پیشی گرفته است. این شرکت هوش مصنوعی در پستی روز پنجشنبه در وئیچت تأیید کرد که نسخه جدید مدل خود به نام V3.1 پاسخهای سریعتری به پرسشها ارائه میدهد و نشاندهنده ورود این شرکت به حوزه توسعه عاملهای هوش مصنوعی (AI Agent) است.
دیپسیک افزود که این مدل از یک معماری استدلال ترکیبی پشتیبانی میکند که شامل هر دو حالت تفکر و بدون تفکر است، قابلیتهای عامل آن بهبود یافته و عملکرد قویتری در استفاده از ابزار و اجرای وظایف دارد. این شرکت یک دکمه با عنوان تفکر عمیق (Deep Thinking) برای切换 بین حالتها ارائه کرده است.
تاکنون، برنامه و وبسایت رسمی دیپسیک به نسخه V3.1 بهروزرسانی شدهاند و به کاربران امکان میدهند از طریق دکمه تفکر عمیق بین حالتهای تفکر و بدون تفکر جابجا شوند، مشابه نحوه عملکرد مدلهای ترکیبی آنتروپیک مانند اپوس و سونت.
گزارش شده است که مدل V3.1 همچنین در معیارهایی مانند SWE و Terminal-Bench و همچنین در کارایی تفکر، عملکرد بهتری نسبت به R1 دارد. علاوه بر این، به گفته Artificial Analysis، این مدل در حالت استدلال به ۶۰ امتیاز در شاخص هوش خود دست یافته که کمی بالاتر از امتیاز ۵۹ مدل R1 است.
با این حال، معماری زیربنایی آن بدون تغییر باقی مانده و در مجموع ۶۷۱ میلیارد پارامتر دارد که ۳۷ میلیارد از آنها فعال هستند. علیرغم کارایی بالاتر، در حالت استدلال از تعداد نشانههای (Tokens) کمی کمتر نسبت به R1 استفاده میکند.
این مدل جدید، اگرچه، از نظر عملکرد کمی از آخرین مدل علیبابا و مدل استدلال متنباز اوپنایآی به نام GPT-OSS عقبتر است. همچنین فاقد قابلیت فراخوانی تابع (Function Calling) در حالت استدلال است که یک محدودیت اصلی در گردش کار عاملها (Agentic Workflows) محسوب میشود.
این استارتاپ برای اولین بار مدل جدید خود را روز سهشنبه معرفی کرد، اگرچه در آن زمان فقط روی Hugging Face در دسترس بود. یک بیانیه جداگانه اضافه کرد که این نسخه برای اجرا روی تراشههای هوش مصنوعی نسل بعدی ساخت چین سفارشی شده است.
اکنون، این شرکت یک طرح قیمتگذاری جدید برای مدل ارتقایافته V3 خود معرفی کرده است. این طرح برخی هزینهها را افزایش میدهد، تخفیفهای عصرگاهی را حذف میکند و هزینهها را در برخی کاربردها کاهش میدهد و از ۶ سپتامبر اجرایی میشود.
دیپسیک قیمتگذاری API ورودی خود را برای hits کش (Cache Hits) ۰.۰۷ دلار به ازای هر میلیون نشانه و برای misses کش (Cache Misses) ۰.۵۶ دلار تعیین کرده است، در حالی که هزینه نشانههای خروجی ۱.۶۸ دلار به ازای هر میلیون است.
این نرخها به شدت کمتر از رقباست: Gemini 2.5 Pro برای هر میلیون نشانه خروجی ۱۰ دلار هزینه دارد (۱۵ دلار برای promptهای طولانیتر)، GPT-5 اوپنایآی نیز ۱۰ دلار است و Claude Opus 4.1 آنتروپیک تا ۷۵ دلار قیمت دارد.
تحلیلگران انتظار داشتند دیپسیک جانشین مدل R1 را اوایل امسال عرضه کند.
دیپسیک برای اولین بار با عرضه مدل قدرتمند و کمهزینه هوش مصنوعی R1 خود در ماه ژانویه، دره سیلیکون را به لرزه درآورد. این مدل از آن زمان در خط مقدم پیشرفت شتابان هوش مصنوعی چین باقی مانده و شرکتهای آمریکایی مانند اوپنایآی را به چالش کشیده است.
با این حال، ناظران بازار هنوز در انتظار مدل پس از R1، که احتمالاً مدل R2 خواهد بود، هستند و بسیاری انتظار داشتند که اوایل امسار راهاندازی شود. گزارشهای محلی حاکی از آن است که تأخیر در راهاندازی ناشی از اصرار لیانگ ونفنگ، بنیانگذار شرکت، برای تکمیل و بهبود مدل است. در عین حال، او همچنین کسبوکار سودآور مدیریت دارایی های-فایر (High-Flyer Asset Management) خود را مدیریت میکند.
همانطور که قبلاً توسط کریپتوپولیتن گزارش شده بود، دیپسیک پس از مواجهه با مشکلات فنی مداوم با پردازندههای اسند (Ascend) هوآوی، راهاندازی مدل هوش مصنوعی R2 خود را به تأخیر انداخت.
پس از موفقیت مدل R1 در ماه ژانویه، مقامات چینی دیپسیک را تشویق کردند تا به جای محصولات انویدیای ساخت آمریکا، از تراشههای هوآوی استفاده کند. با این حال، این شرکت در مرحله آموزش مدل R2 خود با مشکلات قابل توجهی روبرو شد.
منابع مطلع گفتند که دیپسیک مجبور بود برای آموزش به تراشههای انویدیا متکی باشد در حالی که فقط برای استنتاج (Inference) از پردازندههای اسند هوآوی استفاده میکرد. کارشناسان صنعت خاطرنشان میکنند که تراشههای چینی، از جمله هوآوی، اغلب در اتصال بین تراشهای، پشتیبانی نرمافزاری و ثبات کلی از انویدیا عقبتر هستند.
هوآوی مهندسانی را به دفتر دیپسیک فرستاد تا به تطبیق مدل کمک کنند. با این وجود، حتی با کمکهای在场، این استارتاپ نتوانست یک اجرای آموزشی موفق روی سختافزار اسند انجام دهد.
مدل R2 که در ابتدا قرار بود در ماه می راهاندازی شود، به دلیل این چالشهای سختافزاری با تأخیر مواجه شده است. در حالی که برخی رسانههای چینی推测 میکنند که مدل جدید ممکن است در هفتههای آینده راهاندازی شود، لیانگ ونفنگ، بنیانگذار دیپسیک، ناامیدی داخلی خود را از پیشرفت آن ابراز کرده و به تیم خود urging کرده است که زمان لازم را برای توسعه مدلی که مزیت رقابتی شرکت را حفظ میکند، اختصاص دهند.
در همین حال، غولهای صنعت از جمله علیبابا و تنسنت به سرعت به انتشار بهروزرسانیها ادامه میدهند و مدلهای کیوون (Qwen) علیبابا به طور خاص با استقبال قویای مواجه شدهاند.
آیا میخواهید پروژه شما در معرض دید برترین ذهنهای حوزه کریپتو قرار گیرد؟ آن را در گزارش صنعتی بعدی ما featured کنید، جایی که داده با تأثیر ملاقات میکند.