پیشرفت چشمگیر دیپسیک در استدلال، ریاضی و برنامهنویسی
شرکت چینی DeepSeek که با مدل استدلالی R1 توجه بسیاری از کارشناسان را جلب کرده بود، اکنون از نسخهای پیشرفتهتر با نام DeepSeek-R1-0528 رونمایی کرده است. این مدل متنباز جدید، بهلطف بهینهسازیهای الگوریتمی و منابع محاسباتی قویتر، عملکردی نزدیک به o3 از OpenAI و Gemini 2.5 Pro از گوگل ارائه میدهد و به یکی از مهمترین رقبا در حوزه مدلهای زبانی مولد تبدیل شده است.
بهبود عملکرد در آزمونهای تخصصی
براساس اطلاعات رسمی منتشرشده در پلتفرم Hugging Face، مدل DeepSeek-R1-0528 در بنچمارکهای تخصصی مختلف، عملکرد چشمگیری داشته است:
بنچمارک | نسخه قبلی | نسخه جدید (0528) |
---|---|---|
AIME 2025 (ریاضیات) | 70% | 87.5% |
LiveCodeBench (برنامهنویسی) | 63.5% | 73.3% |
Humanity’s Last Exam | 8.5% | 17.7% |
این بهبودها نشان میدهد که مدل جدید DeepSeek نهتنها در تحلیل و استدلال منطقی، بلکه در حل مسائل پیچیده ریاضی و کدنویسی نیز توان رقابت با مدلهای پیشرفته آمریکایی را دارد.
مدل سبکتر برای سختافزارهای محدودتر
همزمان با نسخه اصلی، دیپسیک از یک نسخه سبکتر بهنام DeepSeek-R1-0528-Qwen3-8B نیز رونمایی کرده که تنها به حداقل 16 گیگابایت حافظه گرافیکی (در حالت FP16) نیاز دارد. این مدل ۸ میلیارد پارامتری از مدل Qwen3-8B بهتر عمل میکند و با مدل Qwen3-235B-thinking قابلمقایسه است، درحالیکه منابع کمتری مصرف میکند.
انتشار متنباز و دسترسی رایگان
مدل DeepSeek-R1-0528 مانند نسخههای قبلی خود، بهصورت متنباز و تحت مجوز MIT منتشر شده و برای استفادههای تجاری و تحقیقاتی کاملاً رایگان است. نسخه کامل آن روی Hugging Face قرار گرفته و مستندات فنی نیز در گیتهاب و API اختصاصی DeepSeek در دسترس توسعهدهندگان است. کاربران فعلی API نیز بهصورت خودکار به این نسخه ارتقاء مییابند.
واکنش مثبت جامعه هوش مصنوعی
انتشار این مدل در فضای مجازی با استقبال خوبی مواجه شده است. کاربری با نام «Haider» در پلتفرم X، عملکرد این مدل در برنامهنویسی را «فوقالعاده» توصیف کرده و آن را تنها رقیب جدی o3 دانسته است. کاربر دیگری با نام «Lisan al Gaib» نیز DeepSeek را رقیبی شایسته برای o3 و Gemini عنوان کرده است.
نتیجهگیری: DeepSeek در مسیر تبدیلشدن به بازیگر اصلی هوش مصنوعی جهان
با درنظر گرفتن بهبودهای قابلتوجه در نسخه جدید DeepSeek-R1-0528، این شرکت چینی نشان داده که توان رقابت جدی با غولهایی مانند OpenAI و Google را دارد. اگر این روند ادامه داشته باشد، احتمالاً در آیندهای نزدیک شاهد پایداری و گسترش قدرت مدلهای غیرآمریکایی در بازار جهانی هوش مصنوعی خواهیم بود.
ارسال پاسخ