۱. اعلام «کُد قرمز» و عرضه GPT-5.2
OpenAI جدیدترین و هوشمندترین مدل هوش مصنوعی خود را با نام GPT-5.2 معرفی کرده است؛ مدلی که پیشرفتهای چشمگیری در معیارها و تستهای نگارش، کدنویسی و استدلال به ثبت رسانده است. عرضه این مدل تنها چند روز پس از آن صورت میگیرد که سم آلتمن، مدیرعامل، وضعیت «کُد قرمز» را به صورت داخلی اعلام کرد؛ یک فشار همهجانبه در سطح شرکت برای بهبود ChatGPT در مواجهه با رقابت شدید رقبا.
فیجی سیمو، مدیرعامل بخش اپلیکیشنهای OpenAI، در نشستی با خبرنگاران گفت:
«ما این کُد قرمز را اعلام کردیم تا واقعاً به شرکت علامت دهیم که میخواهیم منابع را در یک حوزه خاص بسیج کنیم و این راهی است برای تعریف واقعی اولویتها. ما افزایش منابع متمرکز بر ChatGPT را به طور کلی داشتهایم.»
سیمو تکذیب کرد که عرضه GPT-5.2 به دلیل وضعیت «کُد قرمز» زودتر از موعد انجام شده باشد، اما پذیرفت که منابع اضافی متمرکز بر ChatGPT «کمککننده» بودهاند.
۲. رقابت با جمینای گوگل و تمرکز مجدد
در حالی که مدلها و محصولات OpenAI هنگام عرضه ChatGPT در سال ۲۰۲۲ بهترین در نوع خود محسوب میشدند، اکنون دیگر این یک امر مسلم نیست. این استارتاپ اکنون با مجموعهای از رقبای قدرتمند روبروست، که شاید هیچکدام تهدیدی جدیتر از گوگل نباشند؛ چرا که مدل تازه معرفی شدهی آن، یعنی Gemini 3، بازخورد خوبی از صنعت فناوری دریافت کرده است.
- آمار کاربران: اپلیکیشن Gemini گوگل در یک سال گذشته با نرخ چشمگیری رشد کرده و اکنون ۶۵۰ میلیون کاربر فعال ماهانه دارد، در مقایسه با ۸۰۰ میلیون کاربر فعال هفتگی OpenAI.
- فشار رقابتی: این فشار، OpenAI را مجبور کرده است تا برخی از پروژههای بلندپروازانه خود، از جمله تلاش برای افزودن تبلیغات به ChatGPT را متوقف کند و دوباره بر بهبود فناوریها و محصولات اصلی خود متمرکز شود.
۳. پیشرفتهای کلیدی و معماری GPT-5.2 (H2)
مانند مدلهای اخیر این شرکت، GPT-5.2 نیز در قالب یک سری از مدلها عرضه میشود:
- Instant: پاسخ سریعتر و بهتر برای یافتن اطلاعات.
- Thinking: مدل تخصصی که در کدنویسی، ریاضیات و برنامهریزی برتری دارد.
- Pro: قدرتمندترین سطح مدلهای OpenAI که بالاترین دقت را در پاسخ به سؤالات دشوار ارائه میدهد.
رکوردشکنی در معیارهای حرفهای (H3)
OpenAI مدل GPT-5.2 را بهترین مدل خود برای استفادههای حرفهای روزمره مینامد.
- بنچمارک GDPval: مدل GPT-5.2 Thinking بالاترین امتیاز را در GDPval، معیار داخلی OpenAI که عملکرد مدلهای هوش مصنوعی را با متخصصان انسانی در ۴۴ شغل دنیای واقعی مقایسه میکند، به دست آورد.
- سرعت و دقت: این شرکت میگوید مدل Thinking در بیش از ۷۰ درصد وظایف، متخصصان انسانی را شکست داد و آنها را ۱۱ برابر سریعتر به اتمام رساند.
کاهش توهمات (Hallucinations) (H3)
مکس شوارتزر، سرپرست پس از آموزش در OpenAI، میگوید GPT-5.2 بهبود قابل ملاحظهای در زمینه توهمات (Hallucinations) ارائه میدهد.
- آمار: مدل GPT-5.2 Thinking در بنچمارکهای اندازهگیری پاسخ به سؤالات واقعی، ۳۸ درصد کمتر از GPT-5.1 دچار توهم شد.
۴. چالشهای تعادل: انساننمایی، ایمنی و رشد
GPT-5.2 برای هر دو گروه کاربران ChatGPT و توسعهدهندگان (از طریق API) در دسترس است. اما چالشهای پیرامون عرضه مدلهای OpenAI همچنان پابرجا هستند.
- واکنش کاربران به GPT-5: هنگامی که OpenAI مدل GPT-5 را در اوایل سال جاری منتشر کرد، کاربران نسبت به پاسخهای سردتر مدل اعتراض کردند. این شرکت مجبور شد چند روز پس از عرضه، بهروزرسانیای را برای «گرمتر» کردن مدل منتشر کند.
- تعادل شخصیتی: یک تنش کلیدی برای OpenAI این است که ChatGPT را برای افزایش تعامل، لذتبخشتر کند، بدون اینکه آن را بیش از حد چاپلوس (Overly Sycophantic) سازد – تمایلی که در آن مدل هوش مصنوعی بیش از حد با کاربر موافق است.
ایمنی و حوزه سلامت روان
در طول سال گذشته، OpenAI با طیف گستردهای از چالشهای سلامت روان مرتبط با استفاده از ChatGPT روبرو بوده است.
- آمار نگرانکننده: در اکتبر، این شرکت گزارشی منتشر کرد که نشان میداد بیش از یک میلیون نفر هر هفته در مورد خودکشی با ChatGPT صحبت میکنند.
در واکنش به فشارهای رقابتی و مسائل ایمنی، OpenAI اقدامات زیر را اعلام کرده است:
- تقویت پاسخهای حساس: تقویت پاسخهای ChatGPT به پیامهای حساس نشاندهنده آسیب به خود، پریشانی سلامت روان یا وابستگی عاطفی به مدل.
- سیستم پیشبینی سن: شروع مراحل اولیه عرضه سیستم پیشبینی سن در برخی کشورها، که به شرکت امکان میدهد به طور خودکار محافظتهای محتوایی را برای کاربرانی که تخمین زده میشود زیر ۱۸ سال دارند، اعمال کند.
- «حالت بزرگسالان» (Adult Mode): سیمو میگوید این شرکت قصد دارد «حالت بزرگسالان» را در سهماهه اول ۲۰۲۶ عرضه کند؛ حالتی که آلتمن قبلاً اشاره کرده بود به کاربران بالای ۱۸ سال اجازه میدهد مکالمات «اروتیک» با ChatGPT داشته باشند.







ارسال پاسخ