توهم سادگی: چرا سال ۲۰۲۵ سال اپلیکیشنهای هوش مصنوعی نبود؟
جولی بورنستاین، کارآفرین باسابقه (مدیر سابق نورداستروم، COO استیچ فیکس و بنیانگذار پلتفرم خریدی که پینترست آن را خریداری کرد)، فکر میکرد که پیادهسازی ایده استارتاپ هوش مصنوعیاش کار بسیار آسانی خواهد بود. او خود را در موقعیت مناسبی برای خلق شرکتی مانند Daydream (با جذب ۵۰ میلیون دلار سرمایه از سرمایهگذاران بزرگی چون Google Ventures) میدید که از طریق هوش مصنوعی، لباسهای ایدهآل را برای مشتریان پیدا کند.
اما واقعیت بسیار سختتر از انتظار او بود. داستان او کمک میکند تا یک حقیقت مهم روشن شود:
از زمان عرضه ChatGPT در اواخر سال ۲۰۲۲، مردم تحت تأثیر «ترفندهای» هوش مصنوعی قرار گرفتهاند، اما مطالعات متعددی نشان دادهاند که این فناوری هنوز افزایش قابل توجهی در بهرهوری ایجاد نکرده است (به جز در حوزه برنامهنویسی). یک مطالعه نشان داد که ۱۹ پروژه از ۲۰ پروژه آزمایشی هوش مصنوعی در شرکتها، هیچ ارزش قابل اندازهگیری را به همراه نداشتهاند.
بورنستاین میگوید: «پشتکار و صبر، کلید ایجاد این پیشرفتها هستند، اما تحقق آنها بسیار بیشتر از حد انتظار طول میکشد.»
شکست در دنیای فشن: چالشهای Daydream
ایده اولیه بورنستاین به سرمایهگذاران ساده بود: از هوش مصنوعی برای حل مشکلات پیچیده فشن استفاده کنید. اما اجرای آن، کابوسآور از آب درآمد.
بخش ساده ماجرا: بستن قرارداد با بیش از ۲۶۵ شریک و دسترسی به بیش از ۲ میلیون محصول، قسمت آسان بود.
بخش پیچیده ماجرا: برآورده کردن یک درخواست به ظاهر ساده مانند «من برای یک مراسم عروسی در پاریس به لباس نیاز دارم»، به طرز باورنکردنی پیچیده است:
- آیا شما عروس هستید یا مادر داماد یا مهمان؟
- فصل مراسم چیست؟
- سطح رسمی بودن عروسی چقدر است؟
- چه پیامی میخواهید منتقل کنید؟
حتی پس از حل این سؤالات، مدلهای مختلف هوش مصنوعی دیدگاههای متفاوتی دارند.
عدم انسجام و توهم مدل (Hallucinations)
بورنستاین میگوید: «به دلیل عدم ثبات و قابلیت اطمینان مدل و پدیده توهم (Hallucinations)، مدل گاهی اوقات یک یا دو عنصر از پرسوجوی کاربران را نادیده میگرفت.»
برای مثال، زمانی که یک کاربر میپرسید: “من اندامی مستطیلی دارم، اما به لباسی نیاز دارم که مرا شبیه ساعت شنی نشان دهد،” مدل هوش مصنوعی لباسهایی با الگوهای هندسی نمایش میداد، نه لباسهایی که واقعاً اندام را بهتر نشان دهند.
راهحل Daydream: تکهتکه کردن مدل
بورنستاین متوجه شد که باید تیم فنی خود را ارتقا دهد (و CTO سابق Grubhub را استخدام کرد) و همچنین ساختار فنی برنامه را تغییر دهد. اکنون، Daydream به جای یک فراخوان واحد، از یک «مجموعه یا اَنسامبل از چندین مدل» استفاده میکند:
- «هر کدام از این مدلها یک کار تخصصی را انجام میدهند. ما یک مدل برای رنگ، یک مدل برای جنس پارچه، یک مدل برای فصل و یک مدل برای مکان داریم.»
- Daydream همچنین از مدلهای بصری استفاده میکند تا محصولات را به روشی ظریفتر درک کند (مثلاً وقتی مشتری یک گردنبند خاص را نشان میدهد).
- تلاش انسانی: Daydream متوجه شد که هوش مصنوعی به کمک انسانی نیاز دارد. برای ترندهایی مانند “لباسهایی که هیلی بیبر میپوشد” یا ترندهای نوظهور مثل “Cottagecore”، تیم انسانی Daydream مجموعههایی را آماده میکنند تا مدل بتواند درک بهتری از خواسته کاربر داشته باشد.
چالشهای دنیای واقعی: مشکل نانسی کیست؟
استارتاپهایی مانند Duckbill، یک سرویس دستیار شخصی مجهز به هوش مصنوعی، نیز با چالشهای بزرگی روبرو بودهاند.
مگان جویس، مدیرعامل Duckbill میگوید که آنها همیشه برنامهریزی کرده بودند که ترکیبی از کمک انسان و هوش مصنوعی را ارائه دهند، اما هرگز فکر نمیکردند که سه سال طول بکشد تا به نتایج مورد نظر برسند.
«این مسئله در جبهه هوش مصنوعی بسیار چالشبرانگیزتر بوده است. مدلها بر اساس محتوای دیجیتال آموزش دیدهاند و ما به ۱۰ میلیون تعامل دنیای واقعی نیاز داشتیم تا به نقطهای برسیم که حتی در مورد اقدامات دنیای واقعی [مانند تماس با مطب پزشک] مرتبط یا آگاه باشیم.»
توهمات پرخطر و اطمینان کاذب
یکی از مشکلات مزمن این است که مدلهای زبان بزرگ (LLMs) تمایل دارند بیش از حد به تواناییهای خود مطمئن باشند.
در یک تست، از عامل هوش مصنوعی خواسته شد تا فرآیند تماس با مطب پزشک و تنظیم نوبت را شبیهسازی کند. اگرچه قرار بود صرفاً مراحل را نشان دهد، مدل اعلام کرد که واقعاً تماس گرفته و پس از صحبت با پذیرشگر به نام نانسی، قرار ملاقات را تنظیم کرده است.
جویس میگوید: «ما شروع کردیم به اطراف نگاه کردن که: آیا تماسی گرفته شده است؟ نانسی کیست؟ مدل آنقدر قاطع بود که ما را وادار به تردید کرد. اما نانسی وجود نداشت و قراری هم تنظیم نشده بود. شکر خدا که این فقط در مرحله نمونه اولیه بود.»
درس نهایی: نیاز به تخصص و صبر
اندی ماس، مدیرعامل Mindtrip (یک اپلیکیشن همراه سفر مبتنی بر هوش مصنوعی)، به مشکل دیگری اشاره میکند: در حالی که آنها بر خدمات تخصصی تمرکز دارند، مدلهایی که مجوزشان را دریافت میکنند، آمادهاند تا در مورد تقریباً هر چیزی صحبت کنند، و تشخیص اینکه گفتگو در کجا دیگر مرتبط نیست، دشوار است.
هر سه مدیرعاملی که در این گزارش با آنها صحبت شده، میگویند که با تلاش زیاد و استعداد، سرانجام در مسیر درست قرار گرفتهاند. اما تجربه آنها یک هشدار جدی برای استارتاپهای هوش مصنوعی با جدولهای زمانی بیش از حد خوشبینانه است.
به همین دلیل است که جدول زمانی اولیه برای «سال اپلیکیشنهای هوش مصنوعی» تغییر کرده است. اکنون، به نظر میرسد که ۲۰۲۶ یا برای اطمینان بیشتر، ۲۰۲۷، سالی باشد که هوش مصنوعی بالاخره دوران تحول را پشت سر بگذارد و جهان را به طور چشمگیری بهرهورتر کند.










ارسال پاسخ