شرکت OpenAI مدلهای جدید ChatGPT o1 خود را به تازگی معرفی کرده و کاربران ChatGPT برای اولین بار این فرصت را دارند تا مدلهای هوش مصنوعی ای که قبل از پاسخ دادن، مکث کرده و “فکر” میکنند، تجربه کنند. این مدلها که با نام رمز “Strawberry” در داخل OpenAI شناخته میشوند، مدتهاست که مورد انتظار بودهاند. اما آیا Strawberry توانسته انتظارات را برآورده کند؟تقریباً بله.
در مقایسه با مدل GPT-4o، مدلهای ChatGPT o1 مثل یک قدم رو به جلو و دو قدم به عقب هستند. OpenAI o1 در منطق و پاسخ به سوالات پیچیده به خوبی عمل میکند، اما استفاده از این مدل تقریباً چهار برابر گرانتر از GPT-4o است. مدل جدید OpenAI فاقد ابزارها، قابلیتهای چندگانه و سرعتی است که GPT-4o را بسیار تاثیرگذار کرده بود. در حقیقت، حتی خود OpenAI اذعان میکند که “GPT-4o همچنان بهترین گزینه برای اکثر پرسشها است” و در جای دیگری اشاره میکند که o1 در انجام وظایف ساده مشکل دارد.
پروفسور راوید شوارتز زیو، استاد دانشگاه NYU که مدلهای هوش مصنوعی را مطالعه میکند، میگوید: “این مدل تاثیرگذار است، اما به نظرم بهبود آن چندان چشمگیر نیست. در حل مشکلات خاص بهتر است، اما این بهبود را در همه جنبهها نمیبینید.”
به همین دلایل، مهم است که از o1 تنها برای سوالاتی استفاده کنید که واقعاً برای آن طراحی شده است.
ChatGPT o1 منحصر به فرد است زیرا قبل از پاسخ دادن، “فکر” میکند، مشکلات بزرگ را به مراحل کوچکتر تقسیم کرده و تلاش میکند زمانی که یکی از این مراحل را درست یا نادرست انجام میدهد، آن را شناسایی کند. این نوع “استدلال چند مرحلهای” کاملاً جدید نیست…
مدیرعامل شرکت Workeraو استاد دانشگاه استنفورد میگوید: “اگر بتوانید الگوریتم یادگیری تقویتی را با برخی از تکنیکهای مدلهای زبانی OpenAI ترکیب کنید، از نظر فنی میتوانید تفکر مرحله به مرحله ایجاد کرده و به مدل هوش مصنوعی اجازه دهید از ایدههای بزرگ به سمت عقب حرکت کند.”
OpenAI o1 همچنین به طرز منحصر به فردی گران است. در اکثر مدلها، شما برای توکنهای ورودی و خروجی هزینه پرداخت میکنید. اما o1 یک فرآیند مخفی اضافه میکند (مراحل کوچکی که مدل برای حل مشکلات بزرگ آنها را انجام میدهد)، که مقدار زیادی محاسبه را اضافه میکند که هرگز به طور کامل نمیبینید. OpenAI برخی از جزئیات این فرآیند را مخفی نگه میدارد تا مزیت رقابتی خود را حفظ کند. با این حال، شما همچنان برای این فرآیند به شکل توکنهای “استدلالی” هزینه پرداخت میکنید. این مسئله نشان میدهد که باید در استفاده از ChatGPT o1 دقت کنید تا برای پرسشهای ساده، مانند اینکه پایتخت ایالت نوادا کجاست، هزینه زیادی نپردازید.
ایده یک مدل هوش مصنوعی که به شما کمک میکند “از ایدههای بزرگ به عقب حرکت کنید” بسیار قوی است. در عمل، این مدل در این زمینه نسبتاً خوب عمل میکند.
ChatGPT o1برای سوالات سادهتر، خیلی زیاد کار میکند. این مدل نمیداند چه زمانی باید از بیش از حد فکر کردن دست بکشد. از آن پرسیدیم در کدام مناطق یک کشور میتوان درختان سدر پیدا کرد و این مدل پاسخ بیش از ۸۰۰ کلمه ای ارائه داد که شامل انواع مختلف درختان سدر در سراسر کشور و نامهای علمی آنها بود. حتی به دلایلی با سیاستهای OpenAI مشورت کرد. GPT-4o کار بسیار بهتری در پاسخ به این سوال داشت و در حدود سه جمله توضیح داد که میتوان درختان سدر را در سراسر کشور پیدا کرد.
به نوعی، Strawberry هرگز نمیتوانست انتظارات را برآورده کند. گزارشهای مربوط به مدلهای استدلالی OpenAI از نوامبر ۲۰۲۳ شروع به پخش شدند، درست زمانی که همه به دنبال پاسخی درباره اخراج سم آلتمن از هیئت مدیره OpenAI بودند. این موضوع باعث ایجاد شایعات در دنیای هوش مصنوعی شد و برخی حتی گمان کردند که Strawberry نوعی AGI (هوش مصنوعی عمومی) است، همان هوش مصنوعی پیشرفتهای که OpenAI قصد دارد در نهایت ایجاد کند.
آلتمن تایید کرد که o1 AGI نیست تا هرگونه ابهامی را رفع کند، نه اینکه بعد از استفاده از آن گیج شوید. مدیرعامل همچنین با کاهش انتظارات پیرامون این مدل، توییت کرد: “o1 هنوز ناقص است، هنوز محدود است و همچنان در اولین استفاده تاثیر بیشتری میگذارد تا بعد از اینکه زمان بیشتری با آن بگذرانید.”
بقیه دنیای هوش مصنوعی نیز به تدریج با یک عرضه کمتر هیجانانگیز مواجه میشوند.
روهان پاندی، مهندس تحقیقاتی در استارتاپ هوش مصنوعی ReWorkd میگوید: “انتظارات به نوعی از کنترل OpenAI خارج شد.” او امیدوار است که توانایی استدلال o1 به اندازه کافی خوب باشد تا مجموعهای از مشکلات پیچیده که GPT-4 در آنها ناکام است را حل کند. این همان نگاهی است که اکثر افراد در صنعت به o1 دارند، اما نه به عنوان یک قدم انقلابی به جلو که GPT-4 برای این صنعت به شمار میرفت.
اصول اساسی مورد استفاده برای ایجاد o1 سالها پیش بازمیگردد. Google در سال ۲۰۱۶ از تکنیکهای مشابهی برای ایجاد AlphaGo، اولین سیستم هوش مصنوعی که توانست قهرمان جهان در بازی تختهای Go را شکست دهد، استفاده کرد. اندی هریسون، مدیرعامل شرکت سرمایهگذاری S32، به این موضوع اشاره میکند.