شرکت OpenAI مدل‌های جدید ChatGPT o1 خود را به تازگی معرفی کرده و کاربران ChatGPT برای اولین بار این فرصت را دارند تا مدل‌های هوش مصنوعی‌ ای که قبل از پاسخ دادن، مکث کرده و “فکر” می‌کنند، تجربه کنند. این مدل‌ها که با نام رمز “Strawberry” در داخل OpenAI شناخته می‌شوند، مدت‌هاست که مورد انتظار بوده‌اند. اما آیا Strawberry توانسته انتظارات را برآورده کند؟تقریباً بله.

در مقایسه با مدل GPT-4o، مدل‌های ChatGPT o1 مثل یک قدم رو به جلو و دو قدم به عقب هستند. OpenAI o1 در منطق و پاسخ به سوالات پیچیده به خوبی عمل می‌کند، اما استفاده از این مدل تقریباً چهار برابر گران‌تر از GPT-4o است. مدل جدید OpenAI فاقد ابزارها، قابلیت‌های چندگانه و سرعتی است که GPT-4o را بسیار تاثیرگذار کرده بود. در حقیقت، حتی خود OpenAI اذعان می‌کند که “GPT-4o همچنان بهترین گزینه برای اکثر پرسش‌ها است” و در جای دیگری اشاره می‌کند که o1 در انجام وظایف ساده مشکل دارد.

پروفسور راوید شوارتز زیو، استاد دانشگاه NYU که مدل‌های هوش مصنوعی را مطالعه می‌کند، می‌گوید: “این مدل تاثیرگذار است، اما به نظرم بهبود آن چندان چشمگیر نیست. در حل مشکلات خاص بهتر است، اما این بهبود را در همه جنبه‌ها نمی‌بینید.”

به همین دلایل، مهم است که از o1 تنها برای سوالاتی استفاده کنید که واقعاً برای آن طراحی شده است.

ChatGPT o1 منحصر به فرد است زیرا قبل از پاسخ دادن، “فکر” می‌کند، مشکلات بزرگ را به مراحل کوچکتر تقسیم کرده و تلاش می‌کند زمانی که یکی از این مراحل را درست یا نادرست انجام می‌دهد، آن را شناسایی کند. این نوع “استدلال چند مرحله‌ای” کاملاً جدید نیست…

مدیرعامل شرکت Workeraو استاد دانشگاه استنفورد می‌گوید: “اگر بتوانید الگوریتم یادگیری تقویتی را با برخی از تکنیک‌های مدل‌های زبانی OpenAI ترکیب کنید، از نظر فنی می‌توانید تفکر مرحله به مرحله ایجاد کرده و به مدل هوش مصنوعی اجازه دهید از ایده‌های بزرگ به سمت عقب حرکت کند.”

OpenAI o1 همچنین به طرز منحصر به فردی گران است. در اکثر مدل‌ها، شما برای توکن‌های ورودی و خروجی هزینه پرداخت می‌کنید. اما o1 یک فرآیند مخفی اضافه می‌کند (مراحل کوچکی که مدل برای حل مشکلات بزرگ آن‌ها را انجام می‌دهد)، که مقدار زیادی محاسبه را اضافه می‌کند که هرگز به طور کامل نمی‌بینید. OpenAI برخی از جزئیات این فرآیند را مخفی نگه می‌دارد تا مزیت رقابتی خود را حفظ کند. با این حال، شما همچنان برای این فرآیند به شکل توکن‌های “استدلالی” هزینه پرداخت می‌کنید. این مسئله نشان می‌دهد که باید در استفاده از ChatGPT  o1 دقت کنید تا برای پرسش‌های ساده، مانند اینکه پایتخت ایالت نوادا کجاست، هزینه زیادی نپردازید.

ایده یک مدل هوش مصنوعی که به شما کمک می‌کند “از ایده‌های بزرگ به عقب حرکت کنید” بسیار قوی است. در عمل، این مدل در این زمینه نسبتاً خوب عمل می‌کند.

ChatGPT o1برای سوالات ساده‌تر، خیلی زیاد کار می‌کند. این مدل نمی‌داند چه زمانی باید از بیش از حد فکر کردن دست بکشد. از آن پرسیدیم در کدام مناطق یک کشور می‌توان درختان سدر پیدا کرد و این مدل پاسخ بیش از ۸۰۰ کلمه‌ ای ارائه داد که شامل انواع مختلف درختان سدر در سراسر کشور و نام‌های علمی آن‌ها بود. حتی به دلایلی با سیاست‌های OpenAI مشورت کرد. GPT-4o کار بسیار بهتری در پاسخ به این سوال داشت و در حدود سه جمله توضیح داد که می‌توان درختان سدر را در سراسر کشور پیدا کرد.

به نوعی، Strawberry هرگز نمی‌توانست انتظارات را برآورده کند. گزارش‌های مربوط به مدل‌های استدلالی OpenAI از نوامبر ۲۰۲۳ شروع به پخش شدند، درست زمانی که همه به دنبال پاسخی درباره اخراج سم آلتمن از هیئت مدیره OpenAI بودند. این موضوع باعث ایجاد شایعات در دنیای هوش مصنوعی شد و برخی حتی گمان کردند که Strawberry نوعی AGI (هوش مصنوعی عمومی) است، همان هوش مصنوعی پیشرفته‌ای که OpenAI قصد دارد در نهایت ایجاد کند.

آلتمن تایید کرد که o1 AGI نیست تا هرگونه ابهامی را رفع کند، نه اینکه بعد از استفاده از آن گیج شوید. مدیرعامل همچنین با کاهش انتظارات پیرامون این مدل، توییت کرد: “o1 هنوز ناقص است، هنوز محدود است و همچنان در اولین استفاده تاثیر بیشتری می‌گذارد تا بعد از اینکه زمان بیشتری با آن بگذرانید.”

بقیه دنیای هوش مصنوعی نیز به تدریج با یک عرضه کمتر هیجان‌انگیز مواجه می‌شوند.

روهان پاندی، مهندس تحقیقاتی در استارتاپ هوش مصنوعی ReWorkd می‌گوید: “انتظارات به نوعی از کنترل OpenAI خارج شد.” او امیدوار است که توانایی استدلال o1 به اندازه کافی خوب باشد تا مجموعه‌ای از مشکلات پیچیده که GPT-4 در آن‌ها ناکام است را حل کند. این همان نگاهی است که اکثر افراد در صنعت به o1 دارند، اما نه به عنوان یک قدم انقلابی به جلو که GPT-4 برای این صنعت به شمار می‌رفت.

اصول اساسی مورد استفاده برای ایجاد o1 سال‌ها پیش بازمی‌گردد. Google در سال ۲۰۱۶ از تکنیک‌های مشابهی برای ایجاد AlphaGo، اولین سیستم هوش مصنوعی که توانست قهرمان جهان در بازی تخته‌ای Go را شکست دهد، استفاده کرد. اندی هریسون، مدیرعامل شرکت سرمایه‌گذاری S32، به این موضوع اشاره می‌کند.