مدل O1 چیست؟ بررسی مدل O1 در OpenAI
OpenAI مدل هوش مصنوعی جدیدی با نام o1 را معرفی کرده که اولین مدل این استارتاپ از سری مدلهای دارای قابلیت «استدلال» برای پاسخدادن به سؤالات پیچیدهتر است. علاوهبراین، یک نسخه کوچکتر و ارزانتر از آن با نام o1-mini نیز منتشر شده است. در شایعات مربوط به این استارتاپ، به این مدل با نام توت فرنگی اشاره شده بود.
مدل o1 گام مهمی برای OpenAI در جهت هدف تولید مدلهای هوش مصنوعی شبیه انسان است. این مدل نسبت به مدلهای قبلی در نوشتن کد و حل مسائل چند مرحلهای بهتر عمل میکند، اما گرانتر و کُندتر از GPT-4o است. همچنین OpenAI از o1 بهعنوان یک نسخه «پیشنمایش» نام برده است تا بر نوظهور بودن آن تأکید داشته باشد.
ویدیوی زیر قابلیت مدل o1 در تولید کد مربوط به یک بازی ویدیویی از دستور متنی ساده را نشان میدهد:
هزینه و زمان دسترسی به مدل o1
کاربران ChatGPT Plus و Team هماکنون به o1 و o1-mini دسترسی دارند و کاربران Enterprise و Edu در اوایل هفته آینده به آن دسترسی پیدا میکنند. همچنین OpenAI قصد دارد o1-mini را در دسترس تمام کاربران رایگان ChatGPT قرار دهد، اما هنوز زمان آن را اعلام نکرده است.
برای توسعهدهندگان این مدل با قیمت تقریباً بالایی ارائه شده است و API آن به ازای هر ۱ میلیون توکن ورودی ۱۵ دلار و به ازای هر ۱ میلیون توکن خروجی ۶۰ دلار هزینه دارد. برای مقایسه، GPT-4o به ازای هر ۱ میلیون توکن ورودی ۵ دلار و به ازای هر ۱ میلیون توکن خروجی ۱۵ دلار هزینه دارد.

همچنین روش آموزش این مدل نسبت به مدلهای قبلی OpenAI متفاوت است، هرچند این استارتاپ در مورد جزئیات آن توضیحی دقیقی ارائه نکرده است. «جری تورک»، سرپرست تحقیقات OpenAI، میگوید که o1 با استفاده از یک الگوریتم بهینهسازیشده کاملاً جدید و مجموعه دادههای آموزشی جدیدی که بهطورخاص برای آن طراحی شدهاند، آموزش داده شده است.
درواقع برای مدل o1 از تکنیکی با نام «یادگیری تقویتی» استفاده شده است که باعث میشود مدل با پاداش و جریمه مسائل را به تنهایی حل کند. سپس مانند انسانها که مشکلات را با مرور مرحلهبهمرحله پردازش میکنند، از یک «زنجیره فکر» برای پردازش سؤالات استفاده میکند.
با وجود این روش آموزش جدید، OpenAI میگوید که این مدل دقیقتر عمل میکند و توهم کمتری دارد.
ویدیوی زیر قابلیت استدلال این مدل را نشان میدهد:
عملکرد در آزمونها و بنچمارکها
عملکرد o1 توی بنچمارکهای مختلف واقعاً استثنایی بوده. برای مثال:
شماره ۱: Codeforces (مسابقات برنامهنویسی): ۸۹ درصد بالایی
شماره ۲: AIME (المپیاد ریاضی آمریکا): بین ۵۰۰ دانشآموز برتر
شماره ۳: GPQA (فیزیک، زیست، شیمی): بالاتر از سطح دکترای انسانی
شماره ۴: المپیاد جهانی انفورماتیک (IOI): ۴۹ درصد جهانی
شماره ۵: امتیاز Elo در Codeforces: ۱۸۰۷ (۹۳ درصد بالایی)
این نتایج نشون میده که o1 توی حل مسائل پیچیده و استدلال در کارهای چالشبرانگیز واقعاً قوی عمل میکنه. این موفقیتها اونو به یه ابزار قدرتمند برای کاربردهای مختلف در علوم، ریاضیات و برنامهنویسی تبدیل کرده.
محدودیتها و چالشها
با وجود قابلیتهای پیشرفته، مدل o1 چندتا چالش هم داره. هزینه استفاده از این مدل خیلی بیشتره؛ ورودیهاش ۳ برابر و خروجیهاش ۴ برابر گرانتر از GPT-4o توی API هست. بعضی وقتها هم برای پردازش سوالات پیچیده بیشتر از ده ثانیه طول میکشه. این مدل در حال حاضر قابلیتهایی مثل مرور وب و تحلیل فایلها رو نداره، که توی مدلهای دیگه وجود داره.
علاوه بر این، گزارشهایی از “توهمات” بیشتر و تمایل به ارائه جوابهای اشتباه با اطمینان بالا در مقایسه با مدلهای قبلی وجود داره.
طبق توضیحات OpenAI، مهمترین نکتهای که این مدل جدید را نسبت به GPT-4o متمایز میکند، توانایی آن در حل مسائل پیچیده، مانند کدنویسی و ریاضی است که بسیار بهتر از مدلهای قبلی عمل میکند و همچنین توضیح استدلال آن است. درعینحال، o1 در بسیاری از حوزهها بهاندازه GPT-4o توانایی ندارد. o1 در دانش واقعی درباره جهان به خوبی عمل نمیکند و همچنین توانایی مرور وب یا پردازش فایلها و تصاویر را ندارد.

اطلاعات جدید مدل GPT-5 (چت جی پی تی ۵)
اطلاعات جدید مدل GPT-5 (چت جی پی تی ۵)۱. تا اواخر ۲۰۲۵ یا اوایل ۲۰۲۶ منتشر شود۳. ۵۲ تریلیون پارامتر …

خبر مهم در مورد جی پی تی۵ (GPT-5)
شرکت OpenAI در حال آمادهسازی نسخه جدیدی از چتبات خود با نام GPT-5 (جی پی تی۵) است که انتظار میرود …

خرید نجومی جدید پردازنده GPU توسط ایلان ماسک!
خرید نجومی جدید پردازنده GPU توسط ایلان ماسک!اینبار اون قصد داره تا پردازنده های Nvidia H100 رو به مقدار ۴ …