ژیر
منو موبایل

ژیر

مدل O1 چیست؟ بررسی مدل O1 در OpenAI

OpenAI مدل هوش مصنوعی جدیدی با نام o1 را معرفی کرده که اولین مدل این استارتاپ از سری مدل‌های دارای قابلیت «استدلال» برای پاسخ‌دادن به سؤالات پیچیده‌تر است. علاوه‌براین، یک نسخه کوچک‌تر و ارزان‌تر از آن با نام o1-mini نیز منتشر شده است. در شایعات مربوط به این استارتاپ، به این مدل با نام توت فرنگی اشاره شده بود.

مدل o1 گام مهمی برای OpenAI در جهت هدف تولید مدل‌های هوش مصنوعی شبیه انسان است. این مدل نسبت به مدل‌های قبلی در نوشتن کد و حل مسائل چند مرحله‌ای بهتر عمل می‌کند، اما گران‌تر و کُندتر از GPT-4o است. همچنین OpenAI از o1 به‌عنوان یک نسخه «پیش‌نمایش» نام برده است تا بر نوظهور بودن آن تأکید داشته باشد.

ویدیوی زیر قابلیت مدل o1 در تولید کد مربوط به یک بازی ویدیویی از دستور متنی ساده را نشان می‌دهد:

 

هزینه و زمان دسترسی به مدل o1

کاربران ChatGPT Plus و Team هم‌اکنون به o1 و o1-mini دسترسی دارند و کاربران Enterprise و Edu در اوایل هفته آینده به آن دسترسی پیدا می‌کنند. همچنین OpenAI قصد دارد o1-mini را در دسترس تمام کاربران رایگان ChatGPT قرار دهد، اما هنوز زمان آن را اعلام نکرده است.

برای توسعه‌دهندگان این مدل با قیمت تقریباً بالایی ارائه شده است و API آن به ازای هر ۱ میلیون توکن ورودی ۱۵ دلار و به ازای هر ۱ میلیون توکن خروجی ۶۰ دلار هزینه دارد. برای مقایسه، GPT-4o به ازای هر ۱ میلیون توکن ورودی ۵ دلار و به ازای هر ۱ میلیون توکن خروجی ۱۵ دلار هزینه دارد.

 

همچنین روش آموزش این مدل نسبت به مدل‌های قبلی OpenAI متفاوت است، هرچند این استارتاپ در مورد جزئیات آن توضیحی دقیقی ارائه نکرده است. «جری تورک»، سرپرست تحقیقات OpenAI، می‌گوید که o1 با استفاده از یک الگوریتم بهینه‌سازی‌شده کاملاً جدید و مجموعه داده‌های آموزشی جدیدی که به‌طورخاص برای آن طراحی شده‌اند، آموزش داده شده است. درواقع برای o1 از تکنیکی با نام «یادگیری تقویتی» استفاده شده است که باعث می‌شود مدل با پاداش و جریمه مسائل را به تنهایی حل کند. سپس مانند انسان‌ها که مشکلات را با مرور مرحله‌به‌مرحله پردازش می‌کنند، از یک «زنجیره فکر» برای پردازش سؤالات استفاده می‌کند. با وجود این روش آموزش جدید، OpenAI می‌گوید که این مدل دقیق‌تر عمل می‌کند و توهم کمتری دارد. ویدیوی زیر قابلیت استدلال این مدل را نشان می‌دهد:

همچنین روش آموزش این مدل نسبت به مدل‌های قبلی OpenAI متفاوت است، هرچند این استارتاپ در مورد جزئیات آن توضیحی دقیقی ارائه نکرده است. «جری تورک»، سرپرست تحقیقات OpenAI، می‌گوید که o1 با استفاده از یک الگوریتم بهینه‌سازی‌شده کاملاً جدید و مجموعه داده‌های آموزشی جدیدی که به‌طورخاص برای آن طراحی شده‌اند، آموزش داده شده است.

درواقع برای مدل o1 از تکنیکی با نام «یادگیری تقویتی» استفاده شده است که باعث می‌شود مدل با پاداش و جریمه مسائل را به تنهایی حل کند. سپس مانند انسان‌ها که مشکلات را با مرور مرحله‌به‌مرحله پردازش می‌کنند، از یک «زنجیره فکر» برای پردازش سؤالات استفاده می‌کند.

با وجود این روش آموزش جدید، OpenAI می‌گوید که این مدل دقیق‌تر عمل می‌کند و توهم کمتری دارد.

ویدیوی زیر قابلیت استدلال این مدل را نشان می‌دهد:

عملکرد در آزمون‌ها و بنچمارک‌ها

عملکرد o1 توی بنچمارک‌های مختلف واقعاً استثنایی بوده. برای مثال:

‏شماره ۱: Codeforces (مسابقات برنامه‌نویسی): ۸۹ درصد بالایی
‏شماره ۲: AIME (المپیاد ریاضی آمریکا): بین ۵۰۰ دانش‌آموز برتر
‏شماره ۳: GPQA (فیزیک، زیست، شیمی): بالاتر از سطح دکترای انسانی
‏شماره ۴: المپیاد جهانی انفورماتیک (IOI): ۴۹ درصد جهانی
‏شماره ۵: امتیاز Elo در Codeforces: ۱۸۰۷ (۹۳ درصد بالایی)

‏این نتایج نشون می‌ده که o1 توی حل مسائل پیچیده و استدلال در کارهای چالش‌برانگیز واقعاً قوی عمل می‌کنه. این موفقیت‌ها اونو به یه ابزار قدرتمند برای کاربردهای مختلف در علوم، ریاضیات و برنامه‌نویسی تبدیل کرده.

محدودیت‌ها و چالش‌ها

‏با وجود قابلیت‌های پیشرفته، مدل o1 چندتا چالش هم داره. هزینه استفاده از این مدل خیلی بیشتره؛ ورودی‌هاش ۳ برابر و خروجی‌هاش ۴ برابر گران‌تر از GPT-4o توی API هست. بعضی وقت‌ها هم برای پردازش سوالات پیچیده بیشتر از ده ثانیه طول می‌کشه. این مدل در حال حاضر قابلیت‌هایی مثل مرور وب و تحلیل فایل‌ها رو نداره، که توی مدل‌های دیگه وجود داره.
‏علاوه بر این، گزارش‌هایی از “توهمات” بیشتر و تمایل به ارائه جواب‌های اشتباه با اطمینان بالا در مقایسه با مدل‌های قبلی وجود داره.

طبق توضیحات OpenAI، مهم‌ترین نکته‌ای که این مدل جدید را نسبت به GPT-4o متمایز می‌کند، توانایی آن در حل مسائل پیچیده، مانند کدنویسی و ریاضی است که بسیار بهتر از مدل‌های قبلی عمل می‌کند و همچنین توضیح استدلال آن است. درعین‌حال، o1 در بسیاری از حوزه‌ها به‌اندازه GPT-4o توانایی ندارد. o1 در دانش واقعی درباره جهان به خوبی عمل نمی‌کند و همچنین توانایی مرور وب یا پردازش فایل‌ها و تصاویر را ندارد.

مطالب مرتبط
چت جی پی تی 5

اطلاعات جدید مدل GPT-5 (چت جی پی تی ۵)

اطلاعات جدید مدل GPT-5 (چت جی پی تی ۵)‏۱. تا اواخر ۲۰۲۵ یا اوایل ۲۰۲۶ منتشر شود‏۳. ۵۲ تریلیون پارامتر …

< 1 دقیقه مطالعه مشاهده
جی پی تی5

خبر مهم در مورد جی پی تی۵ (GPT-5)

‏شرکت OpenAI در حال آماده‌سازی نسخه جدیدی از چت‌بات خود با نام GPT-5 (جی پی تی۵) است که انتظار می‌رود …

< 1 دقیقه مطالعه مشاهده
خرید نجومی جدید پردازنده GPU توسط ایلان ماسک!

خرید نجومی جدید پردازنده GPU توسط ایلان ماسک!

خرید نجومی جدید پردازنده GPU توسط ایلان ماسک!‏اینبار اون قصد داره تا پردازنده های Nvidia H100 رو به مقدار ۴ …

< 1 دقیقه مطالعه مشاهده

دیدگاهتان را بنویسید