ژیر
منو موبایل

ژیر

o1-model-1024×576.jpg

همچنین روش آموزش این مدل نسبت به مدل‌های قبلی OpenAI متفاوت است، هرچند این استارتاپ در مورد جزئیات آن توضیحی دقیقی ارائه نکرده است. «جری تورک»، سرپرست تحقیقات OpenAI، می‌گوید که o1 با استفاده از یک الگوریتم بهینه‌سازی‌شده کاملاً جدید و مجموعه داده‌های آموزشی جدیدی که به‌طورخاص برای آن طراحی شده‌اند، آموزش داده شده است. درواقع برای o1 از تکنیکی با نام «یادگیری تقویتی» استفاده شده است که باعث می‌شود مدل با پاداش و جریمه مسائل را به تنهایی حل کند. سپس مانند انسان‌ها که مشکلات را با مرور مرحله‌به‌مرحله پردازش می‌کنند، از یک «زنجیره فکر» برای پردازش سؤالات استفاده می‌کند. با وجود این روش آموزش جدید، OpenAI می‌گوید که این مدل دقیق‌تر عمل می‌کند و توهم کمتری دارد. ویدیوی زیر قابلیت استدلال این مدل را نشان می‌دهد:

مطالب مرتبط
افزایش سرعت سایت

ترفند طلایی افزایش سرعت سایت

https://www.aparat.com/v/dgx44n2https://www.aparat.com/v/dgx44n2 سرعت سایت یکی از عوامل کلیدی در تجربه کاربری و بهبود رتبه‌بندی سایت‌ها در موتورهای جستجو است. هرچه سایت …

2 دقیقه مطالعه مشاهده
راهنمای جامع انجام پروژه‌ هوش مصنوعی

راهنمای جامع انجام پروژه‌ هوش مصنوعی

در دنیای پرشتاب امروز، هوش مصنوعی (AI) به یکی از مهم‌ترین ابزارها برای رشد و تحول صنایع مختلف تبدیل شده …

2 دقیقه مطالعه مشاهده
متریک Recall در الگوریتم‌های کلاسیفیکیشن

متریک Recall در الگوریتم‌های کلاسیفیکیشن

https://www.aparat.com/v/pfjya78https://www.aparat.com/v/pfjya78 در یادگیری ماشین، متریک‌ها نقش بسیار مهمی در ارزیابی عملکرد مدل‌های یادگیری دارند. متریک‌های مختلف برای اهداف متفاوت طراحی …

2 دقیقه مطالعه مشاهده

دیدگاهتان را بنویسید