TG Telegram Group & Channel
Geek Alerts | United States America (US)
Create: Update:

شرکت OpenAI امشب در آخرین روز از «۱۲ روز با OpenAI» از مدل o3 رونمایی کردن. این مدل به حدی قوی بوده که در بنچمارک‌های ARC-AGI که یک بنچمارک برای وظایفی‌ که از یک AGI انتظار می‌ره هست، تونسته به 87.5% در حالت high-computingش البته با مصرف میلیون‌ها توکن برسه. درحالی که مدل o1 فقط به 13درصد رسیده بود. از طرفی هنوز در بعضی از تسک‌های این بنچمارک ضعف‌هایی رو نشون داده که نشون‌دهنده راه دراز برای رسیدن به یک AGI کامل هست اما بسیار پیشرفت چشمگیریه. این مدل به ریتینگ 2727 کدفرسز رسیده که این یعنی رتبه 175م این سایت، درواقع این مدل الان به راحتی می‌تونه به یک مدال جهانی المپیاد کامپیوتر(IOI) برسه. نسخه mini این مدل در اواخر ماه بعد عرضه خواهد شد. البته شرکت‌ها و پژوهشگران می‌تونن برای تست‌های safety به این مدل دسترسی داشته باشن.

tweet
hadi @geekalerts

شرکت OpenAI امشب در آخرین روز از «۱۲ روز با OpenAI» از مدل o3 رونمایی کردن. این مدل به حدی قوی بوده که در بنچمارک‌های ARC-AGI که یک بنچمارک برای وظایفی‌ که از یک AGI انتظار می‌ره هست، تونسته به 87.5% در حالت high-computingش البته با مصرف میلیون‌ها توکن برسه. درحالی که مدل o1 فقط به 13درصد رسیده بود. از طرفی هنوز در بعضی از تسک‌های این بنچمارک ضعف‌هایی رو نشون داده که نشون‌دهنده راه دراز برای رسیدن به یک AGI کامل هست اما بسیار پیشرفت چشمگیریه. این مدل به ریتینگ 2727 کدفرسز رسیده که این یعنی رتبه 175م این سایت، درواقع این مدل الان به راحتی می‌تونه به یک مدال جهانی المپیاد کامپیوتر(IOI) برسه. نسخه mini این مدل در اواخر ماه بعد عرضه خواهد شد. البته شرکت‌ها و پژوهشگران می‌تونن برای تست‌های safety به این مدل دسترسی داشته باشن.

tweet
hadi @geekalerts


>>Click here to continue<<

Geek Alerts







Share with your best friend
VIEW MORE

United States America Popular Telegram Group (US)