Warning: mkdir(): No space left on device in /var/www/hottg/post.php on line 59

Warning: file_put_contents(aCache/aDaily/2025-07-20/post/aihappens/-337-338-): Failed to open stream: No such file or directory in /var/www/hottg/post.php on line 72
Заглянул на арену GPT. Если вы там не бываете @AI Happens
TG Telegram Group & Channel
AI Happens | United States America (US)
Create: Update:

Заглянул на арену GPT. Если вы там не бываете, но интересуетесь борьбой GPTs - рекомендую заглядывать: [https://chat.lmsys.org/?leaderboard]

Интересные новости:
1. OpenAI все еще (или снова) лидирует, оставаясь единственной с ELO оценкой 1300+. Вообще каждый раз ощущение, что у них есть модель на порядок умнее, но релизить они ее будут только, когда другие покажут что-то достойное против текущей модели.
2. Впервые зашел в раздел тестов на русском языке – здесь Google сопоставим с OpenAI. Кто-нибудь знает, как было раньше?
3. Опенсорсные модели от Meta и Mistral близки к "прошлому" поколению моделей, которым 3-5 месяцев.

Про опенс сорс прикольно — эти модели требуют много вычислительных ресурсов, но и возможностей у них достаточно.
Также ждем полноценного релиза Grok 2 от Маска (последний раз оценка была 1281).

Вообще фан иногда "поиграть" в арену. Можно тут:
https://chat.lmsys.org/

И если вы не знаете как работает ELO score, короткое объяснение:
ELO рейтинг в LMSYS Chatbot Arena рассчитывается на основе парных баталий между моделями, где пользователи голосуют за лучшую, по их мнению, модель. После каждой баталии рейтинг моделей обновляется. Если модель с более высоким рейтингом проигрывает, она теряет больше очков, чем если бы выиграла.


@aihappens

Заглянул на арену GPT. Если вы там не бываете, но интересуетесь борьбой GPTs - рекомендую заглядывать: [https://chat.lmsys.org/?leaderboard]

Интересные новости:
1. OpenAI все еще (или снова) лидирует, оставаясь единственной с ELO оценкой 1300+. Вообще каждый раз ощущение, что у них есть модель на порядок умнее, но релизить они ее будут только, когда другие покажут что-то достойное против текущей модели.
2. Впервые зашел в раздел тестов на русском языке – здесь Google сопоставим с OpenAI. Кто-нибудь знает, как было раньше?
3. Опенсорсные модели от Meta и Mistral близки к "прошлому" поколению моделей, которым 3-5 месяцев.

Про опенс сорс прикольно — эти модели требуют много вычислительных ресурсов, но и возможностей у них достаточно.
Также ждем полноценного релиза Grok 2 от Маска (последний раз оценка была 1281).

Вообще фан иногда "поиграть" в арену. Можно тут:
https://chat.lmsys.org/

И если вы не знаете как работает ELO score, короткое объяснение:
ELO рейтинг в LMSYS Chatbot Arena рассчитывается на основе парных баталий между моделями, где пользователи голосуют за лучшую, по их мнению, модель. После каждой баталии рейтинг моделей обновляется. Если модель с более высоким рейтингом проигрывает, она теряет больше очков, чем если бы выиграла.


@aihappens
824👍13🔥7🐳2🤝1


>>Click here to continue<<

AI Happens







Share with your best friend
VIEW MORE

United States America Popular Telegram Group (US)


Warning: Undefined array key 3 in /var/www/hottg/function.php on line 115

Fatal error: Uncaught mysqli_sql_exception: Can't create/write to file '/tmp/#sql-temptable-a06e-59d250-2908.MAI' (Errcode: 28 "No space left on device") in /var/www/hottg/function.php:216 Stack trace: #0 /var/www/hottg/function.php(216): mysqli_query() #1 /var/www/hottg/function.php(115): select() #2 /var/www/hottg/post.php(351): daCache() #3 /var/www/hottg/route.php(63): include_once('...') #4 {main} thrown in /var/www/hottg/function.php on line 216