Warning: mkdir(): No space left on device in /var/www/hottg/post.php on line 59

Warning: file_put_contents(aCache/aDaily/2025-07-16/post/llm_under_hood/--): Failed to open stream: No such file or directory in /var/www/hottg/post.php on line 72
Рейтинг AI+Coding агентов @LLM под капотом
TG Telegram Group & Channel
LLM под капотом | United States America (US)
Create: Update:

Рейтинг AI+Coding агентов

Кто-то догадался, как оценить использование людьми AI+Coding агентов. Они мониторят сгенерированные агентами Pull Requests в открытые Github repositories. На основе этого можно посчитать как объем созданных PRs, так и число тех, которые были приняты. Эти две цифры уже дают примерную оценку успешности работы (Merge success rate).

А если построить график по дням, то получится еще и динамика. Кого используют больше, кто становится точнее, кто самый популярный.

Вот ссылка на интерактивный отчет. Github Repo - тут расписана методика измерения.

Интересны тренды:

(1) OpenAI Codex появился месяц назад, но уже уделывает Devin в 10x раз по объемам использования. Успешность продолжает расти, как и объемы
(2) Сursor - второй по уровню успешности, но он в последнее становится хуже 🥹
(3) Успешность Copilot продолжает расти. Такими темпами они скоро обгонят Devin и догонят Cursor

А какие ресурсы для AI+Coding используете вы?

Ваш, @llm_under_hood 🤗

PS: Спасибо @kuchin, который поделился ссылкой в нашем чате курса.

PPS: как заметил @uberkinder - оценка успешности очень примерная, она зависит от UX продуктов. Надежнее просто смотреть на объем merged PRs.

Рейтинг AI+Coding агентов

Кто-то догадался, как оценить использование людьми AI+Coding агентов. Они мониторят сгенерированные агентами Pull Requests в открытые Github repositories. На основе этого можно посчитать как объем созданных PRs, так и число тех, которые были приняты. Эти две цифры уже дают примерную оценку успешности работы (Merge success rate).

А если построить график по дням, то получится еще и динамика. Кого используют больше, кто становится точнее, кто самый популярный.

Вот ссылка на интерактивный отчет. Github Repo - тут расписана методика измерения.

Интересны тренды:

(1) OpenAI Codex появился месяц назад, но уже уделывает Devin в 10x раз по объемам использования. Успешность продолжает расти, как и объемы
(2) Сursor - второй по уровню успешности, но он в последнее становится хуже 🥹
(3) Успешность Copilot продолжает расти. Такими темпами они скоро обгонят Devin и догонят Cursor

А какие ресурсы для AI+Coding используете вы?

Ваш, @llm_under_hood 🤗

PS: Спасибо @kuchin, который поделился ссылкой в нашем чате курса.

PPS: как заметил @uberkinder - оценка успешности очень примерная, она зависит от UX продуктов. Надежнее просто смотреть на объем merged PRs.
👍60🔥1710🤔4😱2🤣2😁1🤝1


>>Click here to continue<<

LLM под капотом






Share with your best friend
VIEW MORE

United States America Popular Telegram Group (US)


Warning: Undefined array key 3 in /var/www/hottg/function.php on line 115

Fatal error: Uncaught mysqli_sql_exception: Can't create/write to file '/tmp/#sql-temptable-a06e-427132-cc4.MAI' (Errcode: 28 "No space left on device") in /var/www/hottg/function.php:216 Stack trace: #0 /var/www/hottg/function.php(216): mysqli_query() #1 /var/www/hottg/function.php(115): select() #2 /var/www/hottg/post.php(351): daCache() #3 /var/www/hottg/route.php(63): include_once('...') #4 {main} thrown in /var/www/hottg/function.php on line 216