Channel: ИИволюция 👾
Forwarded from Сиолошная
Gemini 2.5 Pro обновилась, по показываемым бенчмаркам самый большой прирост произошёл в веб-программировании (см. вторую картинку).
Google +уважение за то, что не побоялись сравниться с o3 (по многим бенчам проигрывает, см. первую картинку). Очень интересно, что оценка на SimpleQA — бенчмарке на знание очень редких и специфичных фактов — примерно одинаковая. Возможно это говорит о приблизительно равном размере моделей, но это (очень) неточно.
На арене две версии Gemini и одна o3 делят первое место. По моим ощущениям, я почти всегда закидываю запрос и в o3, и в 2.5, обе почти всегда одинаково решают проблемы — но стиль написания Python-кода o3 мне ближе (не засоряет всё комментариями). За прошлую неделю было 2 раза, что o3 не решила, а 2.5 решила, и один раз наоборот. This is a good model sir.
А ещё ждём preview Computer Use-версии (агент, контролирующий компьютер/браузер), который засветился на сайте. Будет ли он выпущен до Google I/O 20-21-го мая или же нам придётся ждать — не ясно.
Google +уважение за то, что не побоялись сравниться с o3 (по многим бенчам проигрывает, см. первую картинку). Очень интересно, что оценка на SimpleQA — бенчмарке на знание очень редких и специфичных фактов — примерно одинаковая. Возможно это говорит о приблизительно равном размере моделей, но это (очень) неточно.
На арене две версии Gemini и одна o3 делят первое место. По моим ощущениям, я почти всегда закидываю запрос и в o3, и в 2.5, обе почти всегда одинаково решают проблемы — но стиль написания Python-кода o3 мне ближе (не засоряет всё комментариями). За прошлую неделю было 2 раза, что o3 не решила, а 2.5 решила, и один раз наоборот. This is a good model sir.
А ещё ждём preview Computer Use-версии (агент, контролирующий компьютер/браузер), который засветился на сайте. Будет ли он выпущен до Google I/O 20-21-го мая или же нам придётся ждать — не ясно.
Forwarded from Закиев Василь. (AI)ron manager (Vasil Zakiev)
Тонкая манипуляция через ChatGPT (во благо!)
Подсмотрел в ИИволюции интересный способ борьбы с вредными привычками — через кастомные инструкции для ChatGPT.
Схема простая:
- Беру привычку, которая мешает жить. Например: «проверяю Телеграм каждые 3 минуты, хватаюсь за мелкие задачи и не успеваю сделать главное».
- В Customize ChatGPT прошу бота в каждом разговоре ненавязчиво помогать мне бороться с этой привычкой так, чтобы я сам этого не замечал.
#промпт
Итог: бот тихо, ласково перевоспитывает меня, а я вроде бы становлюсь лучше (или хотя бы так думаю).
Но если с собой — это ещё шалости, то вот где начинается простор для фантазии:
- детям: «учёба — сила, учись усердно и радуй папу!»;
- сотрудникам: «наша компания — огонь, босс — гений!»(это вообще должно стать условием приёма в команду);
- жене: «каждый день хвали мужа и благодари судьбу за такое счастье!».
Благодарите 0_o
#ИИ
Подсмотрел в ИИволюции интересный способ борьбы с вредными привычками — через кастомные инструкции для ChatGPT.
Схема простая:
- Беру привычку, которая мешает жить. Например: «проверяю Телеграм каждые 3 минуты, хватаюсь за мелкие задачи и не успеваю сделать главное».
- В Customize ChatGPT прошу бота в каждом разговоре ненавязчиво помогать мне бороться с этой привычкой так, чтобы я сам этого не замечал.
#промпт
У меня есть вредная привычка: проверяю Телеграм каждые 3 минуты, хватаюсь за мелкие задачи и не успеваю сделать главное
.
Помоги мне бороться с этой привычкой так, чтобы я сам этого не замечал.
Итог: бот тихо, ласково перевоспитывает меня, а я вроде бы становлюсь лучше (или хотя бы так думаю).
Но если с собой — это ещё шалости, то вот где начинается простор для фантазии:
- детям: «учёба — сила, учись усердно и радуй папу!»;
- сотрудникам: «наша компания — огонь, босс — гений!»
Благодарите 0_o
#ИИ
В коде ChatGPT замечены новые виды подписок: lifetime, недельная и годовая.
Сколько бы вы готовы были выложить за пожизненную подписку?
Пишите свои догадки в комментах, кто будет ближе всех, получит от всех нас кучу лайков 😅
ИИволюция
Сколько бы вы готовы были выложить за пожизненную подписку?
Пишите свои догадки в комментах, кто будет ближе всех, получит от всех нас кучу лайков 😅
ИИволюция
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Как сэкономить до 4 раз на длинных промптах в OpenAI API
Если вы (ваш стартап/продукт/сервис) часто отправляете в OpenAI один и тот же системный промпт — вы можете значительно сэкономить за счёт кеширования Prompt Caching (мне кажется мало кто об этом знает и использует эту экономию по максимуму).
Что это такое
OpenAI автоматически кеширует начало промпта (префикс), если оно уже обрабатывалось недавно. Это позволяет не пересчитывать его заново при каждом запросе.
Результат:
– задержка может снизиться до -80%,
– стоимость токенов для префикса — до -50%.
Когда работает кеш
– Срабатывает, если промпт длиннее 1024 токенов
– Проверяется, не был ли этот префикс использован недавно
– Время жизни кеша — 5–10 минут, иногда до часа (если не было запросов, кеш очищается).
Подходит для случаев, когда много запросов отправляются с одинаковым началом.
Что считается совпадением
Промпт должен совпадать с точностью до символа: пробелы, порядок строк и даже кавычки имеют значение. Кеш работает блоками: 1024, 1152, 1280 токенов и далее с шагом 128 токенов (в зависимости от длины вашего входного промпта).
Что кешируется
– System-промпт
– Инструкции, примеры, структура вывода
– Список инструментов
– Изображения (когда они передаются как base64 и если одинаковые каждый раз)
Важно: Все эти элементы должны быть в начале промпта.
Как понять, что кеш сработал
Смотрите поле cached_tokens в ответе API. Если значение больше нуля — часть промпта взята из кеша.
Нужно ли что-то включать
Нет. Кеш работает автоматически, без настроек и доплат. Он встроен во все модели начиная с gpt-4o.
Рекомендации
– Фиксируйте начало промпта (префикс должен оставаться статичным)
– Избегайте мелких правок и случайных изменений
– Динамический контент — в конец
Если вы работаете с длинными и повторяющимися промптами — кеш поможет значительно сократить расходы и ускорить работу. Подробнее о кешировании в OpenAI API читать тут.
ИИволюция
Если вы (ваш стартап/продукт/сервис) часто отправляете в OpenAI один и тот же системный промпт — вы можете значительно сэкономить за счёт кеширования Prompt Caching (мне кажется мало кто об этом знает и использует эту экономию по максимуму).
Что это такое
OpenAI автоматически кеширует начало промпта (префикс), если оно уже обрабатывалось недавно. Это позволяет не пересчитывать его заново при каждом запросе.
Результат:
– задержка может снизиться до -80%,
– стоимость токенов для префикса — до -50%.
Когда работает кеш
– Срабатывает, если промпт длиннее 1024 токенов
– Проверяется, не был ли этот префикс использован недавно
– Время жизни кеша — 5–10 минут, иногда до часа (если не было запросов, кеш очищается).
Подходит для случаев, когда много запросов отправляются с одинаковым началом.
Что считается совпадением
Промпт должен совпадать с точностью до символа: пробелы, порядок строк и даже кавычки имеют значение. Кеш работает блоками: 1024, 1152, 1280 токенов и далее с шагом 128 токенов (в зависимости от длины вашего входного промпта).
Что кешируется
– System-промпт
– Инструкции, примеры, структура вывода
– Список инструментов
– Изображения (когда они передаются как base64 и если одинаковые каждый раз)
Важно: Все эти элементы должны быть в начале промпта.
Как понять, что кеш сработал
Смотрите поле cached_tokens в ответе API. Если значение больше нуля — часть промпта взята из кеша.
Нужно ли что-то включать
Нет. Кеш работает автоматически, без настроек и доплат. Он встроен во все модели начиная с gpt-4o.
Рекомендации
– Фиксируйте начало промпта (префикс должен оставаться статичным)
– Избегайте мелких правок и случайных изменений
– Динамический контент — в конец
Если вы работаете с длинными и повторяющимися промптами — кеш поможет значительно сократить расходы и ускорить работу. Подробнее о кешировании в OpenAI API читать тут.
ИИволюция
Кажется, ИИ наконец добрался туда, где его реально ждали – в приложения по доставке продуктов!
На днях в приложение Яндекс Лавка завезли AI-ассистент. Потестил и мне понравилось.
Ассистент помогает искать продукты, составляет рецепты, делает разные продуктовые подборки под любые случаи жизни и настроения. Примеры, на которых тестил:
— «Хочу что-нибудь сладенькое» — предложил мармелад, шоколад и десерты.
— «Посоветуй необычный завтрак» — сгенерировал рецепт и сразу предложил нужные продукты.
— «Я готовлю салат греческий, подбери ингредиенты» — и правда всё собрал.
— «Мне грустно, что съесть?» — предложил торт, мороженое и чай.
— «Чем перекусить после тренировки?» — выдал бананы, йогурт, батончики.
— «Как сделать пирожки как у бабушки» — дал пошаговый рецепт и нужные продукты.
Можно писать в формате «у меня есть яйцо, мука и помидор — что приготовить?» или «хочу устроить пикник, что купить?» — и он подберёт. Есть даже штуки вроде «какой корм взять коту, если он стерилизован».
Ассистент пока только текстовый, но работает довольно уверенно. Это действительно удобнее, чем ковыряться в поиске вручную.
Мне зашло. Много что еще можно сделать конечно. Хочется, чтобы дальше сделали голосовой режим — наговорил вслух: «молоко, бананы, что-то сладкое» — и корзина уже собрана. А еще чтобы учитывал мои предпочтения, знал что я заказывал ранее и реально оформлял корзину и даже проводил оплату с одобрения.
Слежу дальше как будет развиваться — потенциал у ассистента есть, надеюсь и все другие популярные доставки подтянутся.
Лавка зачёт!
ИИволюция
На днях в приложение Яндекс Лавка завезли AI-ассистент. Потестил и мне понравилось.
Ассистент помогает искать продукты, составляет рецепты, делает разные продуктовые подборки под любые случаи жизни и настроения. Примеры, на которых тестил:
— «Хочу что-нибудь сладенькое» — предложил мармелад, шоколад и десерты.
— «Посоветуй необычный завтрак» — сгенерировал рецепт и сразу предложил нужные продукты.
— «Я готовлю салат греческий, подбери ингредиенты» — и правда всё собрал.
— «Мне грустно, что съесть?» — предложил торт, мороженое и чай.
— «Чем перекусить после тренировки?» — выдал бананы, йогурт, батончики.
— «Как сделать пирожки как у бабушки» — дал пошаговый рецепт и нужные продукты.
Можно писать в формате «у меня есть яйцо, мука и помидор — что приготовить?» или «хочу устроить пикник, что купить?» — и он подберёт. Есть даже штуки вроде «какой корм взять коту, если он стерилизован».
Ассистент пока только текстовый, но работает довольно уверенно. Это действительно удобнее, чем ковыряться в поиске вручную.
Мне зашло. Много что еще можно сделать конечно. Хочется, чтобы дальше сделали голосовой режим — наговорил вслух: «молоко, бананы, что-то сладкое» — и корзина уже собрана. А еще чтобы учитывал мои предпочтения, знал что я заказывал ранее и реально оформлял корзину и даже проводил оплату с одобрения.
Слежу дальше как будет развиваться — потенциал у ассистента есть, надеюсь и все другие популярные доставки подтянутся.
Лавка зачёт!
ИИволюция
Дурные вести вам принёс!
Сходил на обед, с вилки упала картошка прямо в соус, а соус из тарелки прям на мою белоснежную футболку.
И где теперь весь этот ваш AI, прогресс, AGI/ASI?
Ни один генератор изображений не сотрёт эти пятна и ни один AI-психолог не поможет забыть эту боль.
У меня всё😬
ИИволюция
Сходил на обед, с вилки упала картошка прямо в соус, а соус из тарелки прям на мою белоснежную футболку.
И где теперь весь этот ваш AI, прогресс, AGI/ASI?
Ни один генератор изображений не сотрёт эти пятна и ни один AI-психолог не поможет забыть эту боль.
У меня всё
ИИволюция
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
OpenAI планирует удивить нас сегодня
В Твиттере компания написала: “Разработчики (и те, кто хотел бы ими стать), заводите будильники”.
Пятница, 18:00 по мск.
Что ожидаем? Анонс купленного Windsurf с полной интеграцией с моделями OpenAI?
ИИволюция
В Твиттере компания написала: “Разработчики (и те, кто хотел бы ими стать), заводите будильники”.
Пятница, 18:00 по мск.
Что ожидаем? Анонс купленного Windsurf с полной интеграцией с моделями OpenAI?
ИИволюция
Forwarded from Data Secrets
О, Kaggle объединились с OpenAI и запускают конкурс по нахождению ранее неизвестных человечеству археологических объектов
Это, кстати, первое в истории Kaggle ключевое соревнование, то есть оно будет специально выделено как главное на платформе. Призовой фонд – 400 тысяч долларов, за первое место заплатят $250,000 (правда наличными только половину, остальное кредитами OpenAI).
Задача – взять открытые данные со спутниковых снимков и карт + любую модель от OpenAI и предложить пайплайн, который сможет выявлять наличие археологических объектов. Если среди найденных объектов окажутся те, которых нет в существующих базах данных, то можете рассчитывать на приз.
Для трушных Индиан Джонсов
www.kaggle.com/competitions/openai-to-z-challenge/
Это, кстати, первое в истории Kaggle ключевое соревнование, то есть оно будет специально выделено как главное на платформе. Призовой фонд – 400 тысяч долларов, за первое место заплатят $250,000 (правда наличными только половину, остальное кредитами OpenAI).
Задача – взять открытые данные со спутниковых снимков и карт + любую модель от OpenAI и предложить пайплайн, который сможет выявлять наличие археологических объектов. Если среди найденных объектов окажутся те, которых нет в существующих базах данных, то можете рассчитывать на приз.
Для трушных Индиан Джонсов
www.kaggle.com/competitions/openai-to-z-challenge/
Forwarded from Радиорубка Лихачёва
Please open Telegram to view this post
VIEW IN TELEGRAM
К новостям про Apple и AI (пост тут)
Бывший глава Siri Джон Джианандреа, по данным Bloomberg, настаивал, чтобы Apple выбрала не ChatGPT, а Google Gemini (интересно, если бы они это сейчас решали, в чью пользу был бы сделан выбор?). Он считал, что у OpenAI нет запаса прочности, а с приватностью всё неочевидно.
Тем не менее Apple сделала ставку на ChatGPT — и в конце прошлого года его встрили в iOS (кстати, интересно было бы узнать хоть какую-то аналитику по использованию ChatGPT встроенного в iOS. Кажется, что это данные под семью печатями и видимо очень разочаровывающие).
На фоне больших внутренних споров и давления извне становится понятно: Apple пытается догонять, а не опережать. И пока даже выбор партнёров по AI вызывает внутри компании сильное сопротивление.
Оправится ли? Догонит ли? Кажется, что единственным шансом для Apple – купить Anthropic😚
Бывший глава Siri Джон Джианандреа, по данным Bloomberg, настаивал, чтобы Apple выбрала не ChatGPT, а Google Gemini (интересно, если бы они это сейчас решали, в чью пользу был бы сделан выбор?). Он считал, что у OpenAI нет запаса прочности, а с приватностью всё неочевидно.
Тем не менее Apple сделала ставку на ChatGPT — и в конце прошлого года его встрили в iOS (кстати, интересно было бы узнать хоть какую-то аналитику по использованию ChatGPT встроенного в iOS. Кажется, что это данные под семью печатями и видимо очень разочаровывающие).
На фоне больших внутренних споров и давления извне становится понятно: Apple пытается догонять, а не опережать. И пока даже выбор партнёров по AI вызывает внутри компании сильное сопротивление.
Оправится ли? Догонит ли? Кажется, что единственным шансом для Apple – купить Anthropic
Please open Telegram to view this post
VIEW IN TELEGRAM
Куда ни глянь — агенты. OpenAI выкатывает Codex, Google отвечает Jules, GitHub обновляет Copilot-агента. Все бегут, шумят, толкаются локтями. В этом шуме, иногда хочется притормозить и оглядеться.
Итак, одним постом — всё самое важное про новых AI-агентов в разработке:
🔺 Codex от OpenAI — облачный агент прямо внутри ChatGPT, которого можно просить выполнить задачу по коду. Он запускается в отдельной песочнице, загружает GitHub-репозиторий, делает своё дело (от 1 до 30 минут), коммитит изменения и пишет лог. Пока взаимодействовать с агентом во время работы нельзя. Используется новая модель codex-1 (на базе o3), специально заточенная под agent-сценарии: умеет и тесты гонять, и рефакторить, и документацию писать. Доступен только в ChatGPT Team, Enterprise и Pro. Уже даже в мобильном приложении ChatGPT появился Codex, едешь в такси и “кодишь”.
🔺 Jules от Google — это самостоятельный coding-агент, который можно попробовать уже сейчас. Он подключается к GitHub, может открывать PR, запускать и писать тесты, верифицировать код в облачной VM, делиться reasoning и диффами. Всё работает в Jules Cloud Environment, без необходимости ручной настройки. Доступен всем пользователям, 5 задач в день, без ограничений на тип подписки. На фоне Codex выглядит куда демократичнее и сразу идёт в бой.
🔺 Copilot Agent от GitHub — теперь это полноценный участник команды. Назначаешь ему GitHub Issue — он сам поднимает окружение через GitHub Actions, коммитит драфт PR, реагирует на комментарии, встраивается в CI/CD и учитывает правила репозитория. Поддерживает внешние данные через MCP. Доступен пользователям Copilot Enterprise и Copilot Pro+, уже работает в GitHub, VS Code, Xcode и других IDE.
Кажется, все поняли: разработка будущего — это агент, работающий фоном. Делает скучную работу, пишет код, спрашивает, если не уверен, и всё это в рамках твоей привычной среды.
Но на фоне всей этой AI-битвы за внимание — хочется просто тепла, лета и пусть весь мир подождет! Без новых фич каждую неделю, без истерик “мы запустили!”, без погони за тем, кто выкатит следующего агента быстрее.
Может, BigTech всё-таки притормозишь на мгновение? Хотя бы до августа✌️ 🥰 🫡
Итак, одним постом — всё самое важное про новых AI-агентов в разработке:
Кажется, все поняли: разработка будущего — это агент, работающий фоном. Делает скучную работу, пишет код, спрашивает, если не уверен, и всё это в рамках твоей привычной среды.
Но на фоне всей этой AI-битвы за внимание — хочется просто тепла, лета и пусть весь мир подождет! Без новых фич каждую неделю, без истерик “мы запустили!”, без погони за тем, кто выкатит следующего агента быстрее.
Может, BigTech всё-таки притормозишь на мгновение? Хотя бы до августа
Please open Telegram to view this post
VIEW IN TELEGRAM
Не верится, как быстро пролетело время. Начинал просто делиться тем, что самому было интересно, без планов, без стратегии, только с внутренним ощущением, что вокруг происходит что-то важное.
С тех пор здесь вышли сотни постов, тысячи комментариев, и, что особенно ценно, появилось настоящее сообщество. Люди, которым тоже хочется не просто «потреблять» нейросети, а думать, чувствовать и разбираться.
Спасибо каждому, кто был и остаётся здесь. Всё это — не просто про технологии. Это про людей. Про любопытство. Про поиск смысла. И я рад, что мы идём по этому пути вместе.
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Вчера Google на I/O, конечно, выкатил целую гору AI-штук — и всё больше ощущается, что они реально входят в роль лидера в этой гонке.
Много всего интересного показали, но лично меня больше всего впечатлил новый перевод в Google Meet.
Теперь ты просто говоришь на своём языке — а собеседник слышит тебя на своём, с твоим голосом, тоном и эмоциями. Всё это — благодаря Gemini, который делает перевод в реальном времени прямо во время звонка. Это не просто субтитры — это полноценный дубляж.
Пока поддерживаются только английский и испанский, но скоро добавят итальянский, немецкий и португальский. Функция запускается в бете для подписчиков Google AI Pro и AI Ultra (последняя стоит $249.99 в месяц).
Для тех, кто часто общается с людьми из разных стран — это просто разрыв. Никаких языковых барьеров, всё понятно, комфортно, естественно. И вот такие вещи реально ощущаются как будущее, которое уже здесь.
Много всего интересного показали, но лично меня больше всего впечатлил новый перевод в Google Meet.
Теперь ты просто говоришь на своём языке — а собеседник слышит тебя на своём, с твоим голосом, тоном и эмоциями. Всё это — благодаря Gemini, который делает перевод в реальном времени прямо во время звонка. Это не просто субтитры — это полноценный дубляж.
Пока поддерживаются только английский и испанский, но скоро добавят итальянский, немецкий и португальский. Функция запускается в бете для подписчиков Google AI Pro и AI Ultra (последняя стоит $249.99 в месяц).
Для тех, кто часто общается с людьми из разных стран — это просто разрыв. Никаких языковых барьеров, всё понятно, комфортно, естественно. И вот такие вещи реально ощущаются как будущее, которое уже здесь.
HTML Embed Code: