TG Telegram Group Link
Channel: ИИволюция 👾
Back to Bottom
Media is too big
VIEW IN TELEGRAM
Thomas Iljic, product lead в Veo 3, высказал интересные мысли — что видео, симуляции, игры, всё это начинает сливаться в нечто единое. Не контент по раздельности, а симулированная реальность, которую можно ставить на паузу, переписывать, проживать заново. Запахло “Черным зеркалом” 😀

И вот сижу и думаю, а воображение начинает дорисовывать картинку. Мы всегда смотрели на экран тв, монитора, смартфона — как на окно: оно что-то нам показывает, а ты просто смотришь (потребляешь). В кино наблюдаешь, в игре участвуешь, но с жёсткими ограничениями и правилами.

А что если с приходом мощных 3D и видео-генераций, VR-очков и нейроимплантов, которые могут дополнить наши ощущения, это окно превратится в дверь, куда можно войти и погрузиться в атмосферу нужного момента? Ты уже не зритель, а участник.

Когда-то чудом было ч/б фото. Потом цветное. Потом видео.

И мы постепенно приходим к тому, что любое фото уже сейчас можно оживить, наложить липсинк, синтезировать голос по речи конкретного человека.
Какие-то моменты можно уже сильно иначе проживать и вспоминать из прошлого. У нас хранятся тысячи фото и видео на смартфоне, есть записанные голоса наших близких. Это можно расширить и на тонны контента в сети.

Их комбинация способна воссоздавать те самые моменты, атмосферу, эмоции, 3D-сцены.
Это уже не контент в привычном понимании. Это переживание, которое можно отмотать, как память. Перепрожить. Поменять.

Как в одной из серий «Черного зеркала» в последнем сезоне, где на основе фото или воспоминания можно создать сцену и оказаться в том самом моменте с помощью нейро-штуки, которую закрепляешь себе у виска.

Может, скоро мы будем говорить не “смотри, какую картинку я сгенерировал”, не “зацени фотку”, а “загляни в этот момент, почувствуй, раздели со мной радость, проживи его по-своему, почувствуй вайб”.

Не фото, не видео, не игра — а момент, симуляция, “набор ощущений”, которые ты просто кому-то кидаешь в чат в виде ссылки.
“Память” в ChatGPT теперь бесплатная

Вчера начали раскатывать прокаченную фичу “Память” в ChatGPT для пользователей без подписки, но важно, чтобы пользователь имел аккаунт и был авторизован (было бы странно, если бы было иначе 😬)

Память для бесплатных будет урезанной по длине контекста в отличие от Plus и Pro пользоватей, контекст памяти у которых длиннее (на сколько длиннее кстати?)

Подробнее о том, что такое “Память” в ChatGPT и как она работает, я писал в этом посте.

В Европе свои прибамбасы с активацией этой фичи, почитать можно тут
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Сэм Альтман говорит о будущем ИИ не как о гигантской модели, а как раз наоборот. Будущее за очень компактной моделью, которая умеет рассуждать лучше человека.

Главная идея не в том, чтобы модель знала всё на свете (это супер дорого и неэффективно), а в том, чтобы она могла быстро и точно думать, опираясь на огромный контекст (до триллиона токенов, т.е. вместить в себя всю вашу жизнь или все знания компании) и подключая любые нужные инструменты — от баз данных до физического симулятора.

По сути, это не хранилище знаний, а универсальный механизм принятия решений, который может решать любые задачи, даже если сам не содержит нужных данных. Всё, что нужно — дать доступ к информации и инструментам.

Именно к такому ИИ, по мнению Альтмана, мы сейчас и идём (вместе с OpenAI).

Сразу вспомнилась песенка: Мы в город Изумрудный, идём дорогой трудной, дорогой непростой. И Сэм в роли Гудвина 😉
Forwarded from Data Secrets
OpenAI показали большое обновление ChatGPT для бизнеса: теперь в бота можно интегрировать любые базы знаний вашей компании

Подсоединить к ChatGPT можно Google Drive, Dropbox, SharePoint, Box, OneDrive и другие сервисы. По этим данным можно будет осуществлять поиск, Deep Reserch, ну или просто обрабатывать как хотите.

Это называется "коннекторы", фича раскатывается на пользователей Team и Enterprise. Говорят, что данные "будут оставаться внутри периметра компании", и у каждого юзера будет доступ только к тем файлам, к которым у него есть доступ в корпоративной структуре.

Кроме того, OpenAI анонсировали record mode: это режим записи и транскрибирования любых ваших встреч. Модель сможет автоматически получать доступ к вашим встречам из Teams, Zoom, Google Meet и так далее (+ коннектиться с календарем) и обрабатывать информацию со встречи.

Можно будет задавать по митингам вопросы, суммаризировать, превратить в документ, таблицу и прочее. Доступно, аналогично, для Enterprise. В Team завезут в ближайшее время.

Кстати, как раз сегодня OpenAI пробили три миллиона платных бизнес-пользователей 🤑

Ну и, по классике, ищем на скрине со стрима пасхалки ⬆️
Please open Telegram to view this post
VIEW IN TELEGRAM
Ну и по классике 😋
Please open Telegram to view this post
VIEW IN TELEGRAM
Полный список коннекторов, которые анонсировали в ChatGPT

Коннекторы для других сервисов будут постепенно появляться. Но вы можете подключать свои кастомные коннекторы в виде MCP.

Лимитов для коннекторов нет, они работают в рамках общего лимита для выбранной модели и вашего тарифа.

Более подробно о коннекторах тут
This media is not supported in your browser
VIEW IN TELEGRAM
А вот и видео от OpenAI как подключить кастомный (свой) MCP в виде коннектора для ChatGPT Deep Search.
И немного подробностей про record mode.

Завезли режим записи разговоров только в Mac OS приложение и пока только для Team тарифа. Нажал кнопку и модель начинает слушать.

Что происходит дальше:

— Запись превращается в расшифровку и саммари.
— Из неё автоматически извлекаются ключевые решения, действия (action points), темы/задачи.
— Всё это сохраняется в отдельной “canvas” страничке внутри чата.
— И далее в любой момент можно задать вопрос типа “Что мы решили на вчерашней встрече?” и получить ответ с цитатами.

Плюс, по желанию превратить это всё в письмо, план, табличку или даже код.

Запись длится до 2 часов. Аудио удаляется сразу после транскрибации. Модель не учится на этих данных (верим?).

Работает пока лучше всего на английском. Но поддерживает и другие языки.

Теперь ждем, когда завезут в остальные тарифы. Мега крутая фича! Больше деталей тут
Media is too big
VIEW IN TELEGRAM
Ура! Большой релиз Cursor версии 1.0

Редактор получил крупное обновление:

BugBot: автоматически проверяет pull request’ы в GitHub, ищет потенциальные баги и оставляет комментарии. Один клик на “Fix in Cursor” и ты сразу в редакторе с готовым промптом для исправления.

Memories: Cursor теперь может запоминать факты, правила и особенности кода, с которым ты работаешь. Эти «воспоминания» сохраняются на уровне проекта, и могут использоваться в будущих запросах, чтобы не объяснять одно и то же по кругу. Управляется через Settings → Rules, пока работает в бете. В будущем планируют совместные меморис для команд.

Background Agent: теперь доступен всем. Это асинхронный агент, который может выполнять задачи в фоне, без блокировки редактора. Работает даже через Slack — просто упомяни @cursor, и он сам внесёт изменения.

MCP-серверы: теперь ставятся в один клик, появилась поддержка OAuth. Есть каталог готовых серверов.

Весь change log доступен тут

Выглядит супер! Бегом обновляться 🤩
Forwarded from Zavtracast (Ярослав Ивус)
Nucleus представила услугу Embryo, которая позволяет узнать детальные характеристики ребёнка до рождения. Это выглядит, как выбор персонажа в игре.

Nucleus Embryo доступна только для родителей, которые собираются пройти процедуру ЭКО. В своей клинике им дают какое-то количество эмбрионов на выбор, а затем данные заливают в сервис.

Через пару часов родители могут узнать пол, цвет волос, рост, IQ, а также склонность к диабету и генетическим заболеваниям своего будущего ребёнка. Конечно же, это не гарантии, а вероятность, но Nucleus изучили 120,000 эмбрионов, чтобы создать Embryo.

Услуга обойдётся в $5,999 — это без учёта самой процедуры ЭКО и дальнейших наблюдений у врача.

@zavtracast
Новый Advanced Voice mode в ChatGPT

Засветилось обновление голосового режима в чатике.

- Более живая речь со словами паразитами для естественности.
- Говорят, что поёт (наконец-то!).

Всё меньше и меньше ощущение, что говоришь с роботом.

Почему-то начало появляться в Андроид приложении 🤨
Google обновила Gemini 2.5 Pro (Preview)

На бенчмарках модель заметно подросла и «поумнела» на задачах кода, логики и точных наук.

– 82.2% на задачах по программированию (Aider Polyglot)
– 86.4% на вопросах по естественным наукам (GPQA)
– 21.6% на Humanity’s Last Exam (тест на мышление и знания)

Цены в API:
— до 200K токенов: $1.25 input / $10 output
— больше 200K: $2.50 / $15 (за 1M токенов)

Доступ: AI Studio, Vertex, Gemini App.
Media is too big
VIEW IN TELEGRAM
Elevenlabs выкатила text-to-speech модель Eleven v3 (alpha)

Вы только послушайте эти голоса, эмоции, смех, акценты. Вау!

В видео есть демо запись футбольного комментатора с британским акцентом! Просто восторг!

Поддерживает 70+ языков, несколько голосов в виде диалогов, аудио тэги типа смех, восторг, шепот и прочие.
Media is too big
VIEW IN TELEGRAM
AGI может и не случиться

Сундар Пичаи не строит иллюзий: прогресс впечатляет, но гарантий ноль. Мы можем просто упереться в потолок.

ИИ уже умеет многое, но иногда не справляется с элементарным. Waymo всё ещё учат водить, а школьник осваивает это за пару выходных.

Так что да — всё красиво, но до настоящего интеллекта ещё, возможно, очень далеко 😬
Наконец-то выкатили обновление Advanced Voice в ChatGPT

Теперь ассистент говорит с реалистичными паузами, интонацией, с нотками эмпатии и даже сарказма 🤨

А ещё наконец-то нормальный голосовой переводчик. Просто скажи «переводи», и ассистент будет автоматически переводить всё, что вы говорите, туда-обратно. Например, вы говорите официанту по-английски, он отвечает по-португальски и ChatGPT мгновенно переводит оба направления. И так — пока не скажете остановиться.

Кайф же! Еще больше кейсов для использования AVM.
Сбой у OpenAI длится уже больше 7 часов.

Затронуло и API и ChatGPT. И это уже не первый такой глобальный сбой в этом году 😭

Вайб: когда 30% кода в компании написано с помощью AI 😅
Please open Telegram to view this post
VIEW IN TELEGRAM
OpenAI выкатила o3-pro

Это самая мощная в своей линейке reasoning-моделей. Она уже доступна в ChatGPT Pro, Team и API.

Что умеет o3-pro:

— Лучше решает задачи по науке, коду, бизнесу и обучению
— Лучшая по всем метрикам по сравнению с o3
— Умеет использовать все инструменты: Python, файлы, веб, визуальный ввод

Цены в API:

— o3-pro: $20 за 1M токенов на вход, $80 — на выход
— обычную o3 удешевили на 80%: теперь $2 / $8 (на уровне GPT-4.1)

Теперь понятно, почему вчера у OpenAI всё лежало: катили нового монстра 🐰
Please open Telegram to view this post
VIEW IN TELEGRAM
OpenAI теперь и на Google Cloud

Кажется, конкуренция конкуренцией, а вычислительные мощности по расписанию (текущих от Microsoft не хватает, вчера снова был глобальный сбой). OpenAI договорились с Google и будут использовать их Google Cloud для своих моделей. Раньше вся нагрузка лежала на Microsoft, теперь мощности начали распределять.

Что известно:

– Сделку закрыли в мае
– Переговоры шли несколько месяцев (мешали условия с Microsoft)
– У OpenAI выросли запросы на обучение и запуск моделей, одной Azure уже мало
– Для Google это большая победа, особенно на фоне того, что ChatGPT “ест” их поисковик
– Параллельно OpenAI строят дата-центр Stargate и пилят собственные чипы, чтобы меньше зависеть от партнёров

Акции Google уже пошли вверх. И да, Google снова себя прекрасно ощущает и сумела выправить курс (Apple учись!).
HTML Embed Code:
2025/07/06 12:24:08
Back to Top