AI LAB | Лаборатория ИИ Webview 1533.html Telegram

0:25

#unrealneural
Машина Дарвина-Геделя: открытая эволюция самосовершенствующихся агентов

Авторы(Salamanca AI) считают, что машины Дарвина-Геделя представляют собой конкретный шаг к системам искусственного интеллекта, которые могут автономно создавать собственные ступени для постоянного обучения и инноваций!
ИИ агент сам переписывает свой код и эволюционирует?!

arxiv.org/abs/2505.22954

⚡5🤯2

398 viewsАртур Ишмаев, 05:35

0:15

#пытаюсьпонять #вкопилкуэрудита
Почему Vision Transformers оказываются эффективнее сверхточных сетей?

Начнем с разбора, что это?

Vision Transformers (ViT) — это архитектура нейронных сетей, адаптированная для обработки изображений, основанная на механизме трансформеров, изначально разработанных для задач обработки естественного языка (NLP).

ViT обрабатывают изображения, разбивая их на небольшие участки (патчи), которые затем преобразуются в последовательность векторов, подобно словам в предложении в NLP. Эти векторы подаются в трансформер, который использует механизм внимания (self-attention) для анализа взаимосвязей между патчами.

В отличие от CNN, которые фокусируются на локальных признаках (через свертки), ViT анализирует изображение целиком благодаря механизму внимания. Это позволяет модели улавливать долгосрочные зависимости между удаленными частями изображения (например, между глазами и ртом на портрете). Механизм внимания автоматически определяет, какие патчи наиболее релевантны для задачи, что делает модель гибкой и способной выделять ключевые области изображения.

ViT хорошо масштабируется с увеличением данных и вычислительных ресурсов. Исследования показывают, что при больших объемах данных (например, JFT-300M) ViT превосходит CNN, так как трансформеры лучше используют большие датасеты для обучения сложных паттернов.

Архитектура трансформеров унифицирована: одна и та же модель может быть применена как к тексту, так и к изображениям, что упрощает разработку мультимодальных систем.

ViT легко адаптируется к различным задачам компьютерного зрения (классификация, детекция, сегментация) благодаря гибкости механизма внимания и возможности дообучения (fine-tuning).

Для больших изображений ViT может быть более эффективным, чем CNN, так как не требует глубоких иерархий сверток, а обрабатывает патчи параллельно.

Ну и самое интересное - как ViT соотносятся с человеческим восприятием изображений?

1. Человек, глядя на изображение, может мгновенно переключать внимание между разными областями, фокусируясь на наиболее важных (например, на лице человека в толпе). Механизм self-attention в ViT имитирует эту способность, позволяя модели выделять ключевые патчи и игнорировать менее релевантные.
2. Люди интерпретируют изображения, опираясь на контекст (например, распознают кошку, учитывая не только ее форму, но и окружение). ViT также учитывает контекст, анализируя связи между всеми патчами изображения.
3. Человеческая зрительная система обрабатывает информацию иерархически: от простых признаков (края, углы) к сложным объектам. Хотя ViT не использует явные иерархические слои, как CNN, многослойные трансформеры постепенно формируют более абстрактные представления, что можно сравнить с иерархией в человеческом мозге.

Но не все так однозначно сопоставимо🧐

ViT обрабатывают изображение глобально через механизм внимания, в то время как человеческое зрение начинается с локальной обработки краев и текстур в зрительной коре. ViT разбивает изображение на фиксированные патчи, тогда как человек сканирует сцену динамически, используя саккады и фиксации для фокусировки на важных областях. Кроме того, ViT требует больших объемов данных для обучения, в отличие от человека, способного распознавать объекты после минимального опыта (few-shot learning).

⚡4❤3👍2

370 viewsАртур Ишмаев, edited 08:47

Forwarded from vc.ru

Google выпустила приложение Google AI Edge Gallery, которое позволяет загружать ИИ-модели из каталога Hugging Face и запускать их на смартфонах без подключения к интернету.

Версия для Android опубликована на GitHub, для iOS — появится позже

vc.ru/ai/2020443

🔥3⚡2👍2

393 viewsАртур Ишмаев, 11:23

#unrealneural
13 MCP серверов:

- Agentset MCP
- GitHub MCP Server
- arXiv MCP
- MCP Run Python
- Safe Local Python Executor
- Cursor MCP Installer
- Basic Memory
- Filesystem MCP Server
- Notion MCP Server
- Markdownify MCP Server
- Fetch MCP Server
- Mobile Next
- MCP Installer

https://huggingface.co/posts/Kseniase/204958200717570

⚡3👍2

583 viewsАртур Ишмаев, edited 05:20

0:15

#эксперименты #ЛабораторияИИ
Архитектура, аудио, видео сгенерированы нейросетями

🔥10❤3⚡2👍2

494 viewsАртур Ишмаев, edited 05:46

AI LAB | Лаборатория ИИ pinned a photo

06:00

Forwarded from TechSparks

Использование ИИ в школах остается источником споров, данные экспериментов тоже противоречивы. Заметка в The Economist содержит интересное замечание в начале: “В богатом мире еще надо доказать, что ИИ лучше традиционного обучения”. То ли дело Нигерия. Результаты проведенного там эксперимента легко публиковать, не опасаясь эмоциональной реакции учителей и родителей учеников.
А результаты любопытны. В ходе 12 полуторачасовых внеклассных занятий на протяжении 6 недель ученики взаимодействовали с чатботом на основе GPT-4 для улучшения своего английского. По окончании этих 6 недель, ученики продемонстрировали прогресс, на который в ходе обычных школьных занятий ушло бы 2 года. На письменных экзаменах в конце года, которые включали не только материал, проработанный с помощью ИИ, участники эксперимента также выступили лучше своих одноклассников.
Авторы исследования оговариваются, что все дело может быть в том, насколько плохи в Нигерии учителя. С другой стороны, в бедных странах существует масса образовательных программ, в которых участвуют люди, в том числе волонтеры из богатых стран. Программа с ИИ дала лучшие результаты, чем 80% таких программ. В общем, текст любопытно почитать уже из-за его извиняющейся интонации :))
https://www.economist.com/graphic-detail/2025/05/30/can-ai-be-trusted-in-schools

👍6🔥3

353 viewsАртур Ишмаев, 17:24

0:10

Media is too big

#эксперименты #ЛабораторияИИ
Архитектура, видео сгенерированы нейросетями

👍5❤3⚡2

372 viewsАртур Ишмаев, 19:05

0:10

Media is too big

#эксперименты #ЛабораторияИИ
Архитектура, видео сгенерированы нейросетями

👍5❤3⚡2

381 viewsАртур Ишмаев, 19:05

#unrealneural
Cad-MLLM

Унифицированный подход к генерации CAD-геометрии на основе текстового запроса. Для генерации используются последовательности команд моделей САПР, далее идет обработка с помощью LLM. Это мультимодальный конвейер генерации моделей.

https://arxiv.org/abs/2411.04954

👍4⚡3❤‍🔥1

399 viewsАртур Ишмаев, 06:18

0:10

Media is too big

#эксперименты #ЛабораторияИИ
Немного тестов Veo3

⚡4❤3👍2

370 viewsАртур Ишмаев, 10:57

0:05

#эксперименты #ЛабораторияИИ
Немного тестов Veo3

🔥4❤3👍3

380 viewsАртур Ишмаев, 11:35

0:01

#unrealneural
Интерактивные блокноты, чтобы поэкспериментировать с машинами непрерывного мышления Continuous Thought Machines sakana.ai/ctm/

https://github.com/SakanaAI/continuous-thought-machines

🤯3⚡1👍1

383 viewsАртур Ишмаев, 17:59

Forwarded from Data Secrets

Сегодня в 20:00 по мск нас ждет что-то новенькое от OpenAI

От этом сообщил один из инженеров стартапа. От написал, что будет «большой день для пользователей, о котором я думаю днями и ночами». Что ж, посмотрим 👀

Кстати, еще из приятных новостей от OpenAI: со вчерашнего дня Codex доступен всем Plus юзерам ChatGPT.

Plus – это подписка за 20$ / месяц. Говорят, что лимиты на Codex «щедрые», но зато тут же уточняют, что в периоды высокого спроса будут появляться ограничения скорости.

Кроме того, теперь агенту можно предоставить доступ в Интернет, и он сможет пользоваться им по необходимости. Changelog

Please open Telegram to view this post

VIEW IN TELEGRAM

⚡3👍3❤2

400 viewsАртур Ишмаев, 06:16

Побывал в гостях у Андрея Кузнецова, директора лаборатории FusionBrain, AIRI - лидера направления «Генеративное проектирование» в Сбере, автора канала @complete_ai. Очень вдохновлен этой встречей. Уже нашли точки соприкосновения, ждем крутых совместных экспериментов и исследований 🔥🔥🔥

🔥13❤3⚡2❤‍🔥1

444 viewsАртур Ишмаев, 08:16