TG Telegram Group Link
Channel: AI LAB | Лаборатория ИИ
Back to Bottom
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural

Fact Checker

Находит ошибки и исправляет факты в созданных ИИ блогах и статьях.

Полностью бесплатно и с открытым исходным кодом.

https://demo.exa.ai/hallucination-detector
🔥6👍32
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
Dynamic Neural Point Clouds

В статье представлен новый метод синтеза новых видов динамических сцен из монокулярного видео, например, снятого на смартфон, с использованием динамического нейронного облака точек (DNPC). Интеграция априорных данных, таких как оценка глубины и сегментация объектов, позволяет устранить неоднозначности движения и глубины, ускоряя оптимизацию и повышая качество изображения. Метод демонстрирует высокое качество на тестовых последовательностях, быструю оптимизацию и поддержку интерактивных приложений в реальном времени.

https://moritzkappel.github.io/projects/dnpc/index.html
👍73🔥3
#unrealneural #пытаюсьпонять
Lost in Latent Space

В статье исследуют использование латентных диффузионных моделей для быстрой и точной эмуляции динамических систем, показывая их устойчивость к сжатию до 1000x и превосходство над негенеративными методами за счет разнообразия предсказаний. Высокая вычислительная стоимость диффузионных моделей ограничивает их применение, поэтому авторы предлагают генерацию в латентном пространстве автоэнкодера, как в обработке изображений и видео. Эмуляция в латентном пространстве сохраняет точность, компенсирует неопределенность и требует тщательного выбора архитектур и оптимизаторов. Автоэнкодеры, используемые для сжатия данных в латентное пространство, позволяют эффективно представлять сложные системы, минимизируя вычислительные затраты, что особенно востребовано в задачах обработки изображений для генерации и реконструкции визуальных данных.

https://huggingface.co/papers/2507.02608
4👍41
#unrealneural
BrepDiff

Простая одноэтапная модель диффузии для генерации граничных представлений (breps).

Она обрабатывает каждую грань САПР как «замаскированную UV-сетку» точечных образцов, сглаживает эти сетки в токены и запускает один проход диффузионно-преобразователя.
https://brepdiff.github.io/interactive/interactive.html
👍533
Модель Centaur — «ИИ-психика» на базе Llama 3.1 — нейросеть, обученная на 10 млн человеческих решений из 160 психологических экспериментов. Она почти идеально имитирует человеческую психику и способна предсказывать поведение людей с высокой точностью в любых жизненных сценариях, описанных на естественном языке

Для бизнеса Centaur может быть использована для:
🔵прогнозирования реакции потребителей на продукты и рекламу;
🔵объяснения мотивации решений для лучшего понимания клиентов;
🔵моделирования рыночных сценариев и тестирования стратегий;
🔵персонализации предложений и повышения продаж.

Код на Hugging Face.
Please open Telegram to view this post
VIEW IN TELEGRAM
😱43👍3🤬1
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
Rectified Point Flow (RPF) — общая формула для оценки положения облака точек.

Облака точек стали мощным представлением для 3D-реконструкции на основе изображений.

https://rectified-pointflow.github.io/
🔥52👍2
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
Ну и наконец-то Google Flow раскатали почти на весь мир, включая Европу.

https://labs.google/fx/tools/flow

У меня открывается без всякого ВПН.

https://blog.google/technology/google-labs/flow-adds-speech-expands/

Нужна подписка Pro.

И да, это липсинк по начальной фотке.

@cgevent
🔥31👍1
#unrealneural
CReFT-CAD: Boosting Orthographic Projection Reasoning for CAD via Reinforcement Fine-Tuning

Проблема: Традиционные подходы глубокого обучения в САПР, использующие стандартные конвейеры 3D-реконструкции, часто приводят к неточным измерениям и ограниченной параметрической редактируемости, а методы тонкой настройки визуальных языковых моделей (VLM) склонны к запоминанию шаблонов, что снижает их производительность при решении сложных задач вне распределения данных. Предложенная парадигма CReFT-CAD, сочетающая обучение с подкреплением на основе учебной программы и контролируемую постнастройку, устраняет эти недостатки, повышая точность рассуждений, обобщаемость и семантическое извлечение, а новый бенчмарк TriView2CAD предоставляет масштабную платформу для тестирования и совершенствования ортогональных проекционных рассуждений в САПР.
https://arxiv.org/abs/2506.00568
👍322
Forwarded from Complete AI
Вы когда-нибудь мечтали стать лучшей версией себя? А LoRA уже стала!

Рад представить вам нашу новую работу T-LoRA: Single Image Diffusion Model Customization Without Overfitting ✔️

Представьте, что вы хотите дообучить модель генерировать новый объект, например, кошку или чайник. Но у вас ВСЕГО ОДНА КАРТИНКА этого объекта. Вы обучаете LoRA. И что выходит? Полный провал. Модель переобучается: объект генерируется только в той позе, в которой он был на тренировочной картинке, а фон выглядит скудно и плохо соответствует тексту.

В ходе нашей работы мы выяснили, что переобучение чаще всего происходит на самых шумных таймстепах. Именно они приводят к тому, что модель переобучается на фон и позу объекта. Мы предложили решение: ограничить ранг на шумных таймстепах, чтобы избежать переобучения, и дать больший ранг на средних и поздних таймстепах для точного запоминания объекта. На поздних таймстепах можно использовать высокие ранги без риска переобучения. 

Эту идею мы реализовали с помощью маскирования столбцов LoRA, ограничивая тренировочный сигнал на шумных таймстепах. Более того, чтобы маскирование было эффективным, разработали ортогональную версию LoRA, которая сохраняет столбцы ортогональными на протяжении всего обучения. 

Теперь ваша кошка может не только стоять, но и сидеть, и кататься на велосипеде, бегать, принимать любые позы, которые вы захотите. А фоны стали яркими, насыщенными и разнообразными.

Поддержите нашу работу работу Upvote на HuggingFace. Это поможет как можно большему числу людей узнать, что делать в подобных тяжелых жизненных ситуациях с котиками 🙂

🔜 Arxiv
🔜 GitHub
🔜 HuggingFace
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥52👍2
💡 BIM Просвет Офлайн в Москве!

Тема: ИИ в девелопменте
🗓 Когда: 22 июля (вторник) с 11.00 до 15.00

📍 Где: место сообщим чуть позже, но это будет удобная локация в центре

Спикеры:
- ПИК - Артур Ишмаев
- Нанософт - Максим Журавлев
- Клуб BIM-лидеров - Мария Бедовая
- Signal - Александр Попов
- Свободное место #5
- Свободное место #6

Регистрация: количество мест ограничено, так что сейчас мы начинаем сбор заявок на участие

🎤 Будет ли трансляция? Нет

Идеи и предложения:
@purtovsy @Andrey_Ryb

#BIMПросвет #BIMПросветAI #BIMSupport #AI #AIBIM #ИИ #ИИТИМ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥431
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural #пытаюсьпонять #вкопилкуэрудита
Может ли модель ИИ делать идеальные прогнозы и при этом иметь неправильную модель мира?

Что бы это вообще значило?

Один из результатов говорит сам за себя: трансформер, обученный на 10 миллионах звездных систем, точно определяет планетарные орбиты. Но он нарушает законы гравитации😃😃🤷🏻‍♂️
😁521
#unrealneural #пытаюсьпонять
Dynamic Chunking for End-to-End Hierarchical Sequence Modeling

Работа представляет H-Net — иерархическую нейронную сеть, которая устраняет необходимость в традиционной токенизации (например, BPE — Byte-Pair Encoding) за счёт динамического разделения входных данных на уровне байтов. H-Net обучается определять границы сегментов (chunks) в зависимости от содержания и контекста, что позволяет ей превосходить модели, основанные на фиксированной токенизации, в задачах обработки языков, кода и даже ДНК.

Однако для полного отказа от токенизации требуются дальнейшие исследования более глубоких иерархий и стабильности обучения.
https://www.alphaxiv.org/overview/2507.07955v1
👍5🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
Diffusion Explorer позволяет изучать геометрические свойства генеративных моделей на основе диффузии и потока с помощью интерактивной анимации.

https://alechelbling.com/Diffusion-Explorer/
🔥3👍21
Forwarded from NN
Новый лидер среди опенсорс-моделей: вышла Kimi K2 с 1 трлн параметров. Она одинаково хорошо генерирует код, пишет текст и анализирует данные.

В коде и математике она показала себя даже лучше Claude 4 и GPT-4.1. Новая модель заняла первое место в бенчмарках AIME 2025, LiveCodeBench v6 и GPQA-Diamond.

Пробуем бесплатно по ссылке. Скоро обещают добавить функции ИИ-агента.
21👍1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
GenCAD - Превращение изображений в редактируемые 3D-дизайны

Команда MIT разработала GenCAD, новую систему на основе искусственного интеллекта, которая генерирует параметрические, редактируемые модели CAD непосредственно из изображений

https://github.com/ferdous-alam/GenCAD
🔥521
HTML Embed Code:
2025/07/14 15:31:57
Back to Top