Channel: Математика Дата саентиста
Forwarded from Machinelearning
OuteAI выпустила второе поколение легких моделей на 250М параметров каждая :
В модели интегрирован механизм Mamba2Attn - усовершенствованный метод внимания, который повышает способность модели фокусироваться на важных частях входных данных. Этот механизм особенно полезен для задач NLP, требующих понимания сложных закономерностей или взаимосвязей в данных.
Интегрировав Mamba2Attn, разработчикам удалось сохранить релевантную для своего класса малых моделей производительность, уменьшив при этом ее размер и вычислительные требования.
Базовая модель была обучена на 30 миллиардах токенов из корпуса данных, структура которого - 50% датасета dclm-baseline-1.0 b 50% fineweb-edu. Инструктивная версия прошла дообучение с SFT и DPO.
Обе модели имеют 4 слоя внимания из общего количества 32, такая конфигурация позволяет минимизировать потери при проверке, что подтверждено исследованием о соотношении слоев самовнимания к MLP.
@ai_machinelearning_big_data
#AI #SLM #Mamba2 #ML #Oute
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4👍2🔥2🤩1
Forwarded from Machinelearning
Qwen2-VL - это новая версия VLMs, основанная на Qwen2 в семействе моделей Qwen. По сравнению предыдущим поколением, Qwen2-VL обладает возможностями:
Набор Qwen2-VL состоит из трех основных моделей, две из которых публикуются в отrрытом доступе. Модель Qwen2-VL-72B доступна только по API:
и их квантованные версии в форматах AWQ и GPTQ в разрядностях Int8 и Int4.
Архитектура моделей. как и в прошлом поколении основана на ViT 600M и LLM Qwen2, но с добавлением двух ключевых модификаций:
⚠️ Ограничения в возможностях и слабые стороны поколения состоят в том, что модели не умеют извлекать звук из видео, а их знания актуальны на июнь 2023 года.
Кроме того, они не могут гарантировать полную точность при обработке сложных инструкций или сценариев. Модели относительно слабы в задачах, связанных со счетом, распознаванием символов и трехмерным пространственным восприятием.
@ai_machinelearning_big_data
#AI #Qwen #ML #GPTQ #VLM #AWQ
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5👍4🔥2
📶 Главные темы линейной алгебры для специалиста по машинному обучению
📌 Крутейшие Стэнфордские материалы по линейной алгебре
@data_math
📌 Крутейшие Стэнфордские материалы по линейной алгебре
@data_math
👍18❤8🔥1
Forwarded from Machinelearning
Развитие базовых языковых и иснтруктивных моделей , таких как GPT и Claude, дал возможность создания агентов общего назначения, способных к гибкому рассуждению и планированию. Но разработка этих агентов часто требует ручной настройки и значительных усилий со стороны инженеров и ресерчеров.
Для упрощения процесса проектирования агентов появилось новое направление исследований — автоматизированное проектирование агентных систем (Automated Design of Agentic Systems, ADAS).
Главное назначение методологии ADAS - автоматизация создания новых агентных блоков и их объединение в сложные системы.
Используя возможности LLM и гибкость языков программирования, ADAS обещает более эффективный и действенный подход к созданию комплексных агентных систем.
Поисковый алгоритм с помощью мета-агента является ярким примером ADAS в действии. Он использует мета-агента, который по сути является LLM, для итеративного проектирования новых агентов на основе постоянно растущего архива результатов предыдущих поисков.
ADAS позволяет исследовать обширное пространство кода, теоретически позволяя обнаружить любую возможную агентную систему. Мета-агент должен исследовать интересные проекты: новые промпты, использование инструментов, потоки управления и их комбинации.
Благодаря обширным экспериментам в областях программирования, науки и математики, алгоритм демонстрирует способность изобретать агентов с новыми проектами, которые превосходят современных агентов, разработанных вручную.
Один из реализованных проектов ADAS в практической среде - использование алгоритма Meta Agent Search в связке с GPT:
# Create Conda venv:
conda create -n adas python=3.11
# Activate venv:
conda activate adas
#Install Dependencies:
pip install -r requirements.txt
# Set OpenAI API Key:
export OPENAI_API_KEY="YOUR KEY HERE"
Запуск Meta Agent Search на примере области поиска "arc":
# Navigate to _arc folder:
cd _arc
# Run Meta Agent Search
python search.py
@ai_machinelearning_big_data
#AI #LLM #Agents #ML #ChatGPT
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8❤2⚡1
⭐️ 10-страничный PDF-файл охватывает вводный курс теории вероятности
Лучшая и единственная #шпаргалка по теории вероятности для изучающих тервер⭐️:
https://github.com/wzchen/probability_cheatsheet
Лучшая и единственная #шпаргалка по теории вероятности для изучающих тервер⭐️:
https://github.com/wzchen/probability_cheatsheet
❤13👍8🔥3⚡1👎1🆒1
⚡️Легкий способ получать свежие обновления и следить за трендами в разработке на вашем языке. Находите свой стек и подписывайтесь:
МАШИННОЕ ОБУЧЕНИЕ: hottg.com/ai_machinelearning_big_data
C++ hottg.com/cpluspluc
Python: hottg.com/pro_python_code
Хакинг: hottg.com/linuxkalii
Devops: hottg.com/devOPSitsec
АНАЛИЗ Данных: hottg.com/data_analysis_ml
Javascript: hottg.com/javascriptv
C#: hottg.com/csharp_ci
Java: hottg.com/javatg
Базы данных: hottg.com/sqlhub
Linux: hottg.com/linuxacademiya
Python собеседования: hottg.com/python_job_interview
Мобильная разработка: hottg.com/mobdevelop
Docker: hottg.com/DevopsDocker
Golang: hottg.com/golang_interview
React: hottg.com/react_tg
Rust: hottg.com/rust_code
PHP: hottg.com/phpshka
Android: hottg.com/android_its
Frontend: hottg.com/front
Big Data: hottg.com/bigdatai
Собеседования МЛ: hottg.com/machinelearning_interview
МАТЕМАТИКА: hottg.com/data_math
Kubernets: hottg.com/kubernetc
💼 Папка с вакансиями: hottg.com/addlist/_zyy_jQ_QUsyM2Vi
Папка Go разработчика: hottg.com/addlist/MUtJEeJSxeY2YTFi
Папка Python разработчика: hottg.com/addlist/eEPya-HF6mkxMGIy
Папка ML: https://hottg.com/addlist/2Ls-snqEeytkMDgy
Папка FRONTEND: https://hottg.com/addlist/mzMMG3RPZhY2M2Iy
😆ИТ-Мемы: hottg.com/memes_prog
🇬🇧Английский: hottg.com/english_forprogrammers
🧠ИИ: hottg.com/vistehno
🎓954ГБ ОПЕНСОРС КУРСОВ: @courses
📕Ит-книги бесплатно: https://hottg.com/addlist/BkskQciUW_FhNjEy
МАШИННОЕ ОБУЧЕНИЕ: hottg.com/ai_machinelearning_big_data
C++ hottg.com/cpluspluc
Python: hottg.com/pro_python_code
Хакинг: hottg.com/linuxkalii
Devops: hottg.com/devOPSitsec
АНАЛИЗ Данных: hottg.com/data_analysis_ml
Javascript: hottg.com/javascriptv
C#: hottg.com/csharp_ci
Java: hottg.com/javatg
Базы данных: hottg.com/sqlhub
Linux: hottg.com/linuxacademiya
Python собеседования: hottg.com/python_job_interview
Мобильная разработка: hottg.com/mobdevelop
Docker: hottg.com/DevopsDocker
Golang: hottg.com/golang_interview
React: hottg.com/react_tg
Rust: hottg.com/rust_code
PHP: hottg.com/phpshka
Android: hottg.com/android_its
Frontend: hottg.com/front
Big Data: hottg.com/bigdatai
Собеседования МЛ: hottg.com/machinelearning_interview
МАТЕМАТИКА: hottg.com/data_math
Kubernets: hottg.com/kubernetc
💼 Папка с вакансиями: hottg.com/addlist/_zyy_jQ_QUsyM2Vi
Папка Go разработчика: hottg.com/addlist/MUtJEeJSxeY2YTFi
Папка Python разработчика: hottg.com/addlist/eEPya-HF6mkxMGIy
Папка ML: https://hottg.com/addlist/2Ls-snqEeytkMDgy
Папка FRONTEND: https://hottg.com/addlist/mzMMG3RPZhY2M2Iy
😆ИТ-Мемы: hottg.com/memes_prog
🇬🇧Английский: hottg.com/english_forprogrammers
🧠ИИ: hottg.com/vistehno
🎓954ГБ ОПЕНСОРС КУРСОВ: @courses
📕Ит-книги бесплатно: https://hottg.com/addlist/BkskQciUW_FhNjEy
❤2👍1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ Один из лучших сервисов для кодинга
CursorAI — мощная платформа, насыщенная множеством нейронных сетей, разработанных специально для IT-специалистов.
Здесь можно исправлять баги, генерировать код в один клик и наслаждаться упрощённым процессом работы: cursor.com.
@data_math
CursorAI — мощная платформа, насыщенная множеством нейронных сетей, разработанных специально для IT-специалистов.
Здесь можно исправлять баги, генерировать код в один клик и наслаждаться упрощённым процессом работы: cursor.com.
@data_math
👍10💩6❤4🔥3⚡1
Фракталы на python
1. Кривая Коха и снежинка Коха
2. Рисуем кривую Коха и снежинку Коха
3. Простая L-система на плоскости
4. L-система для дракона Хартера-Хайтвея, ковра Серпинского и кривой Гильберта
5. L-система с ветвлениями. Рисуем деревья и травы
6. Добавляем параметры в L-систему
7. Добавляем случайности в L-систему
8. Добавляем цвет в L-систему
9. Как вычисляется фрактальная размерность по Хаусдорфу
#video #python
https://www.youtube.com/watch?v=rUC-wPuRSOU&list=PLA0M1Bcd0w8ylFC3tve_AVXEttPBmKDqw
@data_math
1. Кривая Коха и снежинка Коха
2. Рисуем кривую Коха и снежинку Коха
3. Простая L-система на плоскости
4. L-система для дракона Хартера-Хайтвея, ковра Серпинского и кривой Гильберта
5. L-система с ветвлениями. Рисуем деревья и травы
6. Добавляем параметры в L-систему
7. Добавляем случайности в L-систему
8. Добавляем цвет в L-систему
9. Как вычисляется фрактальная размерность по Хаусдорфу
#video #python
https://www.youtube.com/watch?v=rUC-wPuRSOU&list=PLA0M1Bcd0w8ylFC3tve_AVXEttPBmKDqw
@data_math
🔥5👍4❤3🤯2
Forwarded from Machinelearning
📚 Бесплатная электронная книга: The Fourier Transform, 2024.
Погружение в преобразование Фурье.
Приятный стиль изложения книги и множество наглядных диаграмм.
Внутри практика в виде задач, написанных на Python и MATLAB.
▪Book
@ai_machinelearning_big_data
Погружение в преобразование Фурье.
Приятный стиль изложения книги и множество наглядных диаграмм.
Внутри практика в виде задач, написанных на Python и MATLAB.
▪Book
@ai_machinelearning_big_data
🔥14👍6❤3
Forwarded from Machinelearning
VEnhancer - генеративная система апсемлинга пространственно-временных характеристик, которая улучшает результаты существующих методов преобразования текста в видео путем добавления большего количества деталей в пространственной области и синтетического детализированного движения во временной области.
Он гибко адаптируется к различным коэффициентам апсемплинга в диапазоне 1x~8x.
VEnhancer устраняет артефакты и коллизии движения сгенерированных видео, используя диффузионную модель и дообученные модели ControlNet.
Несколько дней назад VEnhancer получил обновление:
Эксперименты, проведенные во время разработки показывают, что VEnhancer превосходит существующие методы апсемплинга видео и современные методы улучшения синтезированных видео.
⚠️ Для обработки видео в 2K разрешении при fps=>24 требуется около 80 GB VRAM.
Использование VEnhancer возможно через CLI, с помощью GradioUI и в виде неофициальной ноды (WIP) для ComfyUI.
# Clone repo
git clone https://github.com/Vchitect/VEnhancer.git
cd VEnhancer
# Create environment
conda create -n venhancer python=3.10
conda activate venhancer
# Install requirments:
pip install torch==2.0.1 torchvision==0.15.2 torchaudio==2.0.2
pip install -r requirements.txt
sudo apt-get update && apt-get install ffmpeg libsm6 libxext6 -y
bash run_VEnhancer.sh
python gradio_app.py
@ai_machinelearning_big_data
#AI #Text2Video #VEnchancer #ML
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8👍4❤3
HTML Embed Code: