Channel: Machine learning Interview
Модель с открытым исходным кодом и 1,5B параметрами, обученная с помощью RL и превосходящая o1-preview по общему математическому мышлению.
▪Github: https://github.com/agentica-project/deepscaler
▪HF: https://huggingface.co/agentica-org/DeepScaleR-1.5B-Preview
▪Blog: https://pretty-radio-b75.notion.site/DeepScaleR-Surpassing-O1-Preview-with-a-1-5B-Model-by-Scaling-RL-19681902c1468005bed8ca303013a4e2
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17❤4🥰3
Perplexity запустила обновленную версию поисковой модели Sonar, которая основана на Llama 3.3 70B и работает на мощностях от Cerebras Systems. Внутренние тесты, проведенные Perplexity показали, что Sonar превосходит GPT-4o mini и Claude 3.5 Haiku по удовлетворенности пользователей и сравнивается с GPT-4o и Claude 3.5 Sonnet в поисковых задачах.
Cerebras Systems использует уникальные Wafer Scale Engines, позволяющие Sonar обрабатывать 1200 токенов в секунду, что дает почти мгновенные ответы. Доступ к Sonar ограничен для платных пользователей Pro, но Perplexity планирует сделать его более широко доступным в будущем.
perplexity.ai
@machinelearning_interview
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13🔥4❤2
В этой статье мы разберем 12 задач, которые помогут лучше понять применение теории вероятностей на практике с использованием Python.
@machinelearning_interview
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11🔥2❤1
✔ DeepHermes-3 Preview
Новый LLM, который объединяет возможности логического рассуждения и интуитивного языка. Модель использует новые данные для рассуждений на основе Hermes 3 Datamix, позволяет включать или выключать длинные цепочки рассуждений, обеспечивая точность за счет большего времени на вычисления. Это большое преимущество перед другими моделями, так как дает гибкость в выборе требуемой точности, при этом экономя ресурсы, если цепочка рассуждений не нужна.
▪ DeepHermes-3 Preview.
@machinelearning_interview
Новый LLM, который объединяет возможности логического рассуждения и интуитивного языка. Модель использует новые данные для рассуждений на основе Hermes 3 Datamix, позволяет включать или выключать длинные цепочки рассуждений, обеспечивая точность за счет большего времени на вычисления. Это большое преимущество перед другими моделями, так как дает гибкость в выборе требуемой точности, при этом экономя ресурсы, если цепочка рассуждений не нужна.
▪ DeepHermes-3 Preview.
@machinelearning_interview
👍11🔥2❤1
Forwarded from Machinelearning
Oumi - открытая платформа для разработки, файнтюна, оценки и экспериментов с языковыми и мультимодальными моделями, созданная совместными усилиями исследователей из 13 ведущих университетов.
Oumi предоставляет инструменты и рабочие процессы для разработки и запуска масштабных экспериментов на кластере, развертывания моделей в рабочей среде и поддерживает методы распределенного обучения (FSDP, DDP):
В репозитории проекта собраны готовые ноутбуки и скрипты для каждого из этапов жизненного цикла моделей, а подробная документация по использованию поможет легко освоить эту платформу.
@ai_machinelearning_big_data
#AI #ML #Oumi #Framework
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7👍3❤2
Please open Telegram to view this post
VIEW IN TELEGRAM
❤10👍4🥰1
Forwarded from Machinelearning
Курс содержит пошаговые инструкции с примерами кода, которые помогут научиться создавать автономных агентов с использованием машинного обучения.
Фокус на AI-агентах:
Если вас интересует именно разработка агентов — например, для симуляций, игр или интерактивных систем — данный курс будет полезен.
Каждый урок включает в себя:
- Лекцию, (видео уроки появятся в марте 2025 года)
- Примеры кода на Python с поддержкой Azure AI Foundry и Github Models
- Практические задания
- Ссылки на полезные дополнительные ресурсы
Если это ваш первый опыт работы с агентами, у Microsoft есть еще 1 курс «Генеративный ИИ для начинающих», который содержит 21 урок по построению моделей с помощью GenAI, лучше начать с него.
Переведен на 9 различных языков (русского нет).
▪ Github
@ai_machinelearning_big_data
#course #Microsoft #aiagents #ai #ml #opensource #freecourse
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍12❤4🥰1
HTML Embed Code: