TG Telegram Group Link
Channel: Big data world
Back to Bottom
Учебное пособие: анализ трафика с помощью видео (21 минута чтения) В этом учебном пособии рассказывается о том, как создать систему, которая сообщает о плотности автомобильного трафика. Для подсчета автомобилей с течением времени используется современное компьютерное зрение. подробнее→ https://blog.roboflow.com/video-stream-analysis/
Большие языковые модели (LLM) обладают огромным потенциалом, но разработка надежных приложений промышленного уровня остается сложной задачей. После создания десятков систем LLM я свел формулу успеха к четырем фундаментальным принципам, которые может применять любая команда.

https://towardsdatascience.com/the-llm-triangle-principles-to-architect-reliable-ai-apps-d3753dd8542e
Справочник специалиста по данным 2024 г.

Подборка ресурсов (бесплатных и платных), которые помогут специалистам по данным учиться, расти и выходить на новый уровень в области науки о данных…
https://github.com/andresvourakis/data-scientist-handbook

Что такое градиентный спуск?

https://leakybrain.ericekholm.com/stats/gradient_descent

Machine Learning Engineering Open Book

Это открытая коллекция методологий, инструментов и пошаговых инструкций, которые помогут успешно тренировать большие языковые модели и многомодальные модели. Это технический материал, подходящий для инженеров и операторов обучения LLM/VLM.
https://github.com/stas00/ml-engineering
IMAGDressing-v1: настраиваемая виртуальная одежда

Последние достижения позволили добиться реалистичной виртуальной примерки (VTON) посредством локализованной прорисовки одежды с использованием моделей скрытой диффузии, что значительно улучшило опыт онлайн-покупок для потребителей. https://github.com/muzishen/imagdressing
DataComp-LM (DCLM) — это комплексная структура, разработанная для создания и обучения больших языковых моделей (LLM) с разнообразными наборами данных.

https://github.com/mlfoundations/dclm
Викторина «Трансформеры с обнимашками»

В этом тесте вы проверите свое понимание Hugging Face Transformers . Эта библиотека является популярным выбором для работы с моделями трансформаторов в задачах обработки естественного языка, компьютерного зрения и других приложениях машинного обучения.

https://realpython.com/quizzes/hugging-face-transformers
Прикладное машинное обучение для табличных данных

Мы хотим создать практическое руководство по разработке качественных предиктивных моделей из табличных данных… Книга дает целостный взгляд на процесс предиктивного моделирования и фокусируется на нескольких областях, которые обычно остаются вне подобных работ. Например, эффективность модели может зависеть от того, как представлены предикторы. Из-за этого мы тесно связываем методы проектирования признаков с моделями машинного обучения. Кроме того, довольно много работы происходит после того, как мы определили нашу лучшую модель и создали окончательную подгонку. Эти действия после моделирования являются важной частью процесса разработки модели и будут подробно описаны…

https://aml4td.org/
MINT-1T: мультимодальный чередующийся набор данных объемом один триллион токенов.

Мультимодальные чередующиеся наборы данных, включающие чередующиеся последовательности изображений и текста свободной формы, имеют решающее значение для обучения передовых больших мультимодальных моделей (LMM). Несмотря на быстрое развитие LMM с открытым исходным кодом, по-прежнему наблюдается выраженный дефицит крупномасштабных разнообразных мультимодальных чередующихся наборов данных с открытым исходным кодом. В ответ на это мы представляем MINT-1T, самый обширный и разнообразный набор данных Multimodal INTerleaved с открытым исходным кодом на сегодняшний день.

https://github.com/mlfoundations/mint-1t
Изучите основы RAG и продвинутые методы

Понимание того, как улучшить возможности систем ИИ и машинного обучения, является ценным навыком. Одним из методов является Retrieval-Augmented Generation (RAG), мощная техника, которая сочетает методы, основанные на поиске, с генеративными моделями для создания более точных и контекстно-релевантных ответов.

https://www.freecodecamp.org/news/learn-rag-fundamentals-and-advanced-techniques
Потенциальное применение LLM, которое привлекло внимание и инвестиции, связано с их способностью генерировать SQL-запросы. Запросы к большим базам данных с использованием естественного языка открывают несколько привлекательных вариантов использования: от повышения прозрачности данных до улучшения доступности для нетехнических пользователей.

Однако, как и в случае с любым контентом, сгенерированным ИИ, вопрос оценки важен. Как мы можем определить, является ли SQL-запрос, сгенерированный LLM, правильным и дает ли он предполагаемые результаты? Наше недавнее исследование углубляется в этот вопрос и изучает эффективность использования LLM в качестве судьи для оценки генерации SQL.

https://towardsdatascience.com/evaluating-sql-generation-with-llm-as-a-judge-1ff69a70e7cf
Наглядное руководство по квантованию — демистификация сжатия LLM

Большие языковые модели (LLM) часто слишком велики для запуска на потребительском оборудовании. Эти модели могут содержать миллиарды параметров и, как правило, требуют графических процессоров с большим объемом видеопамяти для ускорения вывода. Таким образом, все больше исследований было сосредоточено на том, чтобы сделать эти модели меньше за счет улучшения обучения, адаптеров и т. д. Одна из основных методик в этой области называется квантованием. В этой статье я представлю область квантования в контексте моделирования языка и рассмотрю концепции одну за другой, чтобы развить интуицию об этой области. Мы рассмотрим различные методологии, варианты использования и принципы, лежащие в основе квантования… https://newsletter.maartengrootendorst.com/p/a-visual-guide-to-quantization

Интерпретируемое машинное обучение

Руководство по созданию объяснимых моделей черного ящика
https://christophm.github.io/interpretable-ml-book
HTML Embed Code:
2025/07/02 05:48:01
Back to Top