TG Telegram Group Link
Channel: Big data world
Back to Bottom
Is Fashion ML Profession?
 
Правильный ответ Lamoda Tech назовет на Data Science митапе 28 марта. Приходи обсудить ML-эксперименты и готовые решения «под капотом» крупнейшей модной платформы в России!
 
Раскроем все details: как адаптируем каталог под индивидуальный стиль пользователей, отвечаем на сложные запросы в поиске, подбираем образы на уровне стилистов и рекомендуем подходящие размеры.
 
Программа:
19:05 Data Science в Lamoda: особенности применения ML в Fashion E-commerce
Александр Желубенков, Head of Data Science
 
19:35 Рекомендация размера с помощью машинного обучения
Никита Чуркин, Teamlead of Personalisation
 
20:20 В поисках стиля: Deep Learning в fashion-индустрии
Илья Черников, Senior Data Scientist
Между выступлениями и после будем общаться за вкусными закусками и напитками, а еще поиграем в настольный теннис и кикер.
 
Ждем вас в нашем офисе или онлайн! Регистрация обязательна по ссылке
👍1
Встраивание текста, классификация и семантический поиск

Введение с примером кода Python
https://medium.com/towards-data-science/text-embeddings-classification-and-semantic-search-8291746220be
Создайте исчерпывающую сводку данных за считанные секунды.

https://datamantra.medium.com/you-will-never-use-pandas-describe-method-after-using-these-two-libraries-e29aca1488d1
👍1
Освоение Python для науки о данных: помимо основ
Эта статья служит подробным руководством о том, как освоить передовые методы Python для науки о данных. В нем рассматриваются такие темы, как эффективное манипулирование данными с помощью Pandas, параллельная обработка с помощью Python и способы превращения моделей в веб-сервисы.

https://www.kdnuggets.com/mastering-python-for-data-science-beyond-the-basics
Как использовать действия GitHub для автоматизации очистки данных.
В этом блоге мы рассмотрим, как автоматизировать процесс очистки данных в облаке с помощью действий GitHub.

https://medium.com/data-analytics-at-nesta/how-to-use-github-actions-to-automate-data-scraping-299690cd8bdb
Как устроено пространство, в котором думают языковые модели?

С момента выхода первой статьи «Attention is All You Need» я с жадностью и любопытством, присущими любому исследователю, пытаюсь углубиться во все особенности и свойства моделей на базе архитектуры трансформер. Но, если честно, я до сих пор не понимаю, как они работают и почему так хорошо обучаются. Очень хочу разобраться, в чём же причина такой эффективности этих моделей, и есть ли предел их возможностей?

Такому изучению трансформеров «под микроскопом» и посвящена наша научная работа, только что представленная на конференции EACL 2024, которая проходила на Мальте — «The Shape of Learning: Anisotropy and Intrinsic Dimensions in Transformer-Based Models». В этой работе мы сфокусировались на наблюдении за пространством эмбеддингов (активаций) на промежуточных слоях по мере обучения больших и маленьких языковых моделей (LM). https://habr.com/ru/companies/airi/articles/804515/
Понимание искусственного интеллекта и нейронных сетей путем ручной настройки параметров

В этом курсе вы получите возможность самостоятельно настроить параметры сети, помогая автомобилю научиться управлять автомобилем на специальной игровой площадке. Этот курс отлично подходит как для новичков, так и для тех, кто хочет углубить свои знания в области искусственного интеллекта.
https://www.freecodecamp.org/news/understand-ai-and-neural-networks-by-manually-adjusting-paramaters

Глубокое обучение Python: PyTorch против Tensorflow

PyTorch против TensorFlow: в чем разница? Обе библиотеки Python с открытым исходным кодом используют графики для выполнения численных вычислений над данными. Оба широко используются в академических исследованиях и коммерческом коде. Оба расширены различными API, платформами облачных вычислений и репозиториями моделей. https://realpython.com/courses/deep-learning-pytorch-tensorflow
Дорожная карта разработчиков искусственного интеллекта на 2024 год
Иллюстрированное руководство о том, как стать инженером по искусственному интеллекту в 2024 году, со ссылками на соответствующие курсы.

https://medium.com/javarevisited/the-2024-ai-artificial-intelligence-developer-roadmap-3b81db65c22a
JS-Torch — PyTorch в JavaScript
Библиотека JavaScript, такая как PyTorch, созданная с нуля… JS-Torch — это библиотека JavaScript для глубокого обучения, созданная с нуля и точно повторяющая синтаксис PyTorch.

https://github.com/eduardoleao052/js-torch
Создание LLM для восстановления кода.
В статье обсуждается функция восстановления кода Replit, которая автоматически исправляет распространенные ошибки программирования и проблемы в коде. В ней рассматривается, как Code Repair помогает разработчикам экономить время и улучшать качество кода, предоставляя автоматизированные решения распространенных проблем с кодированием.

https://blog.replit.com/code-repair
Небольшое руководство по созданию больших языковых моделей в 2024 году.
Это первое видео из серии из двух частей, охватывающей все концепции обучения высокопроизводительной LLM в 2024 году.

https://www.youtube.com/watch?v=2-SPH9hIKT8
Представляем крупнейший в мире синтетический набор данных Text-to-SQL с открытым исходным кодом

Gretel выпускает крупнейший набор данных Text-to-SQL с открытым исходным кодом для ускорения обучения моделей ИИ
https://gretel.ai/blog/synthetic-text-to-sql-dataset
🤖 Репозиторий руководств по машинному обучению 🤖

Вы найдете → Python → Компьютерное зрение → NLP → Matplotlib → NumPy → Pandas → MLOps → LLM → PyTorch/TensorFlow . ⬇️

https://github.com/patchy631/machine-learning
Математика, лежащая в основе сверточных нейронных сетей
Погрузитесь в CNN, основу компьютерного зрения, разберитесь в ее математике, реализуйте ее с нуля и изучите ее приложения.

https://towardsdatascience.com/the-math-behind-convolutional-neural-networks-6aed775df076
В этом сообщении блога мы поделимся шаблоном, который, по нашему мнению, охватывает большинство рекомендательных систем, развернутых сегодня, с примерами от таких компаний, как Meta, Netflix и Pinterest. Этот шаблон занимает центральное место в том, как мы думаем о создании комплексных систем Recsys в команде NVIDIA Merlin , и мы рады поделиться им с более широким сообществом и помочь достичь понимания и консенсуса относительно того, как выглядят рекомендательные системы (а не только модели)

https://medium.com/nvidia-merlin/recommender-systems-not-just-recommender-models-485c161c755e
Примечания о том, как использовать LLM в вашем продукте.

Практически каждая известная мне компания ищет способ извлечь выгоду из больших языковых моделей. Даже если их руководители не видят особой применимости, их инвесторы, скорее всего, видят, поэтому они нервно смотрят на пустую страницу, пытаясь придумать идею. Легко привести доводы в пользу того, что LLM каким-то образом повышает внутреннюю эффективность, но гораздо сложнее описать правдоподобный способ, которым LLM сделает ваш продукт более полезным для ваших клиентов.
https://lethain.com/mental-model-for-how-to-use-llms-in-products
HTML Embed Code:
2025/07/08 13:04:37
Back to Top