Channel: Big data world
Самый лучший в мире курс по Машинному обучению — Алгоритмы Машинного обучения с нуля
https://habr.com/ru/articles/802459/
https://habr.com/ru/articles/802459/
Хабр
Самый лучший в мире курс по Машинному обучению — Алгоритмы Машинного обучения с нуля
Хочу представить вашему вниманию курс, который я недавно закончил писать на Степике - Алгоритмы Машинного обучения с нуля . На этом курсе вам предстоит реализовать на чистом Python (+ NumPy и Pandas)...
Is Fashion ML Profession?
Правильный ответ Lamoda Tech назовет на Data Science митапе 28 марта. Приходи обсудить ML-эксперименты и готовые решения «под капотом» крупнейшей модной платформы в России!
Раскроем все details: как адаптируем каталог под индивидуальный стиль пользователей, отвечаем на сложные запросы в поиске, подбираем образы на уровне стилистов и рекомендуем подходящие размеры.
Программа:
19:05 Data Science в Lamoda: особенности применения ML в Fashion E-commerce
Александр Желубенков, Head of Data Science
19:35 Рекомендация размера с помощью машинного обучения
Никита Чуркин, Teamlead of Personalisation
20:20 В поисках стиля: Deep Learning в fashion-индустрии
Илья Черников, Senior Data Scientist
Между выступлениями и после будем общаться за вкусными закусками и напитками, а еще поиграем в настольный теннис и кикер.
Ждем вас в нашем офисе или онлайн! Регистрация обязательна по ссылке
Правильный ответ Lamoda Tech назовет на Data Science митапе 28 марта. Приходи обсудить ML-эксперименты и готовые решения «под капотом» крупнейшей модной платформы в России!
Раскроем все details: как адаптируем каталог под индивидуальный стиль пользователей, отвечаем на сложные запросы в поиске, подбираем образы на уровне стилистов и рекомендуем подходящие размеры.
Программа:
19:05 Data Science в Lamoda: особенности применения ML в Fashion E-commerce
Александр Желубенков, Head of Data Science
19:35 Рекомендация размера с помощью машинного обучения
Никита Чуркин, Teamlead of Personalisation
20:20 В поисках стиля: Deep Learning в fashion-индустрии
Илья Черников, Senior Data Scientist
Между выступлениями и после будем общаться за вкусными закусками и напитками, а еще поиграем в настольный теннис и кикер.
Ждем вас в нашем офисе или онлайн! Регистрация обязательна по ссылке
👍1
Комплексная структура для готовых к производству систем LLM путем создания вашего llm twin
https://medium.com/decodingml/an-end-to-end-framework-for-production-ready-llm-systems-by-building-your-llm-twin-2cc6bb01141f
https://medium.com/decodingml/an-end-to-end-framework-for-production-ready-llm-systems-by-building-your-llm-twin-2cc6bb01141f
Medium
An End-to-End Framework for Production-Ready LLM Systems by Building Your LLM Twin
From data gathering to productionizing LLMs using LLMOps good practices.
Встраивание текста, классификация и семантический поиск
Введение с примером кода Python
https://medium.com/towards-data-science/text-embeddings-classification-and-semantic-search-8291746220be
Введение с примером кода Python
https://medium.com/towards-data-science/text-embeddings-classification-and-semantic-search-8291746220be
Создайте исчерпывающую сводку данных за считанные секунды.
https://datamantra.medium.com/you-will-never-use-pandas-describe-method-after-using-these-two-libraries-e29aca1488d1
https://datamantra.medium.com/you-will-never-use-pandas-describe-method-after-using-these-two-libraries-e29aca1488d1
👍1
Освоение Python для науки о данных: помимо основ
Эта статья служит подробным руководством о том, как освоить передовые методы Python для науки о данных. В нем рассматриваются такие темы, как эффективное манипулирование данными с помощью Pandas, параллельная обработка с помощью Python и способы превращения моделей в веб-сервисы.
https://www.kdnuggets.com/mastering-python-for-data-science-beyond-the-basics
Эта статья служит подробным руководством о том, как освоить передовые методы Python для науки о данных. В нем рассматриваются такие темы, как эффективное манипулирование данными с помощью Pandas, параллельная обработка с помощью Python и способы превращения моделей в веб-сервисы.
https://www.kdnuggets.com/mastering-python-for-data-science-beyond-the-basics
KDnuggets
Mastering Python for Data Science: Beyond the Basics - KDnuggets
This article serves as a detailed guide on how to master advanced Python techniques for data science. It covers topics such as efficient data manipulation with Pandas, parallel processing with Python, and how to turn models into web services.
Введение в агентов LLM с Langchain: когда RAG недостаточно
https://towardsdatascience.com/intro-to-llm-agents-with-langchain-when-rag-is-not-enough-7d8c08145834
https://towardsdatascience.com/intro-to-llm-agents-with-langchain-when-rag-is-not-enough-7d8c08145834
Medium
Intro to LLM Agents with Langchain: When RAG is Not Enough
First-order principles of brain structure for AI assistants
Как использовать действия GitHub для автоматизации очистки данных.
В этом блоге мы рассмотрим, как автоматизировать процесс очистки данных в облаке с помощью действий GitHub.
https://medium.com/data-analytics-at-nesta/how-to-use-github-actions-to-automate-data-scraping-299690cd8bdb
В этом блоге мы рассмотрим, как автоматизировать процесс очистки данных в облаке с помощью действий GitHub.
https://medium.com/data-analytics-at-nesta/how-to-use-github-actions-to-automate-data-scraping-299690cd8bdb
Medium
How to Use GitHub Actions to Automate Data Scraping
A tutorial and evaluation of GitHub Actions for automating a data scraping pipeline in Python
Как устроено пространство, в котором думают языковые модели?
С момента выхода первой статьи «Attention is All You Need» я с жадностью и любопытством, присущими любому исследователю, пытаюсь углубиться во все особенности и свойства моделей на базе архитектуры трансформер. Но, если честно, я до сих пор не понимаю, как они работают и почему так хорошо обучаются. Очень хочу разобраться, в чём же причина такой эффективности этих моделей, и есть ли предел их возможностей?
Такому изучению трансформеров «под микроскопом» и посвящена наша научная работа, только что представленная на конференции EACL 2024, которая проходила на Мальте — «The Shape of Learning: Anisotropy and Intrinsic Dimensions in Transformer-Based Models». В этой работе мы сфокусировались на наблюдении за пространством эмбеддингов (активаций) на промежуточных слоях по мере обучения больших и маленьких языковых моделей (LM). https://habr.com/ru/companies/airi/articles/804515/
С момента выхода первой статьи «Attention is All You Need» я с жадностью и любопытством, присущими любому исследователю, пытаюсь углубиться во все особенности и свойства моделей на базе архитектуры трансформер. Но, если честно, я до сих пор не понимаю, как они работают и почему так хорошо обучаются. Очень хочу разобраться, в чём же причина такой эффективности этих моделей, и есть ли предел их возможностей?
Такому изучению трансформеров «под микроскопом» и посвящена наша научная работа, только что представленная на конференции EACL 2024, которая проходила на Мальте — «The Shape of Learning: Anisotropy and Intrinsic Dimensions in Transformer-Based Models». В этой работе мы сфокусировались на наблюдении за пространством эмбеддингов (активаций) на промежуточных слоях по мере обучения больших и маленьких языковых моделей (LM). https://habr.com/ru/companies/airi/articles/804515/
Хабр
Как устроено пространство, в котором думают языковые модели?
Изображение сгенерировано Dalle-3 Хабр, привет! Меня зовут Антон Разжигаев, я аспирант Сколтеха и участник научной группы Fusion Brain в институте AIRI. С момента выхода первой статьи «Attention is...
Понимание искусственного интеллекта и нейронных сетей путем ручной настройки параметров
В этом курсе вы получите возможность самостоятельно настроить параметры сети, помогая автомобилю научиться управлять автомобилем на специальной игровой площадке. Этот курс отлично подходит как для новичков, так и для тех, кто хочет углубить свои знания в области искусственного интеллекта.
https://www.freecodecamp.org/news/understand-ai-and-neural-networks-by-manually-adjusting-paramaters
Глубокое обучение Python: PyTorch против Tensorflow
PyTorch против TensorFlow: в чем разница? Обе библиотеки Python с открытым исходным кодом используют графики для выполнения численных вычислений над данными. Оба широко используются в академических исследованиях и коммерческом коде. Оба расширены различными API, платформами облачных вычислений и репозиториями моделей. https://realpython.com/courses/deep-learning-pytorch-tensorflow
В этом курсе вы получите возможность самостоятельно настроить параметры сети, помогая автомобилю научиться управлять автомобилем на специальной игровой площадке. Этот курс отлично подходит как для новичков, так и для тех, кто хочет углубить свои знания в области искусственного интеллекта.
https://www.freecodecamp.org/news/understand-ai-and-neural-networks-by-manually-adjusting-paramaters
Глубокое обучение Python: PyTorch против Tensorflow
PyTorch против TensorFlow: в чем разница? Обе библиотеки Python с открытым исходным кодом используют графики для выполнения численных вычислений над данными. Оба широко используются в академических исследованиях и коммерческом коде. Оба расширены различными API, платформами облачных вычислений и репозиториями моделей. https://realpython.com/courses/deep-learning-pytorch-tensorflow
freeCodeCamp.org
Understand AI and Neural Networks by Manually Adjusting Parameters
Dr. Radu is one of the most popular machine learning instructors on the Internet. And now he is back to teach AI and Neural Networks for beginners in an intuitive way. We just posted Dr. Radu's newest course on the freeCodeCamp.org YouTube channel. I...
Дорожная карта разработчиков искусственного интеллекта на 2024 год
Иллюстрированное руководство о том, как стать инженером по искусственному интеллекту в 2024 году, со ссылками на соответствующие курсы.
https://medium.com/javarevisited/the-2024-ai-artificial-intelligence-developer-roadmap-3b81db65c22a
Иллюстрированное руководство о том, как стать инженером по искусственному интеллекту в 2024 году, со ссылками на соответствующие курсы.
https://medium.com/javarevisited/the-2024-ai-artificial-intelligence-developer-roadmap-3b81db65c22a
Medium
The 2025 AI (Artificial Intelligence) Engineer/Developer RoadMap
An illustrated guide to becoming a AI Engineer in 2025 with links to relevant courses
JS-Torch — PyTorch в JavaScript
Библиотека JavaScript, такая как PyTorch, созданная с нуля… JS-Torch — это библиотека JavaScript для глубокого обучения, созданная с нуля и точно повторяющая синтаксис PyTorch.
https://github.com/eduardoleao052/js-torch
Библиотека JavaScript, такая как PyTorch, созданная с нуля… JS-Torch — это библиотека JavaScript для глубокого обучения, созданная с нуля и точно повторяющая синтаксис PyTorch.
https://github.com/eduardoleao052/js-torch
GitHub
GitHub - eduardoleao052/js-pytorch: A JavaScript library like PyTorch, with GPU acceleration.
A JavaScript library like PyTorch, with GPU acceleration. - eduardoleao052/js-pytorch
Создание LLM для восстановления кода.
В статье обсуждается функция восстановления кода Replit, которая автоматически исправляет распространенные ошибки программирования и проблемы в коде. В ней рассматривается, как Code Repair помогает разработчикам экономить время и улучшать качество кода, предоставляя автоматизированные решения распространенных проблем с кодированием.
https://blog.replit.com/code-repair
В статье обсуждается функция восстановления кода Replit, которая автоматически исправляет распространенные ошибки программирования и проблемы в коде. В ней рассматривается, как Code Repair помогает разработчикам экономить время и улучшать качество кода, предоставляя автоматизированные решения распространенных проблем с кодированием.
https://blog.replit.com/code-repair
Replit Blog
Replit — Building LLMs for Code Repair
Introduction
At Replit, we are rethinking the developer experience with AI as a first-class citizen of the development environment. Towards this vision, we are tightly integrating AI tools with our IDE. Currently, LLMs specialized for programming are trained…
At Replit, we are rethinking the developer experience with AI as a first-class citizen of the development environment. Towards this vision, we are tightly integrating AI tools with our IDE. Currently, LLMs specialized for programming are trained…
Небольшое руководство по созданию больших языковых моделей в 2024 году.
Это первое видео из серии из двух частей, охватывающей все концепции обучения высокопроизводительной LLM в 2024 году.
https://www.youtube.com/watch?v=2-SPH9hIKT8
Это первое видео из серии из двух частей, охватывающей все концепции обучения высокопроизводительной LLM в 2024 году.
https://www.youtube.com/watch?v=2-SPH9hIKT8
YouTube
A little guide to building Large Language Models in 2024
A little guide through all you need to know to train a good performance large language model in 2024.
This is an introduction talk with link to references for further reading.
This is the first video of a 2 part series:
- Video 1 (this video): covering all…
This is an introduction talk with link to references for further reading.
This is the first video of a 2 part series:
- Video 1 (this video): covering all…
Представляем крупнейший в мире синтетический набор данных Text-to-SQL с открытым исходным кодом
Gretel выпускает крупнейший набор данных Text-to-SQL с открытым исходным кодом для ускорения обучения моделей ИИ
https://gretel.ai/blog/synthetic-text-to-sql-dataset
Gretel выпускает крупнейший набор данных Text-to-SQL с открытым исходным кодом для ускорения обучения моделей ИИ
https://gretel.ai/blog/synthetic-text-to-sql-dataset
gretel.ai
Introducing world's largest synthetic open-source Text-to-SQL dataset
Gretel releases largest open source Text-to-SQL dataset to accelerate AI model training
🤖 Репозиторий руководств по машинному обучению 🤖
Вы найдете → Python → Компьютерное зрение → NLP → Matplotlib → NumPy → Pandas → MLOps → LLM → PyTorch/TensorFlow . ⬇️
https://github.com/patchy631/machine-learning
Вы найдете → Python → Компьютерное зрение → NLP → Matplotlib → NumPy → Pandas → MLOps → LLM → PyTorch/TensorFlow . ⬇️
https://github.com/patchy631/machine-learning
GitHub
GitHub - patchy631/machine-learning
Contribute to patchy631/machine-learning development by creating an account on GitHub.
Математика, лежащая в основе сверточных нейронных сетей
Погрузитесь в CNN, основу компьютерного зрения, разберитесь в ее математике, реализуйте ее с нуля и изучите ее приложения.
https://towardsdatascience.com/the-math-behind-convolutional-neural-networks-6aed775df076
Погрузитесь в CNN, основу компьютерного зрения, разберитесь в ее математике, реализуйте ее с нуля и изучите ее приложения.
https://towardsdatascience.com/the-math-behind-convolutional-neural-networks-6aed775df076
Towards Data Science
The Math Behind Convolutional Neural Networks | Towards Data Science
Dive into CNN, the backbone of Computer Vision, understand its mathematics, implement it from scratch, and explore its applications
В этом сообщении блога мы поделимся шаблоном, который, по нашему мнению, охватывает большинство рекомендательных систем, развернутых сегодня, с примерами от таких компаний, как Meta, Netflix и Pinterest. Этот шаблон занимает центральное место в том, как мы думаем о создании комплексных систем Recsys в команде NVIDIA Merlin , и мы рады поделиться им с более широким сообществом и помочь достичь понимания и консенсуса относительно того, как выглядят рекомендательные системы (а не только модели)
https://medium.com/nvidia-merlin/recommender-systems-not-just-recommender-models-485c161c755e
https://medium.com/nvidia-merlin/recommender-systems-not-just-recommender-models-485c161c755e
Medium
Recommender Systems, Not Just Recommender Models
by Even Oldridge and Karl Byleen-Higley
Примечания о том, как использовать LLM в вашем продукте.
Практически каждая известная мне компания ищет способ извлечь выгоду из больших языковых моделей. Даже если их руководители не видят особой применимости, их инвесторы, скорее всего, видят, поэтому они нервно смотрят на пустую страницу, пытаясь придумать идею. Легко привести доводы в пользу того, что LLM каким-то образом повышает внутреннюю эффективность, но гораздо сложнее описать правдоподобный способ, которым LLM сделает ваш продукт более полезным для ваших клиентов.
https://lethain.com/mental-model-for-how-to-use-llms-in-products
Практически каждая известная мне компания ищет способ извлечь выгоду из больших языковых моделей. Даже если их руководители не видят особой применимости, их инвесторы, скорее всего, видят, поэтому они нервно смотрят на пустую страницу, пытаясь придумать идею. Легко привести доводы в пользу того, что LLM каким-то образом повышает внутреннюю эффективность, но гораздо сложнее описать правдоподобный способ, которым LLM сделает ваш продукт более полезным для ваших клиентов.
https://lethain.com/mental-model-for-how-to-use-llms-in-products
Lethain
Notes on how to use LLMs in your product.
Pretty much every company I know is looking for a way to benefit from Large Language Models. Even if their executives don’t see much applicability, their investors likely do, so they’re staring at the blank page nervously trying to come up with an idea. It’s…
Представляем SceneScript, новый подход к реконструкции 3D-сцен.
https://ai.meta.com/blog/scenescript-3d-scene-reconstruction-reality-labs-research
Как я пришел к глубокому обучению
https://www.vikas.sh/post/how-i-got-into-deep-learning
https://ai.meta.com/blog/scenescript-3d-scene-reconstruction-reality-labs-research
Как я пришел к глубокому обучению
https://www.vikas.sh/post/how-i-got-into-deep-learning
Meta AI
Introducing SceneScript, a novel approach for 3D scene reconstruction
Today, we’re introducing SceneScript, a novel method for reconstructing environments and representing the layout of physical spaces.
👍1
HTML Embed Code: