Channel: Big data world
⚡️ Как эффективно использовать явный и неявный фидбек в рекомендательных системах?
Расскажет опытный эксперт на открытом практическом уроке от OTUS, где вы:
— познакомитесь с двумя типами фидбека от пользователя: явным и неявным;
— обучите рекомендательные модели на разных типах фидбека;
— сравните их качество.
📌 Вебинар будет полезен дата-сайентистам и ML-спецам, которые хотят расширить область знаний и технологический стек.
Встречаемся 23 мая в 20:00 мск в преддверии старта курса «Machine Learning. Professional». Все участники вебинара получат специальную цену на обучение и персональную консультацию от менеджера OTUS!
💣 Пройдите короткий тест прямо сейчас, чтобы посетить бесплатный урок: https://otus.pw/Aixz/?erid=LjN8KJRiu
Расскажет опытный эксперт на открытом практическом уроке от OTUS, где вы:
— познакомитесь с двумя типами фидбека от пользователя: явным и неявным;
— обучите рекомендательные модели на разных типах фидбека;
— сравните их качество.
📌 Вебинар будет полезен дата-сайентистам и ML-спецам, которые хотят расширить область знаний и технологический стек.
Встречаемся 23 мая в 20:00 мск в преддверии старта курса «Machine Learning. Professional». Все участники вебинара получат специальную цену на обучение и персональную консультацию от менеджера OTUS!
💣 Пройдите короткий тест прямо сейчас, чтобы посетить бесплатный урок: https://otus.pw/Aixz/?erid=LjN8KJRiu
Алгоритмы машинного обучения
Минимальные и понятные примеры реализации алгоритмов машинного обучения
https://github.com/rushter/MLAlgorithms
llama3.np — это чистая реализация NumPy для модели Llama 3.
https://github.com/likejazz/llama3.np
Минимальные и понятные примеры реализации алгоритмов машинного обучения
https://github.com/rushter/MLAlgorithms
llama3.np — это чистая реализация NumPy для модели Llama 3.
https://github.com/likejazz/llama3.np
GitHub
GitHub - rushter/MLAlgorithms: Minimal and clean examples of machine learning algorithms implementations
Minimal and clean examples of machine learning algorithms implementations - rushter/MLAlgorithms
PySheets предоставляет пользовательский интерфейс электронных таблиц для Python. Используйте Pandas, создавайте диаграммы, импортируйте листы Excel, анализируйте данные и создавайте отчеты.
py2wasm преобразует программы Python в WebAssembly и запускает их в 3 раза быстрее, чем CPython.
databonsai — это библиотека Python, которая использует LLM для задач очистки данных, таких как категоризация, преобразование и извлечение.
py2wasm преобразует программы Python в WebAssembly и запускает их в 3 раза быстрее, чем CPython.
databonsai — это библиотека Python, которая использует LLM для задач очистки данных, таких как категоризация, преобразование и извлечение.
wasmer.io
Announcing py2wasm: A Python to Wasm compiler · Blog · Wasmer
Since starting Wasmer five years ago we've been obsessed with empowering more languages to target the web and beyond through Webassembly.
One of the ...
One of the ...
Использование идей теории игр для повышения надежности языковых моделей
Новая «консенсусная игра», разработанная исследователями MIT CSAIL, повышает навыки ИИ в понимании и генерации текста.
https://news.mit.edu/2024/consensus-game-elevates-ai-text-comprehension-generation-skills-0514
Новая «консенсусная игра», разработанная исследователями MIT CSAIL, повышает навыки ИИ в понимании и генерации текста.
https://news.mit.edu/2024/consensus-game-elevates-ai-text-comprehension-generation-skills-0514
MIT News
Using ideas from game theory to improve the reliability of language models
A new "consensus game," an MIT-developed game-theoretic procedure for decoding language models, enhances text generation by converging generative and discriminative querying into coherent predictions.
Доказательство обучения в области машинного обучения/ИИ
Прежде чем приступить к какой-либо математической разработке, мы должны сначала понять основу обучения и то, как оно тесно связано с концепцией ошибки.
https://towardsdatascience.com/the-proof-of-learning-in-machine-learning-ai-4faae3c85fe6
Прежде чем приступить к какой-либо математической разработке, мы должны сначала понять основу обучения и то, как оно тесно связано с концепцией ошибки.
https://towardsdatascience.com/the-proof-of-learning-in-machine-learning-ai-4faae3c85fe6
Medium
The Proof of Learning in Machine Learning/AI
Before any mathematical development, we must first understand the foundation of learning and how it is closely linked to the concept of…
10 бесплатных обязательных курсов по науке о данных, чтобы начать работу
Хотите начать свое путешествие в науку о данных? Тогда позвольте этим курсам помочь вам в этом путешествии. https://www.kdnuggets.com/10-free-must-take-data-science-courses-to-get-started
Хотите начать свое путешествие в науку о данных? Тогда позвольте этим курсам помочь вам в этом путешествии. https://www.kdnuggets.com/10-free-must-take-data-science-courses-to-get-started
KDnuggets
10 Free Must-Take Data Science Courses to Get Started
Want to start your data science journey? Then, let these courses guide you on that trip.
Создайте свою собственную среду глубокого обучения на основе C/C++, CUDA и Python с поддержкой графического процессора и автоматической дифференциацией.
https://towardsdatascience.com/recreating-pytorch-from-scratch-with-gpu-support-and-automatic-differentiation-8f565122a3cc
https://towardsdatascience.com/recreating-pytorch-from-scratch-with-gpu-support-and-automatic-differentiation-8f565122a3cc
Medium
Recreating PyTorch from Scratch (with GPU Support and Automatic Differentiation)
Build your own deep learning framework based on C/C++, CUDA and Python, with GPU support and automatic differentiation!
Полное руководство по BERT с кодом
История, архитектура, предварительная подготовка и тонкая настройка
https://towardsdatascience.com/a-complete-guide-to-bert-with-code-9f87602e4a11
История, архитектура, предварительная подготовка и тонкая настройка
https://towardsdatascience.com/a-complete-guide-to-bert-with-code-9f87602e4a11
Medium
A Complete Guide to BERT with Code
History, Architecture, Pre-training, and Fine-tuning
Mamba — это сильная альтернатива Transformer, которая набирает обороты благодаря своей способности использовать меньшее количество FLOP при сохранении производительности. Однако для некоторых приложений это может не потребоваться. Эта работа показывает, что хорошо настроенная базовая линия CNN превосходит Mamba в ряде задач по зрению.
https://github.com/yuweihao/mambaout
https://github.com/yuweihao/mambaout
GitHub
GitHub - yuweihao/MambaOut: MambaOut: Do We Really Need Mamba for Vision? (CVPR 2025)
MambaOut: Do We Really Need Mamba for Vision? (CVPR 2025) - yuweihao/MambaOut
Большие языковые модели гораздо линейнее, чем мы думали
https://habr.com/ru/companies/airi/articles/816125/
https://habr.com/ru/companies/airi/articles/816125/
Хабр
Большие языковые модели гораздо линейнее, чем мы думали
Хабр, привет! Это снова Антон Разжигаев, аспирант Сколтеха и научный сотрудник лаборатории FusionBrain в Институте AIRI, где мы продолжаем углубляться в изучение языковых моделей. В прошлый раз мы...
10 репозиториев GitHub для разработки мастер-данных
Изучите инженерию данных с помощью бесплатных курсов, учебных пособий, книг, инструментов, руководств, дорожных карт, практических упражнений, проектов и других ресурсов. https://www.kdnuggets.com/10-github-repositories-to-master-data-engineering
Изучите инженерию данных с помощью бесплатных курсов, учебных пособий, книг, инструментов, руководств, дорожных карт, практических упражнений, проектов и других ресурсов. https://www.kdnuggets.com/10-github-repositories-to-master-data-engineering
KDNuggets
10 GitHub Repositories to Master Data Engineering
Learn data engineering through free courses, tutorials, books, tools, guides, roadmaps, practice exercises, projects, and other resources.
Обучение машин с градиентным усилением может занять некоторое время, но есть внутренний трюк, который мы можем применить, чтобы обучение деревьев было намного быстрее. Оказывается, гистограмма — это все, что нам нужно!..
https://www.youtube.com/watch?v=5okmBJaE0kY
https://www.youtube.com/watch?v=5okmBJaE0kY
YouTube
Histograms for faster boosting
Gradient boosted machines can take a while to train, but there is an internal trick that we can pull off to make it a whole lot faster to train trees. It turns out that a histogram may be all we need!
If you're curious about the code, you can find the notebook…
If you're curious about the code, you can find the notebook…
Обучение с подкреплением: глубокие Q-сети
https://towardsdatascience.com/reinforcement-learning-from-scratch-deep-q-networks-0a8d33ce165b
https://towardsdatascience.com/reinforcement-learning-from-scratch-deep-q-networks-0a8d33ce165b
Medium
Reinforcement Learning: Deep Q-Networks
Teaching a shuttle to land on the moon using Deep Q-Networks in Python. A mathematical deep dive into Reinforcement Learning.
Прогнозирование диабета 1 типа у детей с использованием электронных медицинских карт в первичной медико-санитарной помощи в Великобритании: разработка и проверка алгоритма машинного обучения
Детей, поступающих в первичную медицинскую помощь с подозрением на диабет 1 типа, следует немедленно направлять в вторичную помощь, чтобы избежать опасного для жизни диабетического кетоацидоза . Однако раннее выявление детей с диабетом 1 типа является сложной задачей. У детей могут отсутствовать классические симптомы, или симптомы могут быть связаны с более распространенными заболеваниями. У четверти детей наблюдается диабетический кетоацидоз, причем эта пропорция не меняется в течение 25 лет. Нашей целью было выяснить, может ли алгоритм машинного обучения привести к более раннему выявлению диабета 1 типа в учреждениях первичной медико-санитарной помощи…
https://www.thelancet.com/journals/landig/article/PIIS2589-7500(24)00050-5/fulltext
Детей, поступающих в первичную медицинскую помощь с подозрением на диабет 1 типа, следует немедленно направлять в вторичную помощь, чтобы избежать опасного для жизни диабетического кетоацидоза . Однако раннее выявление детей с диабетом 1 типа является сложной задачей. У детей могут отсутствовать классические симптомы, или симптомы могут быть связаны с более распространенными заболеваниями. У четверти детей наблюдается диабетический кетоацидоз, причем эта пропорция не меняется в течение 25 лет. Нашей целью было выяснить, может ли алгоритм машинного обучения привести к более раннему выявлению диабета 1 типа в учреждениях первичной медико-санитарной помощи…
https://www.thelancet.com/journals/landig/article/PIIS2589-7500(24)00050-5/fulltext
The Lancet Digital Health
Predicting type 1 diabetes in children using electronic health records in primary care in the UK: development and validation of…
If implemented into primary care settings, this predictive algorithm could substantially
reduce the proportion of patients with new-onset type 1 diabetes presenting in diabetic
ketoacidosis. Acceptability of alert thresholds should be explored in primary…
reduce the proportion of patients with new-onset type 1 diabetes presenting in diabetic
ketoacidosis. Acceptability of alert thresholds should be explored in primary…
Изменение графического процессора меняет поведение вашего LLM.
https://medium.com/@anis.zakari/changing-the-gpu-is-changing-the-behaviour-of-your-llm-0e6dd8dfaaae
https://medium.com/@anis.zakari/changing-the-gpu-is-changing-the-behaviour-of-your-llm-0e6dd8dfaaae
Medium
Changing the GPU is changing the behaviour of your LLM.
Most tech people know that varying versions of dependencies can result in different behaviors. However, in the realm of Large Language…
Ускоренный курс линейной алгебры — математика для машинного обучения и генеративного искусственного интеллекта
https://www.freecodecamp.org/news/linear-algebra-crash-course-mathematics-for-machine-learning-and-generative-ai
https://www.freecodecamp.org/news/linear-algebra-crash-course-mathematics-for-machine-learning-and-generative-ai
freeCodeCamp.org
Linear Algebra Crash Course - Mathematics for Machine Learning and Generative AI
Linear algebra is a useful skill for professionals in data science, machine learning, and AI. We just posted a course on the freeCodeCamp.org YouTube channel that will teach you linear algebra. This crash course spans just over 6 hours and is a great...
Создание помощника по искусственному интеллекту для частных медицинских учреждений с использованием гибридного облака Qdrant (JWT-RBAC), DSPy и Groq — Llama3
https://ai.gopubby.com/building-private-healthcare-ai-assistant-for-clinics-using-qdrant-hybrid-cloud-jwt-rbac-dspy-and-089a772e08ae
https://ai.gopubby.com/building-private-healthcare-ai-assistant-for-clinics-using-qdrant-hybrid-cloud-jwt-rbac-dspy-and-089a772e08ae
Medium
Building Private Healthcare AI Assistant for Clinics Using Qdrant Hybrid Cloud (JWT-RBAC), DSPy and…
Introduction: Security in AI Healthcare
В этом руководстве по Python мы рассмотрим основы настройки элемента управления DataTable с использованием Flet.
https://www.youtube.com/watch?v=Xl7BXURZ_HI
https://www.youtube.com/watch?v=Xl7BXURZ_HI
YouTube
Python Tutorial DataTable Using Flet
In this Python tutorial, we'll go over the basics in setting up a DataTable control using Flet. We'll divide the application into three main parts, each serving a specific function. Other extra features
include search and filtering functionality.
**note:…
include search and filtering functionality.
**note:…
Сети Колмогорова-Арнольда (KAN) собираются навсегда изменить мир искусственного интеллекта
Забудьте все, что вы знали о нейронных сетях, KAN здесь, чтобы переписать правила
https://medium.com/international-school-of-ai-data-science/kolmogorov-arnold-networks-kan-are-about-to-change-the-ai-world-forever-687f6d0b4d93
Забудьте все, что вы знали о нейронных сетях, KAN здесь, чтобы переписать правила
https://medium.com/international-school-of-ai-data-science/kolmogorov-arnold-networks-kan-are-about-to-change-the-ai-world-forever-687f6d0b4d93
Лучшие SQL-запросы для специалистов по данным
SQL кажется аутсайдером в области науки о данных по сравнению с Python и R. Однако это далеко не так. Я покажу вам здесь, как вы можете использовать его в качестве специалиста по данным. https://www.kdnuggets.com/top-sql-queries-for-data-scientists
SQL кажется аутсайдером в области науки о данных по сравнению с Python и R. Однако это далеко не так. Я покажу вам здесь, как вы можете использовать его в качестве специалиста по данным. https://www.kdnuggets.com/top-sql-queries-for-data-scientists
KDnuggets
Top SQL Queries for Data Scientists
SQL seems like a data science underdog compared to Python and R. However, it’s far from it. I’ll show you here how you can use it as a data scientist.
HTML Embed Code: