Channel: Big data world
Понимание внимания в LLM
Существует множество отличных статей и руководств по ИИ, которые объясняют модель внимания в больших языковых моделях. Но эта по сути простая модель часто затемняется деталями реализации и оптимизациями. В этом посте я постараюсь перейти к сути.
https://bartoszmilewski.com/2025/03/06/understanding-attention-in-llms
Существует множество отличных статей и руководств по ИИ, которые объясняют модель внимания в больших языковых моделях. Но эта по сути простая модель часто затемняется деталями реализации и оптимизациями. В этом посте я постараюсь перейти к сути.
https://bartoszmilewski.com/2025/03/06/understanding-attention-in-llms
Bartosz Milewski's Programming Cafe
Understanding Attention in LLMs
There are many excellent AI papers and tutorials that explain the attention pattern in Large Language Models. But this essentially simple pattern is often obscured by implementation details and opt…
AMD побеждает в открытом исходном коде, GNOME завершает поддержку Wayland Новости Linux и Open Source
https://www.youtube.com/watch?v=3d65Mnr8onE
https://www.youtube.com/watch?v=3d65Mnr8onE
YouTube
AMD wins at open source, GNOME completes Wayland support Linux & Open Source News
Head to https://squarespace.com/thelinuxexperiment to save 10% off your first purchase of a website or domain using code thelinuxexperiment
Grab a brand new laptop or desktop running Linux: https://www.tuxedocomputers.com/en#
👏 SUPPORT THE CHANNEL:
Get…
Grab a brand new laptop or desktop running Linux: https://www.tuxedocomputers.com/en#
👏 SUPPORT THE CHANNEL:
Get…
Создайте своего помощника с искусственным интеллектом Second Brain
Использование агентов, систем RAG, LLMOps и LLM
https://decodingml.substack.com/p/build-your-second-brain-ai-assistant
Использование агентов, систем RAG, LLMOps и LLM
https://decodingml.substack.com/p/build-your-second-brain-ai-assistant
Substack
Build your Second Brain AI assistant
Using agents, RAG, LLMOps and LLM systems
Создание Deep Research Agent с нуля
Давайте создадим с нуля Deep Research Agent, который поможет вам в повседневной работе на базе DeepSeek R1.
https://www.newsletter.swirlai.com/p/building-deep-research-agent-from
Давайте создадим с нуля Deep Research Agent, который поможет вам в повседневной работе на базе DeepSeek R1.
https://www.newsletter.swirlai.com/p/building-deep-research-agent-from
Swirlai
Building Deep Research Agent from scratch
Let's build a Deep Research Agent to help you in your day to day work powered by DeepSeek R1 from scratch.
Создание рекомендательного сервиса по типу TikTok
Масштабирование персонализированного рекомендателя до миллионов товаров в режиме реального времени
https://medium.com/data-science-collective/1-building-a-tiktok-like-recommender-a64563262c1a
Масштабирование персонализированного рекомендателя до миллионов товаров в режиме реального времени
https://medium.com/data-science-collective/1-building-a-tiktok-like-recommender-a64563262c1a
Medium
Building a TikTok-like recommender
Scaling a personalized recommender to millions of items in real-time
Forwarded from Шпаргалки для айтишников
9 шпаргалок по RAG, LLM и агентам ИИ
...для инженеров ИИ (объяснение с наглядными примерами).
https://blog.dailydoseofds.com/p/9-rag-llm-and-ai-agent-cheat-sheets
...для инженеров ИИ (объяснение с наглядными примерами).
https://blog.dailydoseofds.com/p/9-rag-llm-and-ai-agent-cheat-sheets
Dailydoseofds
9 RAG, LLM, and AI Agent Cheat Sheets
...for AI engineers (explained with visuals).
💥ОБЪЯВЛЕНИЕ: Выпущен Opik v1.2! 💥
Opik — это фреймворк оценки LLM с открытым исходным кодом для:
🔥Реализации метрик на основе LLM
🪲Регистрации/отладки трассировок LLM
💯Оценки, аннотирования и управления версиями данных LLM И многого другого. Ознакомьтесь с репозиторием ниже. https://github.com/comet-ml/opik?twclid=22ezzw30vusgrr1nvofweb0qbi
Opik — это фреймворк оценки LLM с открытым исходным кодом для:
🔥Реализации метрик на основе LLM
🪲Регистрации/отладки трассировок LLM
💯Оценки, аннотирования и управления версиями данных LLM И многого другого. Ознакомьтесь с репозиторием ниже. https://github.com/comet-ml/opik?twclid=22ezzw30vusgrr1nvofweb0qbi
GitHub
GitHub - comet-ml/opik: Debug, evaluate, and monitor your LLM applications, RAG systems, and agentic workflows with comprehensive…
Debug, evaluate, and monitor your LLM applications, RAG systems, and agentic workflows with comprehensive tracing, automated evaluations, and production-ready dashboards. - comet-ml/opik
Карта разума панд
Лучшая интеллект-карта для освоения панд.
https://blog.dailydoseofds.com/p/pandas-mind-map
Лучшая интеллект-карта для освоения панд.
https://blog.dailydoseofds.com/p/pandas-mind-map
Dailydoseofds
Pandas Mind Map
The ultimate mind map to master Pandas.
Dolphin — это многоязычная, многозадачная модель ASR, разработанная в рамках сотрудничества Dataocean AI и Университета Цинхуа. Она поддерживает 40 восточных языков Восточной Азии, Южной Азии, Юго-Восточной Азии и Ближнего Востока, а также 22 китайских диалекта. Она обучена на более чем 210 000 часах данных, включая как собственные наборы данных DataoceanAI, так и наборы данных с открытым исходным кодом. Модель может выполнять распознавание речи, обнаружение голосовой активности (VAD), сегментацию и идентификацию языка (LID).
https://github.com/dataoceanai/dolphin
https://github.com/dataoceanai/dolphin
GitHub
GitHub - DataoceanAI/Dolphin: Dolphin is a multilingual, multitask ASR model jointly trained by DataoceanAI and Tsinghua University.
Dolphin is a multilingual, multitask ASR model jointly trained by DataoceanAI and Tsinghua University. - GitHub - DataoceanAI/Dolphin: Dolphin is a multilingual, multitask ASR model jointly traine...
Сообщество аналитиков и инженеров данных, где ты найдёшь множество интересных трюков, лайфхаков и глубоких инсайтов по работе с Pandas в Python. Всё, что нужно, чтобы усвоить мощь библиотек для анализа данных и автоматизировать рутинные задачи.
Подписаться ✔️
Подписаться ✔️
Достижение гибкой и высокоточной генерации изображений с сохранением идентичности остается сложной задачей, особенно с помощью усовершенствованных диффузионных преобразователей (DiT), таких как FLUX. Мы представляем InfiniteYou (InfU), одну из самых ранних надежных фреймворков, использующих DiT для этой задачи.
https://github.com/bytedance/infiniteyou
https://github.com/bytedance/infiniteyou
GitHub
GitHub - bytedance/InfiniteYou: 🔥 InfiniteYou: Flexible Photo Recrafting While Preserving Your Identity
🔥 InfiniteYou: Flexible Photo Recrafting While Preserving Your Identity - bytedance/InfiniteYou
Как бы я быстро освоил машинное обучение и искусственный интеллект, если бы мне пришлось начинать все сначала
https://www.youtube.com/watch?v=8xUher8-5_Q
https://www.youtube.com/watch?v=8xUher8-5_Q
YouTube
How I'd Learn ML/AI FAST If I Had to Start Over
Start you tech career today with Simplilearn: https://bit.ly/Tech-with-Tim-AIML
AI is changing extremely fast in 2025, and so is the way that you should be learning it. So in this video, I'm going to break down exactly how I would learn AI & ML if I was…
AI is changing extremely fast in 2025, and so is the way that you should be learning it. So in this video, I'm going to break down exactly how I would learn AI & ML if I was…
От MCP до мультиагентов: 10 лучших новых проектов ИИ с открытым исходным кодом на GitHub прямо сейчас и почему они важны
https://github.blog/open-source/maintainers/from-mcp-to-multi-agents-the-top-10-open-source-ai-projects-on-github-right-now-and-why-they-matter/
https://github.blog/open-source/maintainers/from-mcp-to-multi-agents-the-top-10-open-source-ai-projects-on-github-right-now-and-why-they-matter/
The GitHub Blog
From MCP to multi-agents: The top 10 new open source AI projects on GitHub right now and why they matter
Get insights on the latest trends from GitHub experts while catching up on these exciting new projects.
10 практических шагов по улучшению агентских систем
https://blog.dailydoseofds.com/p/10-practical-steps-to-improve-agentic
https://blog.dailydoseofds.com/p/10-practical-steps-to-improve-agentic
Dailydoseofds
10 Practical Steps to Improve Agentic Systems
...with implementation.
Бесплатный 65-часовой учебный лагерь GenAI
https://www.freecodecamp.org/news/free-genai-65-hour-bootcamp
https://www.freecodecamp.org/news/free-genai-65-hour-bootcamp
freeCodeCamp.org
Free GenAI 65-Hour Bootcamp
Generative AI is revolutionizing how we create, learn, and interact with digital content. From intelligent chatbots and personalized language tutors to realistic image generation and interactive story engines, the applications are endless. We just pu...
За полчаса установил DeepSeek 1.5B, пока вы искали GPT подешевле
DeepSeek 1.5B — маленький, но шустрый собрат больших языковых моделей. Работает локально, не требует железа на киловатт.
Внутри — инструкция по установке, настройке и запуску DeepSeek 1.5B на Ubuntu 24.04 с Ollama и Open WebUI.
https://habr.com/ru/companies/minerva_media/articles/909130/
DeepSeek 1.5B — маленький, но шустрый собрат больших языковых моделей. Работает локально, не требует железа на киловатт.
Внутри — инструкция по установке, настройке и запуску DeepSeek 1.5B на Ubuntu 24.04 с Ollama и Open WebUI.
https://habr.com/ru/companies/minerva_media/articles/909130/
Хабр
За полчаса установил DeepSeek 1.5B, пока вы искали GPT подешевле
Решил установить и протестировать возможности DeepSeek 1.5B — компактной языковой модели, которая работает без тяжёлого железа и запускается даже на домашнем сервере. В этой статье покажу и...
Генерация тестов ИИ: руководство для разработчиков, не стреляя себе в ногу
https://foojay.io/today/ai-driven-testing-best-practices
https://foojay.io/today/ai-driven-testing-best-practices
foojay
AI-Driven Testing Best Practices
AI can generate tests, but the result is not totally reliable. This article covers best practices to incorporate AI into the test generation.
HTML Embed Code: