TG Telegram Group Link
Channel: Big data world
Back to Bottom
Понимание внимания в LLM
Существует множество отличных статей и руководств по ИИ, которые объясняют модель внимания в больших языковых моделях. Но эта по сути простая модель часто затемняется деталями реализации и оптимизациями. В этом посте я постараюсь перейти к сути.

https://bartoszmilewski.com/2025/03/06/understanding-attention-in-llms
Создайте своего помощника с искусственным интеллектом Second Brain
Использование агентов, систем RAG, LLMOps и LLM

https://decodingml.substack.com/p/build-your-second-brain-ai-assistant
Создание Deep Research Agent с нуля
Давайте создадим с нуля Deep Research Agent, который поможет вам в повседневной работе на базе DeepSeek R1.

https://www.newsletter.swirlai.com/p/building-deep-research-agent-from
Создание рекомендательного сервиса по типу TikTok
Масштабирование персонализированного рекомендателя до миллионов товаров в режиме реального времени

https://medium.com/data-science-collective/1-building-a-tiktok-like-recommender-a64563262c1a
9 шпаргалок по RAG, LLM и агентам ИИ
...для инженеров ИИ (объяснение с наглядными примерами).

https://blog.dailydoseofds.com/p/9-rag-llm-and-ai-agent-cheat-sheets
💥ОБЪЯВЛЕНИЕ: Выпущен Opik v1.2! 💥

Opik — это фреймворк оценки LLM с открытым исходным кодом для:

🔥Реализации метрик на основе LLM
🪲Регистрации/отладки трассировок LLM
💯Оценки, аннотирования и управления версиями данных LLM И многого другого. Ознакомьтесь с репозиторием ниже. https://github.com/comet-ml/opik?twclid=22ezzw30vusgrr1nvofweb0qbi
Карта разума панд
Лучшая интеллект-карта для освоения панд.

https://blog.dailydoseofds.com/p/pandas-mind-map
Dolphin — это многоязычная, многозадачная модель ASR, разработанная в рамках сотрудничества Dataocean AI и Университета Цинхуа. Она поддерживает 40 восточных языков Восточной Азии, Южной Азии, Юго-Восточной Азии и Ближнего Востока, а также 22 китайских диалекта. Она обучена на более чем 210 000 часах данных, включая как собственные наборы данных DataoceanAI, так и наборы данных с открытым исходным кодом. Модель может выполнять распознавание речи, обнаружение голосовой активности (VAD), сегментацию и идентификацию языка (LID).

https://github.com/dataoceanai/dolphin
Сообщество аналитиков и инженеров данных, где ты найдёшь множество интересных трюков, лайфхаков и глубоких инсайтов по работе с Pandas в Python. Всё, что нужно, чтобы усвоить мощь библиотек для анализа данных и автоматизировать рутинные задачи.

Подписаться ✔️
Достижение гибкой и высокоточной генерации изображений с сохранением идентичности остается сложной задачей, особенно с помощью усовершенствованных диффузионных преобразователей (DiT), таких как FLUX. Мы представляем InfiniteYou (InfU), одну из самых ранних надежных фреймворков, использующих DiT для этой задачи.

https://github.com/bytedance/infiniteyou
За полчаса установил DeepSeek 1.5B, пока вы искали GPT подешевле

DeepSeek 1.5B — маленький, но шустрый собрат больших языковых моделей. Работает локально, не требует железа на киловатт.

Внутри — инструкция по установке, настройке и запуску DeepSeek 1.5B на Ubuntu 24.04 с Ollama и Open WebUI.
https://habr.com/ru/companies/minerva_media/articles/909130/
HTML Embed Code:
2025/06/26 13:18:04
Back to Top