Channel: Big data world
Краткое введение в использование векторной базы данных
В которой мы узнаем, как создать простую векторную базу данных с использованием вложений Pinecone и OpenAI, и обнаружим, что это гораздо проще, чем мы могли ожидать.
https://stevekinney.net/writing/using-a-vector-database
В которой мы узнаем, как создать простую векторную базу данных с использованием вложений Pinecone и OpenAI, и обнаружим, что это гораздо проще, чем мы могли ожидать.
https://stevekinney.net/writing/using-a-vector-database
Дорожная карта по освоению машинного обучения в 2025 году
https://machinelearningmastery.com/roadmap-mastering-machine-learning-2025
https://machinelearningmastery.com/roadmap-mastering-machine-learning-2025
Создание ИИ-агента для вашего фронтенд-проекта
https://blog.logrocket.com/building-ai-agent-frontend-project
https://blog.logrocket.com/building-ai-agent-frontend-project
LogRocket Blog
Building an AI agent for your frontend project - LogRocket Blog
Explore the benefits of building your own AI agent from scratch using Langbase, BaseUI, and Open AI, in a demo Next.js project.
Beyond Jupyter — это сборник материалов для самостоятельного изучения проектирования программного обеспечения, в котором особое внимание уделяется приложениям машинного обучения. Он демонстрирует, как грамотное проектирование программного обеспечения может ускорить как разработку, так и эксперименты. https://transferlab.ai/trainings/beyond-jupyter
transferlab.ai
Beyond Jupyter | TransferLab — appliedAI Institute
Beyond Jupyter is a collection of self-study materials on software design, with a specific focus on machine learning applications, which demonstrates how sound software design can accelerate both development and experimentation.
Как использовать DeepSeek R1 бесплатно в Visual Studio Code с Cline или Roo Code
https://dev.to/dwtoledo/how-to-use-deepseek-r1-for-free-in-visual-studio-code-with-cline-or-roo-code-3an9
https://dev.to/dwtoledo/how-to-use-deepseek-r1-for-free-in-visual-studio-code-with-cline-or-roo-code-3an9
DEV Community
How to Use DeepSeek R1 for Free in Visual Studio Code with Cline or Roo Code
If you're looking for an AI that excels in reasoning and is also free because it's open source, the...
Масштабирование во время тестирования — это многообещающий новый подход к языковому моделированию, который использует дополнительные вычисления во время тестирования для повышения производительности. Недавно модель OpenAI o1 продемонстрировала эту возможность, но не поделилась своей методологией публично, что привело к многочисленным попыткам репликации. Мы ищем самый простой подход для достижения масштабирования во время тестирования и высокой производительности рассуждений.
https://github.com/simplescaling/s1
https://github.com/simplescaling/s1
GitHub
GitHub - simplescaling/s1: s1: Simple test-time scaling
s1: Simple test-time scaling. Contribute to simplescaling/s1 development by creating an account on GitHub.
Все, что вам нужно знать для создания собственного приложения RAG
https://github.com/bRAGAI/bRAG-langchain
https://github.com/bRAGAI/bRAG-langchain
GitHub
GitHub - BragAI/bRAG-langchain: Everything you need to know to build your own RAG application
Everything you need to know to build your own RAG application - BragAI/bRAG-langchain
Ваша машина, ваш искусственный интеллект — наилучший локальный пакет производительности с Ollama
https://blog.det.life/your-machine-your-ai-the-ultimate-local-productivity-stack-with-ollama-7a118f271479
https://blog.det.life/your-machine-your-ai-the-ultimate-local-productivity-stack-with-ollama-7a118f271479
Medium
Your Machine, Your AI — The Ultimate Local Productivity Stack with Ollama
Supercharge Workflows: How to 10x Your Productivity with Local AI, Ollama, and Raycast — 100% Free & Secure
Vision Search Assistant: Расширьте возможности моделей Vision-Language в качестве мультимодальных поисковых систем
https://cnzzx.github.io/VSA
https://cnzzx.github.io/VSA
Изучите пять шаблонов проектирования агентского ИИ, которые повышают эффективность агентов ИИ
https://blog.dailydoseofds.com/p/5-agentic-ai-design-patterns
https://blog.dailydoseofds.com/p/5-agentic-ai-design-patterns
Dailydoseofds
5 Agentic AI Design Patterns
...explained visually
Агентские и RAG-системы обычно испытывают трудности с обновлением знаний в режиме реального времени и быстрым поиском данных.
Сегодня давайте обсудим недавнюю статью Zep , в которой представлена интересная архитектура графа знаний с учетом времени, призванная решить эту проблему. https://blog.dailydoseofds.com/p/build-human-like-memory-for-your
Сегодня давайте обсудим недавнюю статью Zep , в которой представлена интересная архитектура графа знаний с учетом времени, призванная решить эту проблему. https://blog.dailydoseofds.com/p/build-human-like-memory-for-your
Dailydoseofds
Build Human-like Memory for Your AI Agents
A must-read research paper on Agents!
Обнаружение аномалий в машинном обучении с использованием Python
https://blog.jetbrains.com/pycharm/2025/01/anomaly-detection-in-machine-learning
https://blog.jetbrains.com/pycharm/2025/01/anomaly-detection-in-machine-learning
The JetBrains Blog
Anomaly Detection in Machine Learning Using Python | The PyCharm Blog
Learn how to detect anomalies in machine learning using Python. Explore key techniques with code examples and visualizations in PyCharm for data science tasks.
20 важных статистических подходов, которые знает каждый специалист по данным🐱🚀
https://medium.com/@sarowar.saurav10/20-advanced-statistical-approaches-every-data-scientist-should-know-ccc70ae4df28
https://medium.com/@sarowar.saurav10/20-advanced-statistical-approaches-every-data-scientist-should-know-ccc70ae4df28
Medium
20 Important Statistical Approaches Every Data Scientist Knows🐱🚀
Data science is a multidisciplinary field that combines mathematics, statistics, computer science, and domain expertise to extract…
Какой лучший PDF Extractor для RAG? Я пробовал LlamaParse, Unstructured и Vectorize
https://levelup.gitconnected.com/whats-the-best-pdf-extractor-for-rag-i-tried-llamaparse-unstructured-and-vectorize-4abbd57b06e0
https://levelup.gitconnected.com/whats-the-best-pdf-extractor-for-rag-i-tried-llamaparse-unstructured-and-vectorize-4abbd57b06e0
Medium
What’s the Best PDF Extractor for RAG? I Tried LlamaParse, Unstructured and Vectorize
If you’re building retrieval augmented generation (RAG) applications, you will eventually need to work with documents that are in PDF form.
Новые тенденции в создании продуктов GenAI
По мере того, как мы перемещаем программные продукты, использующие технологию генеративного ИИ, из проверки концепций в производственные системы, мы обнаруживаем ряд общих шаблонов. Оценки играют центральную роль в обеспечении того, чтобы эти недетерминированные системы работали в разумных границах. Большие языковые модели нуждаются в улучшении, чтобы предоставлять информацию за пределами общего и статического обучающего набора. В большинстве случаев мы можем сделать это с помощью Retrieval Augmented Generation (RAG), хотя базовый подход RAG требует нескольких шаблонов для преодоления своих ограничений. Когда RAG недостаточно, становится полезной тонкая настройка.
https://martinfowler.com/articles/gen-ai-patterns
По мере того, как мы перемещаем программные продукты, использующие технологию генеративного ИИ, из проверки концепций в производственные системы, мы обнаруживаем ряд общих шаблонов. Оценки играют центральную роль в обеспечении того, чтобы эти недетерминированные системы работали в разумных границах. Большие языковые модели нуждаются в улучшении, чтобы предоставлять информацию за пределами общего и статического обучающего набора. В большинстве случаев мы можем сделать это с помощью Retrieval Augmented Generation (RAG), хотя базовый подход RAG требует нескольких шаблонов для преодоления своих ограничений. Когда RAG недостаточно, становится полезной тонкая настройка.
https://martinfowler.com/articles/gen-ai-patterns
martinfowler.com
Emerging Patterns in Building GenAI Products
Patterns from our colleagues' work building with Generative AI
olmOCR: разблокировка триллионов токенов в PDF-файлах с помощью моделей Vision Language
https://github.com/allenai/olmocr
https://github.com/allenai/olmocr
GitHub
GitHub - allenai/olmocr: Toolkit for linearizing PDFs for LLM datasets/training
Toolkit for linearizing PDFs for LLM datasets/training - allenai/olmocr
HTML Embed Code: