Warning: mkdir(): No space left on device in /var/www/hottg/post.php on line 59

Warning: file_put_contents(aCache/aDaily/2025-07-19/post/data_math/-701-702-703-701-): Failed to open stream: No such file or directory in /var/www/hottg/post.php on line 72
🌟 ReasonFlux: математические рассуждения для LLM. @Математика Дата саентиста

Математика Дата саентиста | United States America (US)

Create: 2025-02-21 Update: 2025-07-19 03:18:15

🌟 ReasonFlux: математические рассуждения для LLM.

ReasonFlux - методика, которая используется как для обучения, так и для инференса, чтобы повысить способность LLM к сложному логическому мышлению. Применение метода позволяет превосходить OpenAI o1-preview и DeepSeek V3 в задачах математического рассуждения.

При использовании в обучении ReasonFlux использует иерархическую структуру с подкреплением на последовательности высокоуровневых шаблонов мышления. Это позволяет базовой LLM научиться планировать оптимальную траекторию шаблонов для решения сложных задач. В процессе обучения ReasonFlux анализирует и обобщает информацию о решении задач, выявляя общие закономерности, и на основе этого создает шаблоны мышления.

Во время инференса ReasonFlux автоматически извлекает релевантные шаблоны мышления и масштабирует их для достижения превосходной производительности в сложных задачах рассуждения. Он динамически выбирает наиболее подходящий шаблон высокого уровня для каждой подзадачи, упрощая поиск путей рассуждений. ReasonFlux использует новую систему масштабирования во время вывода, которая адаптирует шаблоны мышления.

В экспериментальных тестах ReasonFlux-32B достиг 91,2% точности на MATH benchmark, опередив o1-preview на 6,7%. На AIME benchmark модель решила в среднем 56,7% задач, превзойдя o1-preview и DeepSeek-V3 на 27% и 45% соответственно.

Практическая реализация метода доступна в репозитории проекта, в нем cодержится необходимый код и описание для файнтюна LLM на примере SFT-датасета решений GaoKao Bench.

⚠️ Для трейна моделей на SFT-сете проект использует фреймворк LLaMA-Factory.

▶️ Локальная установка и запуск:

# Clone the repository
git clone https://github.com/ReasonFlux
cd ReasonFlux

# Create a Conda venv
conda create -n ReasonFlux python==3.9
conda activate ReasonFlux

# Install dependencies
pip install -r requirements.txt

# When you complete your first-stage training, you can try to use simple inference
from reasonflux import ReasonFlux

reasonflux = ReasonFlux(navigator_path='path-to-navigator',
                        template_matcher_path='jinaai/jina-embeddings-v3',
                     inference_path='path-to-infernece-model',
                        template_path='template_library.json')
problem = """Given a sequence {aₙ} satisfying a₁=3, and aₙ₊₁=2aₙ+5 (n≥1), find the general term formula aₙ"""

📌Лицензирование: Apache 2.0 License.

🟡

Arxiv

🟡

SFT Датасет (на китайском)

🖥

GitHub

@ai_machinelearning_big_data

#AI #ML #LLM #ReasonFlux

Математика Дата саентиста

Forwarded from Machinelearning

# Clone the repository
git clone https://github.com/ReasonFlux
cd ReasonFlux

# Create a Conda venv
conda create -n ReasonFlux python==3.9
conda activate ReasonFlux

# Install dependencies
pip install -r requirements.txt

# When you complete your first-stage training, you can try to use simple inference
from reasonflux import ReasonFlux

reasonflux = ReasonFlux(navigator_path='path-to-navigator',
                        template_matcher_path='jinaai/jina-embeddings-v3',
                     inference_path='path-to-infernece-model',
                        template_path='template_library.json')
problem = """Given a sequence {aₙ} satisfying a₁=3, and aₙ₊₁=2aₙ+5 (n≥1), find the general term formula aₙ"""

📌Лицензирование: Apache 2.0 License.

🟡

Arxiv

🟡

SFT Датасет (на китайском)

🖥

GitHub

@ai_machinelearning_big_data

#AI #ML #LLM #ReasonFlux

Please open Telegram to view this post

VIEW IN TELEGRAM

👍10🤷‍♂1❤1

hottg.com/data_math/702

4.05K viewsFeb 21 at 09:55

>>Click here to continue<<

Математика Дата саентиста

Share with your best friend

How to Create Telegram Channels on Mobile and Web

Telegram channels allow you to host a large audience and to share information with them. An unlimited number of subscribers can join a Telegram channel. In this step-by-step guide, we will show you how to create Telegram channels on mobile and on the web. We’ll also tell you about the difference between Telegram groups and channels, how to add people to your channel, and some admin controls that you’ll need.

🌟 ReasonFlux: математические рассуждения для LLM.

Математика Дата саентиста TG
Webview: 702
Telegram TG Webview: hottg.com/data_math/webview
Telegram TG Channel: Математика Дата саентиста
Telegram Updated:
Warning: filemtime(): stat failed for aCache/aDaily/2025-07-19/post/data_math/-701-702-703-701- in /var/www/hottg/post.php on line 338
1970-01-01 00:00:00

United States America Popular Telegram Group (US)

Warning: Undefined array key 3 in /var/www/hottg/function.php on line 115

Fatal error: Uncaught mysqli_sql_exception: Can't create/write to file '/tmp/#sql-temptable-a06e-538353-1b91.MAI' (Errcode: 28 "No space left on device") in /var/www/hottg/function.php:216 Stack trace: #0 /var/www/hottg/function.php(216): mysqli_query() #1 /var/www/hottg/function.php(115): select() #2 /var/www/hottg/post.php(351): daCache() #3 /var/www/hottg/route.php(63): include_once('...') #4 {main} thrown in /var/www/hottg/function.php on line 216