TG Telegram Group Link
Channel: دستاوردهای یادگیری عمیق(InTec)
Back to Bottom
مدل
Devstral: the best open source model for coding agents

با ۲۴ میلیارد پارامتر روی ollama اضافه شد.


Ollama

حجم بسیار کم، نتایج بسیار عالی (بنچمارک) از ویژگی‌های این مدل هست.
بنظرتون شرکت apple میره سمت خرید openai ؟
چند روزی هست بحث‌هایی بوجود اومده

با اینکه اپل شدیداً به یک تکون بزرگ در زمینه AI نیاز داره و سهامش هم داره سقوط می‌کنه.
ولی فکر نمی‌کنم نیازی به OpenAi با اون رقم و ... داشته باشه.

شخصاً نظرم منفی هست؛ ولی خبر جالبیه این موضوع.
یعنی ی گروه همکلاسی (دانشجو) پیدا نمیشه
یک لیدربرد برای embedding فارسی بزنه ؟

اینکه دیگه سخت‌افزار نمی‌خواد
نفری ۱۰۰ تا جمله رو تگ بزنید، کار در میادا

پ.ن:
دانشگاه زمان ما سالانه حدوداً ۹۰-۱۲۰ تا ورودی مهندسی نرم‌افزار و IT داشت.

اگرم دوست داشتید اینکار رو بکنید؛ به
@abbasi_ai
پیام بدید؛ من شمارو به هم لینک کنم.
Please open Telegram to view this post
VIEW IN TELEGRAM
برهیچکس پوشیده نیست که من عاشق نوشتن
Test case

برای پروژه‌هام هستم، چیزی که نتونی تستش کنی چطوری می‌تونی بفهمی بهتر شده یا بدتر یا اصلا تغییری داشته یا نه ؟
با کمک

DeepEval

می‌تونیم همین طرز تفکر رو ببریم روی پروژه‌های LLM ببینیم چی می‌شه
بهترین‌های تیم Llama3.1, ... اکثراً قبل از Llama4 از شرکت استعفا دادند و با Mistral قرارداد بستند.

یک افتضاح بزرگ با انتشار Llama4 بوجود اومد؛ اصلا کسی هست ازین مدل استفاده کنه ؟

علاوه بر اون؛ تصمیمات Meta و عدم دسترسی حتی افراد حقیقی به مدلهای شرکت و .... هم باعث این موضوع بوده.

تیم Mistral رو اگر نمی‌شناسید، پیشنهاد می‌دم حداقل از مدل‌هاش برای OCR و خوندن داکیومنت و استخراج متن استفاده کنید، بعداً ازم تشکر خواهید کرد 😉
ی پایپ لاین n8n گرفتم، ۲ ماهه داره گزارشات تحلیلی به شرکت میده (همه پلن‌ها رو شرکته بر این اساس چیده)

رفتم یک بررسی کنم، چون از کدهای خودم مطمئن بودم.
دیدم ۲ ماه هست داره کوئری و .... اشتباه میزنه و اصلا وضعیت شرکت این نیست.

هیچی دیگه؛ احتمالاً ی ضرر مالی یا زمانی اون پشت دارند.

تسک من که تموم شد، ولی اینکه خروجی AI رو تست و بررسی نکنید.
خیلی باگ هستا، خیلی
این پست رو مراجعه کنید به لینک؛ دقیق بخونید و بعد یک جا ذخیره کنید. چرا ؟ چون یک دوره ۷-۸ ساعتِ سیستم پرامپت نویسی توی این لینک هست و تازه کاملاً هم جواب می‌ده:

Claude 4 System Prompt

و شاید کمتر از ۲۰ دقیقه خوندنش ازتون وقت بگیره.
شدیداً منتظر یک نسخه، open weight برای Gemma 3n هستم؛ این مدل ریزه میزه خوراکش چت کردن هست و tool calling

مثلاً اگر leader board اش رو ببینید با اختلاف خیلی کم از مدل‌های درجه یک همین چندوقت قبل وایساده.

پ.ن : یکی از دوستان اشاره کردند وزن‌های این مدل روی huggingface قرار گرفته
شخصاً هنوز بررسی نکردم
دستاوردهای یادگیری عمیق(InTec)
🌐 انجمن علمی هوش مصنوعی دانشگاه صنعتی شریف برگزار می‌کند: آغاز ثبت‌نام هکاتون LLM Agents ☑️ اولین دوره‌ی هکاتون عامل‌های هوشمند مدل‌های زبانی بزرگ دانشگاه صنعتی شریف به همت انجمن علمی هوش مصنوعی و با همکاری انجمن IEEE و آزمایشگاه RIML. 👥 با آموزش اساتید…
از آشنایی با تک‌تک‌تون واقعاً خوشحال شدم.
صحبت با شما یک تجربه فوق‌العاده بود؛ صادقانه، اصلاً فکرشو نمی‌کردم این‌همه آدم بااستعداد، خلاق و خفن رو ببینم! بخصوص توی بچه‌های لیسانس.

امیدوارم این انرژی، انگیزه و ذهن‌های طلایی‌تون همیشه بدرخشه و دنیا واقعاً ازتون بهره‌مند بشه.

(هیچوقت نذارید، هیچ چیز و هیچ کس ناامیدتون کنه)

اگه توی این مدت از من کم و کاستی، بد اخلاقی یا .... دیدید، بذارید پای خستگی و کم‌خوابی، یا توی شرایطی فشار عصبی و نه هیچ چیز دیگه.

با بعضی‌هاتون ارتباطم ادامه پیدا خواهد کرد و امیدوارم به همکاری‌های خوب و طولانی برسیم 🌱🌹♥️

خفن ادامه بدید
مدل جدید Xiaomi برای vision متأسفانه این مدل توی بنچمارک‌های منتشر شده با pixtral مقایسه نشده

چیزی که بنظرم مهمترین گزینه هست؛ شرکت mistral واقعاً توی تسک‌های vision رغیب نداره درحال حاضر.
Media is too big
VIEW IN TELEGRAM
اگر خواستید LLM رو لوکال روی گوشی داشته باشید :

Github Doc

الان باید به این فقط tool اضافه کرد؛ موسیقی هم داشت اجرا می‌شد.
دستاوردهای یادگیری عمیق(InTec)
نظر شخصی من راجب الگوریتم Forward-Forward البته با دید بیزینس و کاری (نه آکادمیک) در ریپلای به پیامی توی گروه گفتم شاید بد نباشه شما هم بخونید. ---------------------------------------- این الگوریتم فعلاً فقط و فقط می‌تونه نظر آکادمی رو جلب کنه و فعلا دقیقاً…
اینو دیدم؛ یاد صحبتم توی هکاتون شریف با یکی از منتورها به اسم آرش افتادم (آرش جان سلام 😂)

بحثی داشتیم راجب Diffusion model ها برای دیتاهای متنی و فرار از Transformer ها؛ خداروشکر شرکت کننده‌ها باهوش بودند ما فرصت کردیم knowledge share داشته باشیم.

شخصاً همون ابتدا، نظرم این بود که بیزینس سراغ این موضوع نخواهد رفت درحال حاضر و اگر هم بخواد تغییری ایجاد بشه احتمالاً اول توسعه SDK برای تبدیل مدل‌های ترین شده روی Nvidia به سخت‌افزار‌های تخصصی مثل Groq خواهد بود.
آرش عزیز هم؛ با بنده هم نظر بود و البته ایشون بسیاری از مقالات این حوزه رو به خوبی خونده بود و آشنا بود.

یک تایم خیلی خیلی مفید و دوستانه‌ای رو کنار ایشون و چندتا دیگه از منتورها داشتیم و بحث جذابی که چرا راهکارهای ارائه شده یا قابل پیاده‌سازی نیست یا اینکه مسئله رو سخت‌تر می‌کنه.

خلاصه که؛ منم ترند‌ها رو دنبال می‌کنم اما تمرکزم باید روی بیزینس باشه، هرچند ترجیح میدم جلسات هفتگی و ماهانه برای این موضوعات داشته باشم.
اوضاع مدل‌های local اینطوری هست.
Gemma3, Qwen3
برای همه تسک‌ها استفاده می‌شه.

روی Qwen3 نتایج خوبی برای RAG میگیرم؛ روی Gemma3 برای Tool خیلی نتابج خوبی دارم.

سراغ devstral برای بررسی کد یا ساخت کدهای اولیه میرم (بخصوص اینکه روی ابزارهای مربوط به تسک‌های برنامه‌نویسی خروجی خوبی داره)

deepseek-r1 

نسخه جدید هست و روی سیستم شرکت نداشتم برای همین روی سیستم شخصی دانلود کردم تا ببینم نتایج چطوری هست.

نکته مهم شخصا بعضی وقتا ۲ مدل رو همزمان بالا میارم
docker ollama

هرکدوم روی یک GPU و از مدل ساده‌تر میخوام سریع کد اولیه رو بزنه و مدل پیچیده‌تر اون رو بررسی کنه و رفع اشکال انجام بده؛ یا استراکچر و استایل پروژه رو رعایت کنه.

ولی خلاصه وضعیت لوکال این هست؛ چون سوال شده بود.
دستاوردهای یادگیری عمیق(InTec)
اوضاع مدل‌های local اینطوری هست. Gemma3, Qwen3 برای همه تسک‌ها استفاده می‌شه. روی Qwen3 نتایج خوبی برای RAG میگیرم؛ روی Gemma3 برای Tool خیلی نتابج خوبی دارم. سراغ devstral برای بررسی کد یا ساخت کدهای اولیه میرم (بخصوص اینکه روی ابزارهای مربوط به تسک‌های…
Qwen3

خیلی نرم و ریز مدل embedding خودش رو هم منتشر کرد

HuggingFace

نتایج جالبی هم روی بنچمارک‌ها گرفته و پیشرفت‌های خوبی رو نشون داده.


پ.ن: توی لیدربورد multi lingual رتبه اول هست (البته مدل 8b)
قراره کلی آموزش و خبر بشنویم ازش
Please open Telegram to view this post
VIEW IN TELEGRAM
HTML Embed Code:
2025/06/29 16:41:48
Back to Top