Channel: دستاوردهای یادگیری عمیق(InTec)
مدل
با ۲۴ میلیارد پارامتر روی
Ollama
حجم بسیار کم، نتایج بسیار عالی (بنچمارک) از ویژگیهای این مدل هست.
Devstral: the best open source model for coding agents
با ۲۴ میلیارد پارامتر روی
ollama
اضافه شد.Ollama
حجم بسیار کم، نتایج بسیار عالی (بنچمارک) از ویژگیهای این مدل هست.
بنظرتون شرکت apple میره سمت خرید openai ؟
چند روزی هست بحثهایی بوجود اومده
با اینکه اپل شدیداً به یک تکون بزرگ در زمینه AI نیاز داره و سهامش هم داره سقوط میکنه.
ولی فکر نمیکنم نیازی به OpenAi با اون رقم و ... داشته باشه.
شخصاً نظرم منفی هست؛ ولی خبر جالبیه این موضوع.
چند روزی هست بحثهایی بوجود اومده
با اینکه اپل شدیداً به یک تکون بزرگ در زمینه AI نیاز داره و سهامش هم داره سقوط میکنه.
ولی فکر نمیکنم نیازی به OpenAi با اون رقم و ... داشته باشه.
شخصاً نظرم منفی هست؛ ولی خبر جالبیه این موضوع.
یعنی ی گروه همکلاسی (دانشجو) پیدا نمیشه
یک لیدربرد برای
اینکه دیگه سختافزار نمیخواد
نفری ۱۰۰ تا جمله رو تگ بزنید، کار در میادا
پ.ن:
دانشگاه زمان ما سالانه حدوداً ۹۰-۱۲۰ تا ورودی مهندسی نرمافزار و
اگرم دوست داشتید اینکار رو بکنید؛ به
@abbasi_ai
پیام بدید؛ من شمارو به هم لینک کنم.
یک لیدربرد برای
embedding
فارسی بزنه ؟اینکه دیگه سختافزار نمیخواد
نفری ۱۰۰ تا جمله رو تگ بزنید، کار در میادا
پ.ن:
دانشگاه زمان ما سالانه حدوداً ۹۰-۱۲۰ تا ورودی مهندسی نرمافزار و
IT
داشت.اگرم دوست داشتید اینکار رو بکنید؛ به
@abbasi_ai
پیام بدید؛ من شمارو به هم لینک کنم.
برهیچکس پوشیده نیست که من عاشق نوشتن
برای پروژههام هستم، چیزی که نتونی تستش کنی چطوری میتونی بفهمی بهتر شده یا بدتر یا اصلا تغییری داشته یا نه ؟
با کمک
DeepEval
میتونیم همین طرز تفکر رو ببریم روی پروژههای
Test case
برای پروژههام هستم، چیزی که نتونی تستش کنی چطوری میتونی بفهمی بهتر شده یا بدتر یا اصلا تغییری داشته یا نه ؟
با کمک
DeepEval
میتونیم همین طرز تفکر رو ببریم روی پروژههای
LLM
ببینیم چی میشهGitHub
GitHub - confident-ai/deepeval: The LLM Evaluation Framework
The LLM Evaluation Framework. Contribute to confident-ai/deepeval development by creating an account on GitHub.
دستاوردهای یادگیری عمیق(InTec)
ظرفیت مجدداً باز شده؛ دیروز اطلاع دادید که امکان ثبتنام نیست (مشکل پر شدن ظرفیت بوده)
میتونید مجدداً امتحان کنید
هر سوالی داشتید :
@AI_Sharif_Support
اینم کد تخفیف ۲۰٪ برای کانال و مشکل دیروز :
میتونید مجدداً امتحان کنید
هر سوالی داشتید :
@AI_Sharif_Support
اینم کد تخفیف ۲۰٪ برای کانال و مشکل دیروز :
llm_20
بهترینهای تیم
یک افتضاح بزرگ با انتشار
علاوه بر اون؛ تصمیمات
تیم
Llama3.1, ...
اکثراً قبل از Llama4
از شرکت استعفا دادند و با Mistral
قرارداد بستند.یک افتضاح بزرگ با انتشار
Llama4
بوجود اومد؛ اصلا کسی هست ازین مدل استفاده کنه ؟علاوه بر اون؛ تصمیمات
Meta
و عدم دسترسی حتی افراد حقیقی به مدلهای شرکت و .... هم باعث این موضوع بوده.تیم
Mistral
رو اگر نمیشناسید، پیشنهاد میدم حداقل از مدلهاش برای OCR
و خوندن داکیومنت و استخراج متن استفاده کنید، بعداً ازم تشکر خواهید کرد 😉ی پایپ لاین
رفتم یک بررسی کنم، چون از کدهای خودم مطمئن بودم.
دیدم ۲ ماه هست داره کوئری و .... اشتباه میزنه و اصلا وضعیت شرکت این نیست.
هیچی دیگه؛ احتمالاً ی ضرر مالی یا زمانی اون پشت دارند.
تسک من که تموم شد، ولی اینکه خروجی
خیلی باگ هستا، خیلی
n8n
گرفتم، ۲ ماهه داره گزارشات تحلیلی به شرکت میده (همه پلنها رو شرکته بر این اساس چیده) رفتم یک بررسی کنم، چون از کدهای خودم مطمئن بودم.
دیدم ۲ ماه هست داره کوئری و .... اشتباه میزنه و اصلا وضعیت شرکت این نیست.
هیچی دیگه؛ احتمالاً ی ضرر مالی یا زمانی اون پشت دارند.
تسک من که تموم شد، ولی اینکه خروجی
AI
رو تست و بررسی نکنید.خیلی باگ هستا، خیلی
این پست رو مراجعه کنید به لینک؛ دقیق بخونید و بعد یک جا ذخیره کنید. چرا ؟ چون یک دوره ۷-۸ ساعتِ سیستم پرامپت نویسی توی این لینک هست و تازه کاملاً هم جواب میده:
Claude 4 System Prompt
و شاید کمتر از ۲۰ دقیقه خوندنش ازتون وقت بگیره.
Claude 4 System Prompt
و شاید کمتر از ۲۰ دقیقه خوندنش ازتون وقت بگیره.
Simon Willison’s Weblog
Highlights from the Claude 4 system prompt
Anthropic publish most of the system prompts for their chat models as part of their release notes. They recently shared the new prompts for both Claude Opus 4 and Claude …
شدیداً منتظر یک نسخه،
مثلاً اگر
پ.ن : یکی از دوستان اشاره کردند وزنهای این مدل روی huggingface قرار گرفته
شخصاً هنوز بررسی نکردم
open weight
برای Gemma 3n
هستم؛ این مدل ریزه میزه خوراکش چت کردن هست و tool calling
مثلاً اگر
leader board
اش رو ببینید با اختلاف خیلی کم از مدلهای درجه یک همین چندوقت قبل وایساده.پ.ن : یکی از دوستان اشاره کردند وزنهای این مدل روی huggingface قرار گرفته
شخصاً هنوز بررسی نکردم
دستاوردهای یادگیری عمیق(InTec)
از آشنایی با تکتکتون واقعاً خوشحال شدم.
صحبت با شما یک تجربه فوقالعاده بود؛ صادقانه، اصلاً فکرشو نمیکردم اینهمه آدم بااستعداد، خلاق و خفن رو ببینم! بخصوص توی بچههای لیسانس.
امیدوارم این انرژی، انگیزه و ذهنهای طلاییتون همیشه بدرخشه و دنیا واقعاً ازتون بهرهمند بشه.
(هیچوقت نذارید، هیچ چیز و هیچ کس ناامیدتون کنه)
اگه توی این مدت از من کم و کاستی، بد اخلاقی یا .... دیدید، بذارید پای خستگی و کمخوابی، یا توی شرایطی فشار عصبی و نه هیچ چیز دیگه.
با بعضیهاتون ارتباطم ادامه پیدا خواهد کرد و امیدوارم به همکاریهای خوب و طولانی برسیم 🌱🌹♥️
خفن ادامه بدید
صحبت با شما یک تجربه فوقالعاده بود؛ صادقانه، اصلاً فکرشو نمیکردم اینهمه آدم بااستعداد، خلاق و خفن رو ببینم! بخصوص توی بچههای لیسانس.
امیدوارم این انرژی، انگیزه و ذهنهای طلاییتون همیشه بدرخشه و دنیا واقعاً ازتون بهرهمند بشه.
(هیچوقت نذارید، هیچ چیز و هیچ کس ناامیدتون کنه)
اگه توی این مدت از من کم و کاستی، بد اخلاقی یا .... دیدید، بذارید پای خستگی و کمخوابی، یا توی شرایطی فشار عصبی و نه هیچ چیز دیگه.
با بعضیهاتون ارتباطم ادامه پیدا خواهد کرد و امیدوارم به همکاریهای خوب و طولانی برسیم 🌱🌹♥️
خفن ادامه بدید
دستاوردهای یادگیری عمیق(InTec)
از آشنایی با تکتکتون واقعاً خوشحال شدم. صحبت با شما یک تجربه فوقالعاده بود؛ صادقانه، اصلاً فکرشو نمیکردم اینهمه آدم بااستعداد، خلاق و خفن رو ببینم! بخصوص توی بچههای لیسانس. امیدوارم این انرژی، انگیزه و ذهنهای طلاییتون همیشه بدرخشه و دنیا واقعاً ازتون…
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
اگر خواستید LLM رو لوکال روی گوشی داشته باشید :
Github Doc
الان باید به این فقط
Github Doc
الان باید به این فقط
tool
اضافه کرد؛ موسیقی هم داشت اجرا میشد.
دستاوردهای یادگیری عمیق(InTec)
نظر شخصی من راجب الگوریتم Forward-Forward البته با دید بیزینس و کاری (نه آکادمیک) در ریپلای به پیامی توی گروه گفتم شاید بد نباشه شما هم بخونید. ---------------------------------------- این الگوریتم فعلاً فقط و فقط میتونه نظر آکادمی رو جلب کنه و فعلا دقیقاً…
اینو دیدم؛ یاد صحبتم توی هکاتون شریف با یکی از منتورها به اسم آرش افتادم (آرش جان سلام 😂)
بحثی داشتیم راجب
شخصاً همون ابتدا، نظرم این بود که بیزینس سراغ این موضوع نخواهد رفت درحال حاضر و اگر هم بخواد تغییری ایجاد بشه احتمالاً اول توسعه
آرش عزیز هم؛ با بنده هم نظر بود و البته ایشون بسیاری از مقالات این حوزه رو به خوبی خونده بود و آشنا بود.
یک تایم خیلی خیلی مفید و دوستانهای رو کنار ایشون و چندتا دیگه از منتورها داشتیم و بحث جذابی که چرا راهکارهای ارائه شده یا قابل پیادهسازی نیست یا اینکه مسئله رو سختتر میکنه.
خلاصه که؛ منم ترندها رو دنبال میکنم اما تمرکزم باید روی بیزینس باشه، هرچند ترجیح میدم جلسات هفتگی و ماهانه برای این موضوعات داشته باشم.
بحثی داشتیم راجب
Diffusion model
ها برای دیتاهای متنی و فرار از Transformer
ها؛ خداروشکر شرکت کنندهها باهوش بودند ما فرصت کردیم knowledge share
داشته باشیم.شخصاً همون ابتدا، نظرم این بود که بیزینس سراغ این موضوع نخواهد رفت درحال حاضر و اگر هم بخواد تغییری ایجاد بشه احتمالاً اول توسعه
SDK
برای تبدیل مدلهای ترین شده روی Nvidia
به سختافزارهای تخصصی مثل Groq
خواهد بود.آرش عزیز هم؛ با بنده هم نظر بود و البته ایشون بسیاری از مقالات این حوزه رو به خوبی خونده بود و آشنا بود.
یک تایم خیلی خیلی مفید و دوستانهای رو کنار ایشون و چندتا دیگه از منتورها داشتیم و بحث جذابی که چرا راهکارهای ارائه شده یا قابل پیادهسازی نیست یا اینکه مسئله رو سختتر میکنه.
خلاصه که؛ منم ترندها رو دنبال میکنم اما تمرکزم باید روی بیزینس باشه، هرچند ترجیح میدم جلسات هفتگی و ماهانه برای این موضوعات داشته باشم.
دستاوردهای یادگیری عمیق(InTec)
#کارگاه عملی هوش مصنوعی در نورورادیولوژی با استفاده از پایتون؛ اولین کارگاه عمومی بنده (ثبتنام آزاد) که تجربه متفاوت و جالبی بود در نخستین همایش ملی هوش مصنوعی در تصویربرداری پزشکی تشکر بسیار ویژه از دوستان و برگذار کنندهگان در آزمایشگاه ملی مغز بخاطر…
اینم بمونه به یادگار
از اولین دوره برگزاری LLM Agents Hackathon دانشگاه شریف.
چه رفقای خوبی پیدا کردم.
#SHARIF_LLM_AGENTS 2025
توی این عکس؛ فقط افراد و تیمهایی هستند که تا ۱۰ شب روز دوم وایسادند.
از اولین دوره برگزاری LLM Agents Hackathon دانشگاه شریف.
چه رفقای خوبی پیدا کردم.
#SHARIF_LLM_AGENTS 2025
توی این عکس؛ فقط افراد و تیمهایی هستند که تا ۱۰ شب روز دوم وایسادند.
اوضاع مدلهای
برای همه تسکها استفاده میشه.
روی
سراغ
نسخه جدید هست و روی سیستم شرکت نداشتم برای همین روی سیستم شخصی دانلود کردم تا ببینم نتایج چطوری هست.
نکته مهم شخصا بعضی وقتا ۲ مدل رو همزمان بالا میارم
هرکدوم روی یک GPU و از مدل سادهتر میخوام سریع کد اولیه رو بزنه و مدل پیچیدهتر اون رو بررسی کنه و رفع اشکال انجام بده؛ یا استراکچر و استایل پروژه رو رعایت کنه.
ولی خلاصه وضعیت لوکال این هست؛ چون سوال شده بود.
local
اینطوری هست.Gemma3, Qwen3
برای همه تسکها استفاده میشه.
روی
Qwen3
نتایج خوبی برای RAG
میگیرم؛ روی Gemma3
برای Tool
خیلی نتابج خوبی دارم.سراغ
devstral
برای بررسی کد یا ساخت کدهای اولیه میرم (بخصوص اینکه روی ابزارهای مربوط به تسکهای برنامهنویسی خروجی خوبی داره)deepseek-r1
نسخه جدید هست و روی سیستم شرکت نداشتم برای همین روی سیستم شخصی دانلود کردم تا ببینم نتایج چطوری هست.
نکته مهم شخصا بعضی وقتا ۲ مدل رو همزمان بالا میارم
docker ollama
هرکدوم روی یک GPU و از مدل سادهتر میخوام سریع کد اولیه رو بزنه و مدل پیچیدهتر اون رو بررسی کنه و رفع اشکال انجام بده؛ یا استراکچر و استایل پروژه رو رعایت کنه.
ولی خلاصه وضعیت لوکال این هست؛ چون سوال شده بود.
دستاوردهای یادگیری عمیق(InTec)
اوضاع مدلهای local اینطوری هست. Gemma3, Qwen3 برای همه تسکها استفاده میشه. روی Qwen3 نتایج خوبی برای RAG میگیرم؛ روی Gemma3 برای Tool خیلی نتابج خوبی دارم. سراغ devstral برای بررسی کد یا ساخت کدهای اولیه میرم (بخصوص اینکه روی ابزارهای مربوط به تسکهای…
Qwen3
خیلی نرم و ریز مدل
embedding
خودش رو هم منتشر کردHuggingFace
نتایج جالبی هم روی بنچمارکها گرفته و پیشرفتهای خوبی رو نشون داده.
پ.ن: توی لیدربورد
multi lingual
رتبه اول هست (البته مدل 8b) قراره کلی آموزش و خبر بشنویم ازش
Please open Telegram to view this post
VIEW IN TELEGRAM
HTML Embed Code: