Channel: PyTorch Howsam
قبلا، لرنینگ کرو رو براساس تعداد ایپاک رسم میکردیم. مثلا میگفتیم، مدل رزنت برای 30 ایپاک روی دیتاست x ترین شده و نمودار لاس به ایپاک رو رسم میکردیم. میشه گفت، شبیه این بود که یک فرد بگه من این کتاب رو 30 دور خوندم. نگاه جالبیه...
اما، الان توی بحث LLM-ها که دیتاستها خیلی بزرگه، لرنینگ کرو رو براساس تعداد توکنها رسم میکنن. مثلا، میگیم که مدل Llama روی 50 میلیارد توکن آموزش دیده. حالا ممکنه این 50 میلیارد توکن حتی یک ایپاک از دیتاست هم نباشه! ولی نگاه جالبیه که میگیم این مدل روی n تا توکن (تقریبا کلمه) آموزش دیده.
حالا، با فرض ثابت بودن سختافزار، میتونیم لرنینگ کرو رو براساس مدت زمان آموزش رسم کنیم. مثلا بگیم که این مدل 30 ساعت آموزش دیده. نگاه قشنگی هست. انگار که بگیم 30 ساعت درس خوندم. یا مثلا، مدلی که 90 روز درس خونده. :)
توی نمودار بالا، لرنینگ کرو دو اجرا رو براساس تعداد توکن (محور افقی پایین) و مدت زمان (محور افقی بالا) نشون دادم.
اما، الان توی بحث LLM-ها که دیتاستها خیلی بزرگه، لرنینگ کرو رو براساس تعداد توکنها رسم میکنن. مثلا، میگیم که مدل Llama روی 50 میلیارد توکن آموزش دیده. حالا ممکنه این 50 میلیارد توکن حتی یک ایپاک از دیتاست هم نباشه! ولی نگاه جالبیه که میگیم این مدل روی n تا توکن (تقریبا کلمه) آموزش دیده.
حالا، با فرض ثابت بودن سختافزار، میتونیم لرنینگ کرو رو براساس مدت زمان آموزش رسم کنیم. مثلا بگیم که این مدل 30 ساعت آموزش دیده. نگاه قشنگی هست. انگار که بگیم 30 ساعت درس خوندم. یا مثلا، مدلی که 90 روز درس خونده. :)
توی نمودار بالا، لرنینگ کرو دو اجرا رو براساس تعداد توکن (محور افقی پایین) و مدت زمان (محور افقی بالا) نشون دادم.
یکی از مثالها و پروژههای پرتکرار توی آموزشهای هوش مصنوعی، طبقهبندی کامنتها به مثبت و منفی بود. اینکه نظر کاربر نسبت به اون محصول/خدمات مثبت بوده یا منفی...
اما، پروژههای متنوعی مبتنیبر همین کامنتهای ساده میتونه شکل بگیره؛ مثلا، دیجیکالا از کامنتها استفادههای جالبی میبره. توی تصویر پایین، دو کاربرد هوش مصنوعی در کامنتها رو مشاهده میکنید.
کادر قرمز رنگ، کامنتها رو فیلتر یا طبقهبندی میکنه. یعنی، کامنتها براساس موضوعاتی مثل اصالت، کیفیت و سایر موارد طبقهبندی شدن و شما میتونید اون دسته از کامنتها که دغدغه شما هست رو مطالعه کنید.
کادر آبی رنگ، کار خلاصهسازی کامنتها رو انجام داده. مزایا و معایبشون رو گفته و واقعا مفیده.
همه اینها برپایه فقط کامنتها انجام شده بود. به نظر شما از کامنتهای دیجیکالا چه استفادهای میشه برد؟ طبیعتا، کاربرهای همیشگی دیجیکالا ممکنه پیشنهادهای جالبی داشته باشن. مهم هست که برای وارد کردن هوش مصنوعی به یک محیطی، خود اون محیط رو به خوبی بشناسیم. نه اینکه، یک GPT یا ResNet دستمون بگیریم و بچرخیم اینور اونور که براش پروژه پیدا کنیم.
اما، پروژههای متنوعی مبتنیبر همین کامنتهای ساده میتونه شکل بگیره؛ مثلا، دیجیکالا از کامنتها استفادههای جالبی میبره. توی تصویر پایین، دو کاربرد هوش مصنوعی در کامنتها رو مشاهده میکنید.
کادر قرمز رنگ، کامنتها رو فیلتر یا طبقهبندی میکنه. یعنی، کامنتها براساس موضوعاتی مثل اصالت، کیفیت و سایر موارد طبقهبندی شدن و شما میتونید اون دسته از کامنتها که دغدغه شما هست رو مطالعه کنید.
کادر آبی رنگ، کار خلاصهسازی کامنتها رو انجام داده. مزایا و معایبشون رو گفته و واقعا مفیده.
همه اینها برپایه فقط کامنتها انجام شده بود. به نظر شما از کامنتهای دیجیکالا چه استفادهای میشه برد؟ طبیعتا، کاربرهای همیشگی دیجیکالا ممکنه پیشنهادهای جالبی داشته باشن. مهم هست که برای وارد کردن هوش مصنوعی به یک محیطی، خود اون محیط رو به خوبی بشناسیم. نه اینکه، یک GPT یا ResNet دستمون بگیریم و بچرخیم اینور اونور که براش پروژه پیدا کنیم.
Students get Gemini Pro and more for free through finals 2026
https://one.google.com/join/ai-student
کانفیگ پیشنهادی آمریکا : (V2ray)
https://one.google.com/join/ai-student
کانفیگ پیشنهادی آمریکا : (V2ray)
trojan://[email protected]:2083?security=tls&sni=usa-vp-111.mETIkaPPs.cOm&type=ws&host=usa-vp-111.mETIkaPPs.cOm&path=%2Flinkvws#%40meli_prozyy
به میزبانی مرکز نوآوری شروع، سهشنبه هفته پیشرو با موضوع LLM-ها در هاگینگفیس در خدمت دوستان علاقهمند هستم.
سطح مباحث مقدماتی هست و برای کسانی مناسب هست که با LLM-ها و هاگینگفیس آشنایی ندارن.
دوستان در مجموعه شروع گفتن که سایت ایوند از دیروز دچار اختلال هست و دوستان زیادی موفق به ثبت نام نشدن. چنانچه، در ثبتنام مشکل داشتید، به آیدی زیر پیام بدید. به پشتیبانی هوسم پیام ندید، چون هوسم برگزارکننده وبینار نیست.
@ShorouGuilan
لینک ثبتنام
سطح مباحث مقدماتی هست و برای کسانی مناسب هست که با LLM-ها و هاگینگفیس آشنایی ندارن.
دوستان در مجموعه شروع گفتن که سایت ایوند از دیروز دچار اختلال هست و دوستان زیادی موفق به ثبت نام نشدن. چنانچه، در ثبتنام مشکل داشتید، به آیدی زیر پیام بدید. به پشتیبانی هوسم پیام ندید، چون هوسم برگزارکننده وبینار نیست.
@ShorouGuilan
لینک ثبتنام
This media is not supported in your browser
VIEW IN TELEGRAM
سلام دوستان اکادمی هوسم هم! 🤣
با تشکر از مهدی
با تشکر از مهدی
Void Editor 🔥
Void is an open source Cursor alternative. Write code with the best AI tools, use any model, and retain full control over your data.
Backed by Y-Combinator ❤️
Void is an open source Cursor alternative. Write code with the best AI tools, use any model, and retain full control over your data.
Backed by Y-Combinator ❤️
Audio
ویدئوی معرفی کگل در یوتوب هوسم رو به Notebook LM دادم و یک پادکست 7 دقیقهای ازش ساخت. به نظرم، با وجود یکسری اشتباهات تلفظ، مفید هست و ارزش گوش کردن رو داره. 😊
چند ماه پیش، این ویدئو رو منتشر کردیم. بازخورد خوبی گرفت. لینک ویدئو
چند ماه پیش، این ویدئو رو منتشر کردیم. بازخورد خوبی گرفت. لینک ویدئو
مسابقه Detect Behavior with Sensor Data بهتازگی در کگل معرفی شده. این مسابقه 3 ماه زمان داره و تازه 5 روزه که ازش گذشته. حجم داده هم زیاد نیست و زیر 1 گیگ هست. باتوجه به اینکه تعطیلی تابستون رو در پیش داریم، فرصت خوبی هست که برای این مسابقه وقت بذارید. ما هم در هوسم برنامههایی داریم و کار روی این مسابقه رو شروع کردیم.
من عمدا درمورد موضوع مسابقه صحبت نکردم. برای اینکه، حتی برای درک موضوع هم وقت بذارید و از صفر شروع کنید.
پیشنهاد میکنم، به کدهای موجود در مسابقه نگاه نکنید. سعی کنید، گامهای اول رو خودتون جلو برید. برای اینکه ذهنتون انقدر وابسته به کدهای آماده نشه. بعد اینکه، کمی جلو رفتید، به کدهای دیگران هم نگاه بندازید.
لینک مسابقه
من عمدا درمورد موضوع مسابقه صحبت نکردم. برای اینکه، حتی برای درک موضوع هم وقت بذارید و از صفر شروع کنید.
پیشنهاد میکنم، به کدهای موجود در مسابقه نگاه نکنید. سعی کنید، گامهای اول رو خودتون جلو برید. برای اینکه ذهنتون انقدر وابسته به کدهای آماده نشه. بعد اینکه، کمی جلو رفتید، به کدهای دیگران هم نگاه بندازید.
لینک مسابقه
Kaggle
CMI - Detect Behavior with Sensor Data
Predicting Body Focused Repetitive Behaviors from a Wrist-Worn Device
Audio
آقای Ilya Sutskever برای دریافت مدرک افتخاری از دانشگاه تورنتو در روز ۹ ژوئن ۲۰۲۵ یک سخنرانی درباره هوش مصنوعی داشته. پادکست فارسی این سخنرانی رو میتونید گوش بدید. خودم هم گوش دادم.
این دومین پادکستی هست که با هوش مصنوعی میذارم. هدفم این نیست که صرفا یک محتوایی توی این کانال بذارم و بگم تولید محتوا کردم. هدفم این هست که از ابزارهای خوب هوش مصنوعی برای بهتر شدن استفاده کنم. منِ تولیدکننده محتوا با هوش مصنوعی میتونم محتوای متنوعتر و باکیفیتتری رو در زمان کمتری آماده کنم. میدونم بی اشتباه نیست، ولی نکته مهم اینه که قابل استفاده هست. اتفاقا آقای ایلیا توی همین سخنرانی به این مساله اشاره میکنه. فرصتها برای بهتر شدن با هوش مصنوعی بسیار زیاد شده.
ویدئوی اصلی
این دومین پادکستی هست که با هوش مصنوعی میذارم. هدفم این نیست که صرفا یک محتوایی توی این کانال بذارم و بگم تولید محتوا کردم. هدفم این هست که از ابزارهای خوب هوش مصنوعی برای بهتر شدن استفاده کنم. منِ تولیدکننده محتوا با هوش مصنوعی میتونم محتوای متنوعتر و باکیفیتتری رو در زمان کمتری آماده کنم. میدونم بی اشتباه نیست، ولی نکته مهم اینه که قابل استفاده هست. اتفاقا آقای ایلیا توی همین سخنرانی به این مساله اشاره میکنه. فرصتها برای بهتر شدن با هوش مصنوعی بسیار زیاد شده.
ویدئوی اصلی
Audio
شرکت Etched با توسعه نخستین چیپ ASIC مخصوص معماری «ترنسفورمر» توانسته سریعترین سختافزار جهان را برای اجرای این نوع مدلها بسازد.
این چیپ که «Sohu» نام دارد، با هدف اجرای مدلهایی مثل LLaMA 70B طراحی شده و ادعا میشود که قادر است با نرخ بیش از ۵۰۰٬۰۰۰ توکن بر ثانیه عمل کند، سرعتی که به گفته آنها بسیار فراتر از توان B200 یا H100 انویدیا است! 🤯
منابع: 1 | 2
این چیپ که «Sohu» نام دارد، با هدف اجرای مدلهایی مثل LLaMA 70B طراحی شده و ادعا میشود که قادر است با نرخ بیش از ۵۰۰٬۰۰۰ توکن بر ثانیه عمل کند، سرعتی که به گفته آنها بسیار فراتر از توان B200 یا H100 انویدیا است! 🤯
منابع: 1 | 2
HTML Embed Code: