LLM обрастает разными модальностями, одной из которых является зрение.
Эмиль Шакиров в своём докладе «Визуальные языковые модели: от разбора архитектуры до запуска» на AiConf 2024 рассказал об архитектурах визуальных LLM, о том, какие вызовы стоят перед инженерами в создании мультимодальных архитектур.
Посмотрите запись доклада, будет интересно!
Поделитесь видео с коллегами 🙌
#записидокладовAiConf
@UseDataConfChannel
>>Click here to continue<<
