π₯π₯ VideoPrism ΠΎΡ GoogleDeepMind β ΡΠ½ΠΈΠ²Π΅ΡΡΠ°Π»ΡΠ½ΡΠΉ Π²ΠΈΠ΄Π΅ΠΎΡΠ½ΠΊΠΎΠ΄Π΅Ρ Π½ΠΎΠ²ΠΎΠ³ΠΎ ΠΏΠΎΠΊΠΎΠ»Π΅Π½ΠΈΡ
ΠΠΎΠ΄Π΅Π»Ρ Π»Π΅Π³ΠΊΠΎ ΠΏΠΎΠ΄ΠΊΠ»ΡΡΠ°Π΅ΡΡΡ ΠΊ LLM ΠΈΠ»ΠΈ ΡΠ΅ΠΊΡΡΠΎΠ²ΠΎΠΌΡ ΡΠ½ΠΊΠΎΠ΄Π΅ΡΡ, ΠΏΡΠ΅Π²ΡΠ°ΡΠ°Ρ Π²ΠΈΠ΄Π΅ΠΎ Π² ΠΈΡΡΠΎΡΠ½ΠΈΠΊ ΠΊΠΎΠ½ΡΠ΅ΠΊΡΡΠ°.
π§ ΠΠ°ΠΊ ΡΠ°Π±ΠΎΡΠ°Π΅Ρ:
β’ Π‘Π½Π°ΡΠ°Π»Π° ΠΎΠ±ΡΡΠ°ΡΡ CLIP-ΠΏΠΎΠ΄ΠΎΠ±Π½ΡΡ video-text ΠΌΠΎΠ΄Π΅Π»Ρ
β’ ΠΠ°ΡΠ΅ΠΌ Π΄ΠΈΡΡΠΈΠ»Π»ΠΈΡΡΡΡ Π²ΠΈΠ΄Π΅ΠΎΡΠ½ΠΊΠΎΠ΄Π΅Ρ Π² VideoPrism
β’ ΠΠΎΠ»ΡΡΠ°Π΅ΡΡΡ ΠΊΠΎΠΌΠΏΠ°ΠΊΡΠ½ΡΠΉ, Π½ΠΎ Π³ΠΈΠ±ΠΊΠΈΠΉ Π²ΠΈΠ΄Π΅ΠΎΡΠ½ΠΊΠΎΠ΄Π΅Ρ, Π³ΠΎΡΠΎΠ²ΡΠΉ ΠΊ ΠΈΠ½ΡΠ΅Π³ΡΠ°ΡΠΈΠΈ Π² ΠΌΡΠ»ΡΡΠΈΠΌΠΎΠ΄Π°Π»ΡΠ½ΡΠ΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ
ΠΡΠ΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ Π΄ΠΎΡΡΡΠΏΠ½Ρ ΠΏΠΎΠ΄ Π»ΠΈΡΠ΅Π½Π·ΠΈΠ΅ΠΉ A2.0
Π£ΡΡΠ°Π½ΠΎΠ²ΠΊΠ°: $ git clone https://github.com/google-deepmind/videoprism.git
$ cd videoprism
$ pip install .
β’ Github: https://github.com/google-deepmind/videoprism
β’ HF: https://huggingface.co/google/videoprism#model-description
β’ Arxiv: https://arxiv.org/pdf/2402.13217
β’ Blogpost: https://research.google/blog/videoprism-a-foundational-visual-encoder-for-video-understanding/
#AI #VideoAI #DeepLearning #GoogleDeepMind #LLM #multimodal
>>Click here to continue<<