Warning: mkdir(): No space left on device in /var/www/hottg/post.php on line 59

Warning: file_put_contents(aCache/aDaily/2025-07-22/post/opendatascience/-2300-2301-2300-): Failed to open stream: No such file or directory in /var/www/hottg/post.php on line 72
🌟 Continuous Thought Machines: Π½Π΅ΠΉΡ€ΠΎΡΠ΅Ρ‚ΡŒ @Data Science by ODS.ai 🦜
TG Telegram Group & Channel
Data Science by ODS.ai 🦜 | United States America (US)
Create: Update:

🌟 Continuous Thought Machines: Π½Π΅ΠΉΡ€ΠΎΡΠ΅Ρ‚ΡŒ, которая способна Π΄ΡƒΠΌΠ°Ρ‚ΡŒ ΠΊΠ°ΠΊ ΠΌΠΎΠ·Π³ Ρ‡Π΅Π»ΠΎΠ²Π΅ΠΊΠ°.

Continuous Thought Machine (CTM) - ΠΊΠΎΠ½Ρ†Π΅ΠΏΡ‚ΡƒΠ°Π»ΡŒΠ½Π°Ρ Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Π° ΠΎΡ‚ SakanaAI, вдохновлСнная биологичСскими процСссами ΠΌΠΎΠ·Π³Π° Ρ‡Π΅Π»ΠΎΠ²Π΅ΠΊΠ°. ВмСсто ΠΌΠ°ΡΡˆΡ‚Π°Π±ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΡ Β«Π² ΡˆΠΈΡ€ΠΈΠ½ΡƒΒ» ΠΊΠΎΠ½Ρ†Π΅ΠΏΡ‚ ΠΏΡ€Π΅Π΄Π»Π°Π³Π°Π΅Ρ‚ Β«Π³Π»ΡƒΠ±ΠΈΠ½ΡƒΒ» ΠΌΡ‹ΡˆΠ»Π΅Π½ΠΈΡ, учитывая Π²Ρ€Π΅ΠΌΠ΅Π½Π½ΡƒΡŽ Π΄ΠΈΠ½Π°ΠΌΠΈΠΊΡƒ ΠΈ имитируя СстСствСнныС Π½Π΅ΠΉΡ€ΠΎΠ½Π½Ρ‹Π΅ взаимодСйствия.

БиологичСская аналогия Π² CTM Π½Π΅ случайна. Π’ΠΎΠ»Π½Ρ‹ активности Π² CTM Π½Π°ΠΏΠΎΠΌΠΈΠ½Π°ΡŽΡ‚ процСссы Π² ΠΊΠΎΡ€Π΅ ΠΌΠΎΠ·Π³Π°, Π³Π΄Π΅ синхронизация Π½Π΅ΠΉΡ€ΠΎΠ½ΠΎΠ² ΠΈΠ³Ρ€Π°Π΅Ρ‚ ΠΊΠ»ΡŽΡ‡Π΅Π²ΡƒΡŽ Ρ€ΠΎΠ»ΡŒ Π² ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠ΅ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ. Π­Ρ‚ΠΎ Π½Π΅ точная имитация ΠΏΡ€ΠΈΡ€ΠΎΠ΄Ρ‹, Π½ΠΎ шаг ΠΊ систСмам, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Ρ€Π΅ΡˆΠ°ΡŽΡ‚ Π·Π°Π΄Π°Ρ‡ΠΈ Ρ‡Π΅Ρ€Π΅Π· Π²Π½ΡƒΡ‚Ρ€Π΅Π½Π½ΠΈΠ΅ динамичСскиС состояния, Π° Π½Π΅ Ρ‡Π΅Ρ€Π΅Π· гигантскиС ΠΎΠ±ΡŠΠ΅ΠΌΡ‹ Π΄Π°Π½Π½Ρ‹Ρ….

Π―Π΄Ρ€ΠΎ CTM - это 2 ΠΊΠ»ΡŽΡ‡Π΅Π²Ρ‹Ρ… ΠΌΠ΅Ρ…Π°Π½ΠΈΠ·ΠΌΠ°. Π’ΠΎ-ΠΏΠ΅Ρ€Π²Ρ‹Ρ…, ΠΊΠ°ΠΆΠ΄Ρ‹ΠΉ "Π½Π΅ΠΉΡ€ΠΎΠ½" здСсь ΠΈΠΌΠ΅Π΅Ρ‚ собствСнныС ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹ для Π°Π½Π°Π»ΠΈΠ·Π° истории входящих сигналов. Π­Ρ‚ΠΎ ΠΏΠΎΡ…ΠΎΠΆΠ΅ Π½Π° Ρ‚ΠΎ, ΠΊΠ°ΠΊ биологичСскиС Π½Π΅ΠΉΡ€ΠΎΠ½Ρ‹ Π°Π΄Π°ΠΏΡ‚ΠΈΡ€ΡƒΡŽΡ‚ΡΡ ΠΊ контСксту, запоминая ΠΏΡ€Π΅Π΄Ρ‹Π΄ΡƒΡ‰ΠΈΠ΅ ΠΈΠΌΠΏΡƒΠ»ΡŒΡΡ‹.

Π’ΠΎ-Π²Ρ‚ΠΎΡ€Ρ‹Ρ…, Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Π° ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ ΡΠΈΠ½Ρ…Ρ€ΠΎΠ½ΠΈΠ·Π°Ρ†ΠΈΡŽ активности Π½Π΅ΠΉΡ€ΠΎΠ½ΠΎΠ² ΠΊΠ°ΠΊ основу для принятия Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ. ΠŸΡ€Π΅Π΄ΡΡ‚Π°Π²ΡŒΡ‚Π΅, Ρ‡Ρ‚ΠΎ Π½Π΅ΠΉΡ€ΠΎΠ½Ρ‹ Β«Π΄ΠΎΠ³ΠΎΠ²Π°Ρ€ΠΈΠ²Π°ΡŽΡ‚ΡΡΒ» ΠΌΠ΅ΠΆΠ΄Ρƒ собой Ρ‡Π΅Ρ€Π΅Π· Π²Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Π΅ ΠΏΠ°Ρ‚Ρ‚Π΅Ρ€Π½Ρ‹ активности β€” ΠΈΠΌΠ΅Π½Π½ΠΎ это ΠΈ становится языком, Π½Π° ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΌ CTM ΠΈΠ½Ρ‚Π΅Ρ€ΠΏΡ€Π΅Ρ‚ΠΈΡ€ΡƒΠ΅Ρ‚ Π΄Π°Π½Π½Ρ‹Π΅.

πŸŸ ΠœΠ°Ρ‚Π΅ΠΌΠ°Ρ‚ΠΈΡ‡Π΅ΡΠΊΠ°Ρ основа CTM

CTM строится Π½Π° Ρ€Π΅ΠΊΡƒΡ€Ρ€Π΅Π½Ρ‚Π½ΠΎΠΉ ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠ΅ Π²Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Ρ… ΠΏΠ°Ρ‚Ρ‚Π΅Ρ€Π½ΠΎΠ². ΠšΠ°ΠΆΠ΄Ρ‹ΠΉ Π½Π΅ΠΉΡ€ΠΎΠ½ обновляСт своС состояниС Ρ‡Π΅Ρ€Π΅Π· ΠΏΠ΅Ρ€ΡΠΎΠ½Π°Π»ΡŒΠ½ΡƒΡŽ MLP​​, которая Π°Π½Π°Π»ΠΈΠ·ΠΈΡ€ΡƒΠ΅Ρ‚ ΠΈΡΡ‚ΠΎΡ€ΠΈΡŽ ΠΏΡ€Π΅-Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΉ β€” Π²Ρ‹Ρ…ΠΎΠ΄ΠΎΠ² «синаптичСской» модСли​​, ΠΎΠ±ΡŠΠ΅Π΄ΠΈΠ½ΡΡŽΡ‰Π΅ΠΉ ΠΏΡ€Π΅Π΄Ρ‹Π΄ΡƒΡ‰ΠΈΠ΅ состояния ΠΈ Π΄Π°Π½Π½Ρ‹Π΅ Ρ‡Π΅Ρ€Π΅Π· Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅.

Бинхронизация вычисляСтся ΠΊΠ°ΠΊ взвСшСнноС скалярноС ΠΏΡ€ΠΎΠΈΠ·Π²Π΅Π΄Π΅Π½ΠΈΠ΅ пост-Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΉ с ΡΠΊΡΠΏΠΎΠ½Π΅Π½Ρ†ΠΈΠ°Π»ΡŒΠ½Ρ‹ΠΌ затуханиСм​​, Π³Π΄Π΅ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ "забывания ΠΏΡ€ΠΎΡˆΠ»Ρ‹Ρ… взаимодСйствий"​обучаСтся, контролируя Π²ΠΊΠ»Π°Π΄ Π²Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Ρ… шагов.

Π’Ρ‹Ρ…ΠΎΠ΄Ρ‹ ΠΌΠΎΠ΄Π΅Π»ΠΈ Ρ„ΠΎΡ€ΠΌΠΈΡ€ΡƒΡŽΡ‚ΡΡ ΠΏΡ€ΠΎΠ΅ΠΊΡ†ΠΈΠ΅ΠΉ синхронизации, Π° Π°Π΄Π°ΠΏΡ‚ΠΈΠ²Π½ΠΎΡΡ‚ΡŒ достигаСтся динамичСским Π²Ρ‹Π±ΠΎΡ€ΠΎΠΌ критичСских Ρ‚ΠΈΠΊΠΎΠ² Ρ‡Π΅Ρ€Π΅Π· ΠΌΠΈΠ½ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΡŽ ΠΏΠΎΡ‚Π΅Ρ€ΡŒ ΠΈ ΠΌΠ°ΠΊΡΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΡŽ увСрСнности.


ЭкспСримСнты ΠΏΠΎΠΊΠ°Π·Π°Π»ΠΈ, Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠΉ ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ Π½Π΅ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Π² Ρ‚Π΅ΠΎΡ€ΠΈΠΈ. На ImageNet-1K CTM дСмонстрируСт Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ 72.47% (top-1), Π° Π΅Π΅ Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅ ΠΏΠ»Π°Π²Π½ΠΎ пСрСмСщаСтся ΠΏΠΎ ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΡŽ, Ρ„ΠΎΠΊΡƒΡΠΈΡ€ΡƒΡΡΡŒ Π½Π° ΠΊΠ»ΡŽΡ‡Π΅Π²Ρ‹Ρ… дСталях, Ρ‚Π°ΠΊΠΆΠ΅, ΠΊΠ°ΠΊ Ρ‡Π΅Π»ΠΎΠ²Π΅ΠΊ рассматриваСт ΠΎΠ±ΡŠΠ΅ΠΊΡ‚.

Π‘Π°ΠΌΡ‹ΠΉ интСрСсный экспСримСнт - Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅ Π»Π°Π±ΠΈΡ€ΠΈΠ½Ρ‚ΠΎΠ². Π‘Π΅Π· ΠΏΠΎΠ·ΠΈΡ†ΠΈΠΎΠ½Π½Ρ‹Ρ… эмбСдингов модСль строит Π²Π½ΡƒΡ‚Ρ€Π΅Π½Π½ΡŽΡŽ Β«ΠΊΠ°Ρ€Ρ‚ΡƒΒ», анализируя структуру шаг Π·Π° шагом, ΠΈ Π΄Π°ΠΆΠ΅ ΠΎΠ±ΠΎΠ±Ρ‰Π°Π΅Ρ‚ знания Π½Π° Π»Π°Π±ΠΈΡ€ΠΈΠ½Ρ‚Ρ‹ большСго Ρ€Π°Π·ΠΌΠ΅Ρ€Π°. Π­Ρ‚ΠΎ косвСнно Π΄ΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚, Ρ‡Ρ‚ΠΎ CTM способна ΠΊ ΠΏΠ»Π°Π½ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΡŽ, Π° Π½Π΅ просто запоминанию ΠΏΠ°Ρ‚Ρ‚Π΅Ρ€Π½ΠΎΠ².

CTM ΡƒΠΌΠ΅Π΅Ρ‚ ΡΠΊΠΎΠ½ΠΎΠΌΠΈΡ‚ΡŒ рСсурсы: для простых Π·Π°Π΄Π°Ρ‡ (классификации ΠΎΡ‡Π΅Π²ΠΈΠ΄Π½Ρ‹Ρ… ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ) ΠΎΠ½Π° останавливаСт вычислСния Ρ€Π°Π½ΡŒΡˆΠ΅, Π° для слоТных β€” Β«Π΄ΡƒΠΌΠ°Π΅Ρ‚Β» дольшС. Π­Ρ‚ΠΎ происходит Π±Π΅Π· явных инструкций.

Π’ качСствС ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π°: Π² Π·Π°Π΄Π°Ρ‡Π΅ сортировки чисСл модСль Ρ‚Ρ€Π°Ρ‚ΠΈΡ‚ большС «мыслСнных шагов» Π½Π° слоТныС пСрСстановки, Π° Π² вычислСнии чСтности ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ обучаСтся стратСгиям, Π½Π°ΠΏΠΎΠΌΠΈΠ½Π°ΡŽΡ‰ΠΈΠΌ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΈΡ‡Π΅ΡΠΊΡƒΡŽ Π»ΠΎΠ³ΠΈΠΊΡƒ.

Пока CTM Π½Π΅ SOTA, Π½ΠΎ ΠΎΠ½Π° ΠΎΡ‚ΠΊΡ€Ρ‹Π²Π°Π΅Ρ‚ возмоТности примСнСния Π² RL-срСдах (ΠΊΠ°ΠΊ ΠΊΠΎΠ½ΠΊΡƒΡ€Π΅Π½Ρ‚ LSTM), Π° Π² ΠΊΠ°Π»ΠΈΠ±Ρ€ΠΎΠ²ΠΊΠ΅ прСдсказаний Π΄Π°ΠΆΠ΅ прСвосходит Ρ‡Π΅Π»ΠΎΠ²Π΅Ρ‡Π΅ΡΠΊΡƒΡŽ Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ Π½Π° CIFAR-10. АрхитСктура Π½Π΅ привязана ΠΊ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½ΠΎΠΌΡƒ Ρ‚ΠΈΠΏΡƒ Π΄Π°Π½Π½Ρ‹Ρ…, ΠΎΠ½Π° Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ с изобраТСниями, ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡΠΌΠΈ ΠΈ тСкстом (хотя Π½Π° NLP Π΅Π΅ ΠΌΠ°ΡΡˆΡ‚Π°Π±Π½ΠΎ Π½Π΅ тСстировали).

Π’ ΠΎΡ‚ΠΊΡ€Ρ‹Ρ‚ΠΎΠΌ доступС Π½Π° Github ΠΎΠΏΡƒΠ±Π»ΠΈΠΊΠΎΠ²Π°Π½ ΠΊΠΎΠ΄ практичСской дСмонстрации CTM Π² Π·Π°Π΄Π°Ρ‡Π°Ρ… классификации ImageNet, Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ Π΄Π²ΡƒΠΌΠ΅Ρ€Π½Ρ‹Ρ… Π»Π°Π±ΠΈΡ€ΠΈΠ½Ρ‚ΠΎΠ², сортировку, вычислСния чСтности, QA ΠΈ Π·Π°Π΄Π°Ρ‡ΠΈ RL. ДатасСты ΠΈ тСстовыС ΠΌΠΎΠ΄Π΅Π»ΠΈ доступны ΠΏΠΎ запросу Ρ‡Π΅Ρ€Π΅Π· Ρ„ΠΎΡ€ΠΌΡƒ Google Drive.


πŸŸ‘Π‘Ρ‚Π°Ρ‚ΡŒΡ
🟑Arxiv
🟑Demo
πŸ–₯GitHub


@ai_machinelearning_big_data

#AI #ML #CTM #SakanaAI

Forwarded from Machinelearning
🌟 Continuous Thought Machines: Π½Π΅ΠΉΡ€ΠΎΡΠ΅Ρ‚ΡŒ, которая способна Π΄ΡƒΠΌΠ°Ρ‚ΡŒ ΠΊΠ°ΠΊ ΠΌΠΎΠ·Π³ Ρ‡Π΅Π»ΠΎΠ²Π΅ΠΊΠ°.

Continuous Thought Machine (CTM) - ΠΊΠΎΠ½Ρ†Π΅ΠΏΡ‚ΡƒΠ°Π»ΡŒΠ½Π°Ρ Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Π° ΠΎΡ‚ SakanaAI, вдохновлСнная биологичСскими процСссами ΠΌΠΎΠ·Π³Π° Ρ‡Π΅Π»ΠΎΠ²Π΅ΠΊΠ°. ВмСсто ΠΌΠ°ΡΡˆΡ‚Π°Π±ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΡ Β«Π² ΡˆΠΈΡ€ΠΈΠ½ΡƒΒ» ΠΊΠΎΠ½Ρ†Π΅ΠΏΡ‚ ΠΏΡ€Π΅Π΄Π»Π°Π³Π°Π΅Ρ‚ Β«Π³Π»ΡƒΠ±ΠΈΠ½ΡƒΒ» ΠΌΡ‹ΡˆΠ»Π΅Π½ΠΈΡ, учитывая Π²Ρ€Π΅ΠΌΠ΅Π½Π½ΡƒΡŽ Π΄ΠΈΠ½Π°ΠΌΠΈΠΊΡƒ ΠΈ имитируя СстСствСнныС Π½Π΅ΠΉΡ€ΠΎΠ½Π½Ρ‹Π΅ взаимодСйствия.

БиологичСская аналогия Π² CTM Π½Π΅ случайна. Π’ΠΎΠ»Π½Ρ‹ активности Π² CTM Π½Π°ΠΏΠΎΠΌΠΈΠ½Π°ΡŽΡ‚ процСссы Π² ΠΊΠΎΡ€Π΅ ΠΌΠΎΠ·Π³Π°, Π³Π΄Π΅ синхронизация Π½Π΅ΠΉΡ€ΠΎΠ½ΠΎΠ² ΠΈΠ³Ρ€Π°Π΅Ρ‚ ΠΊΠ»ΡŽΡ‡Π΅Π²ΡƒΡŽ Ρ€ΠΎΠ»ΡŒ Π² ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠ΅ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ. Π­Ρ‚ΠΎ Π½Π΅ точная имитация ΠΏΡ€ΠΈΡ€ΠΎΠ΄Ρ‹, Π½ΠΎ шаг ΠΊ систСмам, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Ρ€Π΅ΡˆΠ°ΡŽΡ‚ Π·Π°Π΄Π°Ρ‡ΠΈ Ρ‡Π΅Ρ€Π΅Π· Π²Π½ΡƒΡ‚Ρ€Π΅Π½Π½ΠΈΠ΅ динамичСскиС состояния, Π° Π½Π΅ Ρ‡Π΅Ρ€Π΅Π· гигантскиС ΠΎΠ±ΡŠΠ΅ΠΌΡ‹ Π΄Π°Π½Π½Ρ‹Ρ….

Π―Π΄Ρ€ΠΎ CTM - это 2 ΠΊΠ»ΡŽΡ‡Π΅Π²Ρ‹Ρ… ΠΌΠ΅Ρ…Π°Π½ΠΈΠ·ΠΌΠ°. Π’ΠΎ-ΠΏΠ΅Ρ€Π²Ρ‹Ρ…, ΠΊΠ°ΠΆΠ΄Ρ‹ΠΉ "Π½Π΅ΠΉΡ€ΠΎΠ½" здСсь ΠΈΠΌΠ΅Π΅Ρ‚ собствСнныС ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹ для Π°Π½Π°Π»ΠΈΠ·Π° истории входящих сигналов. Π­Ρ‚ΠΎ ΠΏΠΎΡ…ΠΎΠΆΠ΅ Π½Π° Ρ‚ΠΎ, ΠΊΠ°ΠΊ биологичСскиС Π½Π΅ΠΉΡ€ΠΎΠ½Ρ‹ Π°Π΄Π°ΠΏΡ‚ΠΈΡ€ΡƒΡŽΡ‚ΡΡ ΠΊ контСксту, запоминая ΠΏΡ€Π΅Π΄Ρ‹Π΄ΡƒΡ‰ΠΈΠ΅ ΠΈΠΌΠΏΡƒΠ»ΡŒΡΡ‹.

Π’ΠΎ-Π²Ρ‚ΠΎΡ€Ρ‹Ρ…, Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Π° ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ ΡΠΈΠ½Ρ…Ρ€ΠΎΠ½ΠΈΠ·Π°Ρ†ΠΈΡŽ активности Π½Π΅ΠΉΡ€ΠΎΠ½ΠΎΠ² ΠΊΠ°ΠΊ основу для принятия Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ. ΠŸΡ€Π΅Π΄ΡΡ‚Π°Π²ΡŒΡ‚Π΅, Ρ‡Ρ‚ΠΎ Π½Π΅ΠΉΡ€ΠΎΠ½Ρ‹ Β«Π΄ΠΎΠ³ΠΎΠ²Π°Ρ€ΠΈΠ²Π°ΡŽΡ‚ΡΡΒ» ΠΌΠ΅ΠΆΠ΄Ρƒ собой Ρ‡Π΅Ρ€Π΅Π· Π²Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Π΅ ΠΏΠ°Ρ‚Ρ‚Π΅Ρ€Π½Ρ‹ активности β€” ΠΈΠΌΠ΅Π½Π½ΠΎ это ΠΈ становится языком, Π½Π° ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΌ CTM ΠΈΠ½Ρ‚Π΅Ρ€ΠΏΡ€Π΅Ρ‚ΠΈΡ€ΡƒΠ΅Ρ‚ Π΄Π°Π½Π½Ρ‹Π΅.

πŸŸ ΠœΠ°Ρ‚Π΅ΠΌΠ°Ρ‚ΠΈΡ‡Π΅ΡΠΊΠ°Ρ основа CTM

CTM строится Π½Π° Ρ€Π΅ΠΊΡƒΡ€Ρ€Π΅Π½Ρ‚Π½ΠΎΠΉ ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠ΅ Π²Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Ρ… ΠΏΠ°Ρ‚Ρ‚Π΅Ρ€Π½ΠΎΠ². ΠšΠ°ΠΆΠ΄Ρ‹ΠΉ Π½Π΅ΠΉΡ€ΠΎΠ½ обновляСт своС состояниС Ρ‡Π΅Ρ€Π΅Π· ΠΏΠ΅Ρ€ΡΠΎΠ½Π°Π»ΡŒΠ½ΡƒΡŽ MLP​​, которая Π°Π½Π°Π»ΠΈΠ·ΠΈΡ€ΡƒΠ΅Ρ‚ ΠΈΡΡ‚ΠΎΡ€ΠΈΡŽ ΠΏΡ€Π΅-Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΉ β€” Π²Ρ‹Ρ…ΠΎΠ΄ΠΎΠ² «синаптичСской» модСли​​, ΠΎΠ±ΡŠΠ΅Π΄ΠΈΠ½ΡΡŽΡ‰Π΅ΠΉ ΠΏΡ€Π΅Π΄Ρ‹Π΄ΡƒΡ‰ΠΈΠ΅ состояния ΠΈ Π΄Π°Π½Π½Ρ‹Π΅ Ρ‡Π΅Ρ€Π΅Π· Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅.

Бинхронизация вычисляСтся ΠΊΠ°ΠΊ взвСшСнноС скалярноС ΠΏΡ€ΠΎΠΈΠ·Π²Π΅Π΄Π΅Π½ΠΈΠ΅ пост-Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΉ с ΡΠΊΡΠΏΠΎΠ½Π΅Π½Ρ†ΠΈΠ°Π»ΡŒΠ½Ρ‹ΠΌ затуханиСм​​, Π³Π΄Π΅ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ "забывания ΠΏΡ€ΠΎΡˆΠ»Ρ‹Ρ… взаимодСйствий"​обучаСтся, контролируя Π²ΠΊΠ»Π°Π΄ Π²Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Ρ… шагов.

Π’Ρ‹Ρ…ΠΎΠ΄Ρ‹ ΠΌΠΎΠ΄Π΅Π»ΠΈ Ρ„ΠΎΡ€ΠΌΠΈΡ€ΡƒΡŽΡ‚ΡΡ ΠΏΡ€ΠΎΠ΅ΠΊΡ†ΠΈΠ΅ΠΉ синхронизации, Π° Π°Π΄Π°ΠΏΡ‚ΠΈΠ²Π½ΠΎΡΡ‚ΡŒ достигаСтся динамичСским Π²Ρ‹Π±ΠΎΡ€ΠΎΠΌ критичСских Ρ‚ΠΈΠΊΠΎΠ² Ρ‡Π΅Ρ€Π΅Π· ΠΌΠΈΠ½ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΡŽ ΠΏΠΎΡ‚Π΅Ρ€ΡŒ ΠΈ ΠΌΠ°ΠΊΡΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΡŽ увСрСнности.


ЭкспСримСнты ΠΏΠΎΠΊΠ°Π·Π°Π»ΠΈ, Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠΉ ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ Π½Π΅ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Π² Ρ‚Π΅ΠΎΡ€ΠΈΠΈ. На ImageNet-1K CTM дСмонстрируСт Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ 72.47% (top-1), Π° Π΅Π΅ Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅ ΠΏΠ»Π°Π²Π½ΠΎ пСрСмСщаСтся ΠΏΠΎ ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΡŽ, Ρ„ΠΎΠΊΡƒΡΠΈΡ€ΡƒΡΡΡŒ Π½Π° ΠΊΠ»ΡŽΡ‡Π΅Π²Ρ‹Ρ… дСталях, Ρ‚Π°ΠΊΠΆΠ΅, ΠΊΠ°ΠΊ Ρ‡Π΅Π»ΠΎΠ²Π΅ΠΊ рассматриваСт ΠΎΠ±ΡŠΠ΅ΠΊΡ‚.

Π‘Π°ΠΌΡ‹ΠΉ интСрСсный экспСримСнт - Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅ Π»Π°Π±ΠΈΡ€ΠΈΠ½Ρ‚ΠΎΠ². Π‘Π΅Π· ΠΏΠΎΠ·ΠΈΡ†ΠΈΠΎΠ½Π½Ρ‹Ρ… эмбСдингов модСль строит Π²Π½ΡƒΡ‚Ρ€Π΅Π½Π½ΡŽΡŽ Β«ΠΊΠ°Ρ€Ρ‚ΡƒΒ», анализируя структуру шаг Π·Π° шагом, ΠΈ Π΄Π°ΠΆΠ΅ ΠΎΠ±ΠΎΠ±Ρ‰Π°Π΅Ρ‚ знания Π½Π° Π»Π°Π±ΠΈΡ€ΠΈΠ½Ρ‚Ρ‹ большСго Ρ€Π°Π·ΠΌΠ΅Ρ€Π°. Π­Ρ‚ΠΎ косвСнно Π΄ΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚, Ρ‡Ρ‚ΠΎ CTM способна ΠΊ ΠΏΠ»Π°Π½ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΡŽ, Π° Π½Π΅ просто запоминанию ΠΏΠ°Ρ‚Ρ‚Π΅Ρ€Π½ΠΎΠ².

CTM ΡƒΠΌΠ΅Π΅Ρ‚ ΡΠΊΠΎΠ½ΠΎΠΌΠΈΡ‚ΡŒ рСсурсы: для простых Π·Π°Π΄Π°Ρ‡ (классификации ΠΎΡ‡Π΅Π²ΠΈΠ΄Π½Ρ‹Ρ… ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ) ΠΎΠ½Π° останавливаСт вычислСния Ρ€Π°Π½ΡŒΡˆΠ΅, Π° для слоТных β€” Β«Π΄ΡƒΠΌΠ°Π΅Ρ‚Β» дольшС. Π­Ρ‚ΠΎ происходит Π±Π΅Π· явных инструкций.

Π’ качСствС ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π°: Π² Π·Π°Π΄Π°Ρ‡Π΅ сортировки чисСл модСль Ρ‚Ρ€Π°Ρ‚ΠΈΡ‚ большС «мыслСнных шагов» Π½Π° слоТныС пСрСстановки, Π° Π² вычислСнии чСтности ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ обучаСтся стратСгиям, Π½Π°ΠΏΠΎΠΌΠΈΠ½Π°ΡŽΡ‰ΠΈΠΌ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΈΡ‡Π΅ΡΠΊΡƒΡŽ Π»ΠΎΠ³ΠΈΠΊΡƒ.

Пока CTM Π½Π΅ SOTA, Π½ΠΎ ΠΎΠ½Π° ΠΎΡ‚ΠΊΡ€Ρ‹Π²Π°Π΅Ρ‚ возмоТности примСнСния Π² RL-срСдах (ΠΊΠ°ΠΊ ΠΊΠΎΠ½ΠΊΡƒΡ€Π΅Π½Ρ‚ LSTM), Π° Π² ΠΊΠ°Π»ΠΈΠ±Ρ€ΠΎΠ²ΠΊΠ΅ прСдсказаний Π΄Π°ΠΆΠ΅ прСвосходит Ρ‡Π΅Π»ΠΎΠ²Π΅Ρ‡Π΅ΡΠΊΡƒΡŽ Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ Π½Π° CIFAR-10. АрхитСктура Π½Π΅ привязана ΠΊ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½ΠΎΠΌΡƒ Ρ‚ΠΈΠΏΡƒ Π΄Π°Π½Π½Ρ‹Ρ…, ΠΎΠ½Π° Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ с изобраТСниями, ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡΠΌΠΈ ΠΈ тСкстом (хотя Π½Π° NLP Π΅Π΅ ΠΌΠ°ΡΡˆΡ‚Π°Π±Π½ΠΎ Π½Π΅ тСстировали).

Π’ ΠΎΡ‚ΠΊΡ€Ρ‹Ρ‚ΠΎΠΌ доступС Π½Π° Github ΠΎΠΏΡƒΠ±Π»ΠΈΠΊΠΎΠ²Π°Π½ ΠΊΠΎΠ΄ практичСской дСмонстрации CTM Π² Π·Π°Π΄Π°Ρ‡Π°Ρ… классификации ImageNet, Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ Π΄Π²ΡƒΠΌΠ΅Ρ€Π½Ρ‹Ρ… Π»Π°Π±ΠΈΡ€ΠΈΠ½Ρ‚ΠΎΠ², сортировку, вычислСния чСтности, QA ΠΈ Π·Π°Π΄Π°Ρ‡ΠΈ RL. ДатасСты ΠΈ тСстовыС ΠΌΠΎΠ΄Π΅Π»ΠΈ доступны ΠΏΠΎ запросу Ρ‡Π΅Ρ€Π΅Π· Ρ„ΠΎΡ€ΠΌΡƒ Google Drive.


πŸŸ‘Π‘Ρ‚Π°Ρ‚ΡŒΡ
🟑Arxiv
🟑Demo
πŸ–₯GitHub


@ai_machinelearning_big_data

#AI #ML #CTM #SakanaAI
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
πŸ‘12❀6πŸ”₯3🀨2


>>Click here to continue<<

Data Science by ODS.ai 🦜






Share with your best friend
VIEW MORE

United States America Popular Telegram Group (US)


Warning: Undefined array key 3 in /var/www/hottg/function.php on line 115

Fatal error: Uncaught mysqli_sql_exception: Too many connections in /var/www/db.php:16 Stack trace: #0 /var/www/db.php(16): mysqli_connect() #1 /var/www/hottg/function.php(212): db() #2 /var/www/hottg/function.php(115): select() #3 /var/www/hottg/post.php(351): daCache() #4 /var/www/hottg/route.php(63): include_once('...') #5 {main} thrown in /var/www/db.php on line 16