Google DeepMind представил новую мультимодальную модель Gemini Robotics On-Device
Модель объединяет зрение, понимание языка и управление действиями робота. Работает локально, без постоянного подключения к интернету — вся обработка происходит прямо на роботе, что обеспечивает низкую задержку и автономность. Её легко дообучить на своих данных — нужно всего 50-100 демонстраций.
«Поскольку модель работает независимо от сети передачи данных, она полезна для приложений, чувствительных к задержкам, и обеспечивает надёжность в средах с нестабильным или отсутствующим подключением», — из пресс-релиза.