gonzo-обзоры ML статей | United States America (US)

Create: 2025-05-30 Update: 2025-07-03 14:16:28

Другой отличительной чертой является приверженность неограниченному (open-ended) поиску, вдохновлённому биологической эволюцией. Поддерживая архив всех сгенерированных агентов, который можно визуально представить как «дерево архива» с соответствующим графиком прогресса, документирующим родословную ключевых качественных улучшений, DGM может одновременно исследовать несколько эволюционных путей. Это позволяет ей обнаруживать «ступеньки» — функции или решения, которые могут быть временно неоптимальными, но открывают путь к будущим прорывам. Такой механизм помогает избежать локальных оптимумов, в которые могут попасть системы, всегда строящиеся на единственной лучшей или самой последней версии. Это контрастирует со многими подходами мета-обучения, которые оптимизируют агентов в фиксированном пространстве поиска или используют отдельного, фиксированного мета-агента. DGM, напротив, представляет собой единую систему, где агент *является* мета-агентом, непосредственно совершенствующим свой собственный дизайн — промпты, рабочие процессы и использование инструментов. Авторы утверждают, что такое самореферентное улучшение критически важно: рассматривая самосовершенствование как задачу программирования, успехи на бенчмарках напрямую отражают возросшую способность к дальнейшему самосовершенствованию.

Использование замороженных FM позволяет системе сосредоточиться на инновациях в *дизайне* и *рабочих процессах* агентов-программистов, а не на вычислительно запретной задаче переобучения самих FM. Это разумный выбор для демонстрации принципов архитектуры самомодифицирующихся агентов. Однако текущая методология имеет свои допущения и потенциальные ограничения. Сам процесс исследования (управление архивом, логика выбора родителей) пока что является фиксированным алгоритмом, не подверженным самомодификации со стороны DGM. Хотя архив помогает избежать некоторых локальных оптимумов, обширность пространства поиска означает, что риск застревания в более широких субоптимальных областях остаётся. Кроме того, успех системы зависит от предположения, что производительность на выбранных бенчмарках по программированию точно отражает истинное, обобщаемое улучшение способностей к программированию и самомодификации.

Способность DGM к самосовершенствованию была тщательно протестирована на двух бенчмарках по программированию: SWE-bench (подмножество проверенных задач) и Polyglot (задачи на нескольких языках программирования). Результаты весьма показательны. DGM продемонстрировала значительный рост своих способностей к программированию, улучшив показатель успешности на SWE-bench с начальных 20.0% до 50.0%, а на полном бенчмарке Polyglot — с 14.2% до 30.7% (при этом на подмножестве из 50 задач наблюдался рост с 14.0% до 38.0%).

Важно отметить, что DGM существенно превзошла абляционные бейзлайны. Вариант DGM «без самосовершенствования» (где мета-агент был фиксированным) стагнировал или улучшался гораздо меньше, а другой вариант «без неограниченного поиска» (который строился только на последней версии) также показал ограниченный прогресс. Эти абляции подчёркивают необходимость обоих ключевых компонентов для устойчивого развития. Лучшие агенты, обнаруженные DGM, достигли производительности, сравнимой, а в некоторых случаях и превосходящей, сильные вручную созданные open-source бейзлайны, такие как Aider на Polyglot.

Качественно DGM научилась улучшать свои собственные инструменты и рабочие процессы. Например, она разработала более гранулярные возможности редактирования файлов (например, замена строк), улучшила управление длинным окном контекста (например, автоматическое суммирование предыдущих взаимодействий) и усовершенствовала свои стратегии решения проблем (например, предпринимая несколько попыток решения и используя другую FM для оценки патчей). Эти обнаруженные улучшения также продемонстрировали обобщающую способность, перенося преимущества на различные базовые FM и языки программирования.

gonzo-обзоры ML статей

Forwarded from gonzo_ML_podcasts

hottg.com/gonzo_ML/3679

3.9K viewsMay 30 at 16:12

>>Click here to continue<<

gonzo-обзоры ML статей

Share with your best friend

Telegram auto-delete message, expiring invites, and more

elegram is updating its messaging app with options for auto-deleting messages, expiring invite links, and new unlimited groups, the company shared in a blog post. Much like Signal, Telegram received a burst of new users in the confusion over WhatsApp’s privacy policy and now the company is adopting features that were already part of its competitors’ apps, features which offer more security and privacy. Auto-deleting messages were already possible in Telegram’s encrypted Secret Chats, but this new update for iOS and Android adds the option to make messages disappear in any kind of chat. Auto-delete can be enabled inside of chats, and set to delete either 24 hours or seven days after messages are sent. Auto-delete won’t remove every message though; if a message was sent before the feature was turned on, it’ll stick around. Telegram’s competitors have had similar features: WhatsApp introduced a feature in 2020 and Signal has had disappearing messages since at least 2016.

Другой отличительной чертой является приверженность неограниченному (open-ended) поиску

gonzo-обзоры ML статей TG
Webview: 3679
Telegram TG Webview: hottg.com/gonzo_ML/webview
Telegram TG Channel: gonzo-обзоры ML статей
Telegram Updated: 2025-07-03 14:16:28

United States America Popular Telegram Group (US)

Telegram Q&A

Q: How does hottg.com work?

Once you've set up a username, you can give people a hottg.com/username link. Opening that link on their phone will automatically fire up their Telegram app and open a chat with you. You can share username links with friends, write them on business cards or put them up on your website.This way people can contact you on Telegram without knowing your phone number.

With Telegram, you can send messages, photos, videos and files of any type (doc, zip, mp3, etc), as well as create groups for up to 200,000 people or channels for broadcasting to unlimited audiences. You can write to your phone contacts and find people by their usernames. As a result, Telegram is like SMS and email combined — and can take care of all your personal or business messaging needs. In addition to this, we support end-to-end encrypted voice calls.

Q: What is Telegram? What do I do here?

Telegram is a messaging app with a focus on speed and security, it’s super-fast, simple and free. You can use Telegram on all your devices at the same time — your messages sync seamlessly across any number of your phones, tablets or computers.

Q: Who is Telegram for?

Telegram is for everyone who wants fast and reliable messaging and calls. Business users and small teams may like the large groups, usernames, desktop apps and powerful file sharing options. You can appoint admins with advanced tools to help these communities prosper in peace. Public groups can be joined by anyone and are powerful platforms for discussions and collecting feedback.In case you're more into pictures, Telegram has animated gif search, a state of the art photo editor, and an open sticker platform (find some cool stickers here or here). What's more, there is no need to worry about disk space on your device. With Telegram's cloud support and cache management options, Telegram can take up nearly zero space on your phone.

Q: How is Telegram different from WhatsApp?

Unlike WhatsApp, Telegram is a cloud-based messenger with seamless sync. As a result, you can access your messages from several devices at once, including tablets and computers, and share an unlimited number of photos, videos and files (doc, zip, mp3, etc.) of up to 2 GB each. And if you don't want to store all that data on your device, you can always keep it in the cloud.Thanks to our multi-data center infrastructure and encryption, Telegram is faster and way more secure. On top of that, Telegram is free and will stay free — no ads, no subscription fees, forever.

Q: Can I make calls via Telegram?

Yes! Voice calls are currently available to users around the world.

Many modern travelers appear to struggle with managing various aspects of their finances simultaneously while abroad, such as banking, budgeting, investing, trading, and saving. It is important to have apps installed on the device that will help you carry out these necessary tasks.

Hot Topic in US