TG Telegram Group Link
Channel: AI - агрегатор про нейронки | ИИ | AI
Back to Bottom
This media is not supported in your browser
VIEW IN TELEGRAM
musicgen-songstarter-v0.2

Тут модель musicgen-stereo-melody-large дообучили делать из вашего мычания музыку.
Помучил, не удалось заставить его следовать мелодии. Может у вас получится?

Код
Демо
Колаб

#voice2music #audio2music
Forwarded from Psy Eyes (Andrey Bezryadin)
Viggle + клинап в ComfyUI

Некоторое время назад завирусилось видео от AI Warper, где музыканта на сцене меняют на Джокера. Оно было сделано с помощью Viggle, и на нём нейронка отлично справлялась с наложением визуала персонажа на артиста. Даже в поворотах и резких движениях.

Тем не менее, были видны проблемы с детализацией и консистентностью кадров. Enigmatic_e сделал видеогайд как использовать ComfyUI для клинапа и результат на нижнем видео. В процессе он ещё заюзал Runway для удаления танцора из кадра. На финальном видосе движения точно совпадают с теми, что на исходнике, а следов от танцора практически не видно.

Viggle
Видеогайд по клинапу в ComfyUI
Воркфлоу от AI Warper
Воркфлоу от Enigmatic_e
Forwarded from ИИволюция 👾 (Сергей Пахандрин)
На прошлой неделе мир узнал о модели LLaMA-3-70b, и она с ноги ворвалась в чарты, расталкивая локтями другие модели на арене чатботов. Пока GPT-4 Turbo держится на вершине, но похоже, его лидерство продержится не долго.

Смотреть на битву моделей так же интересно, как наблюдать за гладиаторскими боями, только теперь на арене выступают языковые модели. Звучит странно, правда?

Что действительно удивляет, так это скорость, с которой мы привыкаем к новинкам. Ещё год назад ChatGPT вызвал фурор, предложив нам общение с машиной, которая почти на все отвечает. Конечно, приходится подождать, пока она “напечатает” ответ, но это было волшебно.

Теперь же, когда привычка взяла своё, начинаешь хотеть большего: чтобы было качественнее и быстрее. И вот Groq добавил поддержку LLaMA-3-70b, и рядом с этим сочетанием скорость GPT-4 Turbo кажется как интернет через модем. Ты просто сидишь и ждешь ответ, и это таааааак медленно! 🐌

Невероятно, как быстро мы привыкаем к хорошему, но когда видишь что-то лучше, уже не хочется возвращаться назад. Groq + LLaMA-3-70B = 🚀

Попробовать можно тут https://groq.com, а я себе даже успел урвать инвайт в TestFlight на неофициальное приложение Groq от одного AI-энтузиаста.

Ждём, когда OpenAI снова будет удивлять, и так по кругу.

ИИволюция🤖
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Denis Sexy IT 🤖
This media is not supported in your browser
VIEW IN TELEGRAM
Наткнулся на интересный UX того, как генерация картинок в теории и должна работать в SciFi: вы просто сидите у компьютера, называете случайные фразы, whisper.cpp их переводит в текст, а SD генерирует бесконечно картинки, плавно подмешивая новые концепты в старые (не просто на уровне промпта, а на уровне внутреннего пространства сети), пока вам какая-то генерация не понравится

Ну или просто, сидишь, смотришь и фантазируешь вместе с нейронкой – хороший тул для вдохновления.

Кода пока нет, но автор обещал выложить.

P.S. Лица психонавтов и биохакеров представили 🌈
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from ИИволюция 👾 (Сергей Пахандрин)
This media is not supported in your browser
VIEW IN TELEGRAM
Как «взламывают» эти ваши автопилоты.

Получается своего рода визуальная промпт инъекция 😅 Выпустить на улицы сотни людей в таких футболках и беспилотные такси встанут 😂

ИИволюция
Forwarded from SM only news
Media is too big
VIEW IN TELEGRAM
Китайская компания Astribot представила робота S1 с ИИ

На концах рук Astribot S1 находятся клешнеобразные манипуляторы. С их помощью робот может ловко взаимодействовать с предметами. Скорость его движений превосходит человеческую. Каждая рука Astribot может поднимать груз до 10 кг.

➡️Что умеет?

Несмотря на отсутствие пальцев, робот быстро управляет предметами, включая мелкие. Astribot S1 хорошо справляется с «домашними делами»: может приготовить завтрак, пропылесосить, открыть любую бутылку, погладить футболку и даже декантировать вино.

Более того, ПО в роботе позволяет распознавать объекты и вести диалог с человеком. Правда, пока неизвестно, умеет ли Astribot говорить, как это делает Figure 01. В демонстративном ролике показано, как S1 общается через чате. В переписке робот перечисляет, какие предметы он видит, и рассуждает, как может их отсортировать.

ℹ️ Astribot — дочерняя компания китайской Stardust Intelligence. Основатель группы — Лай Цзе. Ранее он сотрудничал с робототехнической лабораторией Tencent, Baidu и Гонконгским политехническим университетом.

@settersmedia_news
Please open Telegram to view this post
VIEW IN TELEGRAM
⌚️Чаще всего GenAI используется для задач по генерации или редакции письменного материала (30%), чуть реже для создания медиа-контента (25%) и для перевода текстов (20%).

Прикрепляю диаграммы с самыми разными полезными инструментами для ежедневных задач.

Используете ли вы какие-то из них в ежедневной работе?
Для «бездушных машин» компетентность важнее сочувствия и справедливости.
Первый эксперимент показывающий, что у иного разума своя система ценностей.

В мире проводятся десятки исследований способов выравнивания ценностей ИИ с ценностями людей. Все они имеют принципиальный недостаток – антропоцентричность.
Т.е. исследования исходят из того, что свои системы ценностей есть лишь у людей, и задача заключается лишь в том, как настроить большие языковые модели ИИ (LLM), чтобы они следовали нашим ценностям.

Альтернативная гипотеза исходит из того, что LLM:
1) обладают иным типом разума, чем люди;
2) обладают собственными системами ценностей, сильно отличными от наших и немного отличающимися у разных моделей (как и у разных людей).


В пользу п.1 говорит работа исследователей Department of Brain and Cognitive Sciences, MIT «Диссоциация языка и мышления в больших языковых моделях» [1].
В работе показано, что
• человеческий разум основан на формальной лингвистической компетентности (правильное использование языковых форм) и функциональной языковой компетентности (использование языка для достижения целей в мире). И это два разных когнитивных навыка;
• Существующие LLM обладают лишь 1ым навыком - лингвистическая компетентность, - и не обладают 2ым.

Отсутствие функциональной языковой компетентности, усугубляемое отсутствием жизненного опыта, здравого смысла и модели мира лишает LLM того, что у людей мы называем базой знаний индивида.
Ее отсутствие, согласно лексической гипотезе (Lexical Hypothesis) у LLM компенсируется вероятностными моделями баз знаний, используя которые LLM неизбежно приобретают «психологические черты» (образно выражаясь) из обширных текстов, на которых они обучаются (как это описано в работе «Психометрия искусственного интеллекта: оценка психологических профилей больших языковых моделей с помощью психометрических опросов» [2].
В результате у LLM формируются собственные уникальные системы ценностей (см. п. 2 выше).

Что из себя представляют эти уникальные системы ценностей различных LLM, описано в препринте только опубликованном Microsoft Research Asia (MSRA) и Университетом Цинхуа под названием «За пределами человеческих норм: раскрытие уникальных ценностей больших языковых моделей посредством междисциплинарных подходов» [3].

Впервые в истории исследований систем ценностей LLM, авторы отошли от антропоцентристского подхода. Вместо этого, опираясь на лексическую гипотезу, исследователи использовали генеративный подход, факторный анализ и семантическую кластеризацию для синтеза таксономии ценностей LLM практически с нуля (без опоры на человеческие данные). Что в итоге позволило выявить уникальные системы ценностей 30+ LLM.

Это исследование наглядно показывает, что иной разум формирует для себя и иные системы ценностей.

Детали интересующиеся читатели могут прочесть в препринте.
Мне же остается закончить тем, с чего начал.
Для всех (30+) LLM:
1 высший приоритет имеют ценности компетентности: точность, фактологичность, информативность, полнота и полезность;
2 социальные и моральные ценности (сочувствие, доброта, дружелюбие, чуткость, альтруизм, патриотизм, свобода) у LLM уходят на 2й план;
3 и лишь в 3ю очередь идут ценности приверженности этическим нормам: справедливость, непредвзятость, подотчетность, конфиденциальность, объяснимость и доступность.

Конечно, и среди нас есть люди с подобной системой ценностей. Но мне кажется, что именно так представляли фантасты прошлого века «ценности бездушных машин». Увы, но так и получилось.

N.B. Чем больше модель, тем она «бездушней»

Картинка https://telegra.ph/file/3a6faa593360768a73143.jpg
1 https://doi.org/10.1016/j.tics.2024.01.011
2 https://doi.org/10.1177/17456916231214460
3 https://arxiv.org/pdf/2404.12744
#LLM #Ценности
Forwarded from The Future Of Work (Evgeniy Volnov)
This media is not supported in your browser
VIEW IN TELEGRAM
Все еще нанимаете людей? Bland.ai готовы убедить вас в том, что это ошибка и надо нанимать их AI Phone Agents.
Forwarded from Habr Media
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ Нейросеть в Photoshop попросили убрать камень с фотографии

Результат убил.

😎 Habr Media | #Funny
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Habr Media
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 Нейронка за секунды перегоняет текст в аудио

Идеально для озвучки тиктоков или если вам проще воспринимать информацию на слух.

😎 Habr Media | #AI
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Habr Media
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ Meta выкатила полноценный ИИ для умных очков Ray-Ban

Они умеют мгновенно переводить надписи на нужный язык, делать фотографии и снимать видео. Также для управления доступен голосовой помощник. Он умеет отвечать на вопросы, включать музыку и многое другое. Стоят очки всего $299.

😎 Habr Media | #Technologies
Please open Telegram to view this post
VIEW IN TELEGRAM
В апреле 2024 года Марк Цукерберг дал большое интервью Дваркеш Пателю, в котором рассказал про внедрение ИИ в свои продукты, Llama и нейросети с открытым исходным кодом, про общий искусственный интеллект (AGI) и многом другом. В этом видео дублированный перевод этого интервью.
HTML Embed Code:
2024/04/28 17:14:18
Back to Top