Завершился первый в истории конкурс ИИ моделей

5.jpg

Победительница конкурса ИИ моделей.

Miss AI - это первый в истории конкурс красоты среди ИИ моделей, организованный по заказу Fanvue World AI Creator Awards, как бы странно это ни звучало. Победительнице удалось обойти 1500 других претендентов и в итоге создатель модели, женщина-руководитель отдела технологий Phoenix AI Мериам Бесса, получила приз в 20 тысяч долларов, пишет The New York Post.

«Девушка» круглосуточно общается с подписчиками в своих соцсетях и «поражает всех своей красотой и скромностью». «Я очень горжусь тем, что выиграла эту награду для Марокко!» — пишет создательница Лейли, 40-летняя Мериам Бесса из Касабланки.

Со слов организаторов, награда станет отличным механизмом для празднования достижений создателей, повышения стандартов и формирования позитивного будущего для экономики сферы ИИ.

Ниже можно посмотреть других участниц, претендовавших на заветный титул Miss AI.

3.jpg

4.jpg

1.jpg


139 0 850 2
52
2024-07-10
Сейчас напишут что-то типа "я тоже, пробовал, а у меня у модели руки кривые получаются, и три ноги, вы обманываете народ!"
2024-07-10
У всех дефолтные лица из SD, кроме рыжей - у нее дефолтное лицо из MJ.
2024-07-10
Вообще это жутко опасная тема, так через 5 лет без работы останутся все модели чего угодно (фитнес, мода и т.д.) и заодно онлифанс уйдет у дороги стоять.
2024-07-10
Дмитрий ВолоснихинСейчас напишут что-то типа "я тоже, пробовал, а у меня у модели руки кривые получаются, и три ноги, вы обманываете народ!"

Точно, Проксель сейчас прибежит и скажет, что у него все пальцы кривые и их по 6 штук на руке. )
2024-07-10
на какую-то фигню 20 тыщ баксов потратили. Ради справедливости могли награду тоже сгенерировать.
2024-07-10
в хиджабе?
2024-07-10
Скажи спасибо, что не в поясе.
2024-07-10
Ярослав Перчуненкона какую-то фигню 20 тыщ баксов потратили. Ради справедливости могли награду тоже сгенерировать.

А вот это отличная идея.
2024-07-10
Моделей чего? Криперов ?
2024-07-10
В чём ценность этих лиц? Все они натренерованны на реальных людях, и почти копии реальных моделей.
2024-07-10
Компания Xiaomi намедни заявила что запускает завод по производству смартфонов с полным циклом без участия людей. На заводах не будет людей, в офисах не будет людей, музыку пишет ИИ, картины рисует он же. Встаёт вопрос: а чем люди вообще будут заниматься в будущем? Становится супер профессионалом у всех не выйдет, всем пойти в сантехники или строители тоже. В развитых странах люди будут тихо вымирать на безусловном доходе, а в неразвитых странах будет продолжаться человеческий труд и профессионалы поедут туда работать, т.к. на Родине их уже заменил ИИ?
2024-07-10
Чего?..
2024-07-10
Oleg Lych (CaptainData)В чём ценность этих лиц? Все они натренерованны на реальных людях, и почти копии реальных моделей.

А это новая реальность, ценностями мира до ИИ она к сожалению не измеряется.
2024-07-11
Спасибо!
2024-07-11
Дмитрий ВолоснихинСейчас напишут что-то типа "я тоже, пробовал, а у меня у модели руки кривые получаются, и три ноги, вы обманываете народ!"

Не, если 10тыс. раз нажать сгенерить, но один раз что-то путное выйдет, тут без вопросов.. Потом это можно выложить и сказать - вот видите как умеють.
По поводу "трех ног" кстати, попробуйте сгенерить человека с тремя ногами или тремя ушами )
2024-07-11
GoodMan
Не, если 10тыс. раз нажать сгенерить, но один раз что-то путное выйдет, тут без вопросов.. Потом это можно выложить и сказать - вот видите как умеють.
По поводу "трех ног" кстати, попробуйте сгенерить человека с тремя ногами или тремя ушами )

Мне понадобился одноглазое существо с одним ухом, одной рукой с двумя пальцами и на трех ногах - для демонстрации идеального персонажа. - фигушки, один глаз получился, но рук две, пальцев пять, два из них вот так \/, третья нога ну никак...
2024-07-11
Борис Кулагин (Boris Kulagin)Мне понадобился одноглазое существо с одним ухом, одной рукой с двумя пальцами и на трех ногах - для демонстрации идеального персонажа. - фигушки, один глаз получился, но рук две, пальцев пять, два из них вот так \/, третья нога ну никак...

Да, я пытался трехглазых генерить или одноногих. Не сразу всё в одном, а по отдельности. Ни SD3.0 ни MJ ничего путного не выдало. По поводу трехногих и трехглазых (а такие люди реально существовали, трехногие) то рисует ноги в ногах, глаза на руках, то просто двух человек одинаковых рядом. Видимо полагая, что у двух человек четыре ноги, а четыре это лучше чем три ))
2024-07-11
Борис Кулагин (Boris Kulagin)
Мне понадобился одноглазое существо с одним ухом, одной рукой с двумя пальцами и на трех ногах - для демонстрации идеального персонажа. - фигушки, один глаз получился, но рук две, пальцев пять, два из них вот так \/, третья нога ну никак...

Чтобы решать такие задачи, нужно для начала уходить от Миджони и переходить на Стейбл Дефьюжн, потом понять, что нейронка генерит только то, на чем обучена и отрыть для себя прекрасный мир подгружаемых моделей обученных на нужных для задачи вещах. Найти подходящие под задачи модели (их сотни тысяч свободно подгружаемых на специальных сайтах, можно обучать свои на уродцах и монстрах).

Дальше учится работать с промтом и осознать, что просто промт, даже хороший, даже с подходящей моделью не решает всех задач и открыть для себя прекрасный мир негативного промта. Потом понять, что промтом тоже можно управлять за счет операторов, усиляя одну часть промта и уменьшая вес другое.

Ну и самое главное, когда мы пишем, что что-то нейросеть не может, это уже не актуально или будет не актуально на днях, подход — "она этого не может" в корне не правильный. Нейронки развиваются очень быстро и слово невозможно тут не работает, все будет и при чем очень скоро, начиная с гибких инструментов и заканчивая супер гибкими моделями.
2024-07-11
GoodMan
Да, я пытался трехглазых генерить или одноногих. Не сразу всё в одном, а по отдельности. Ни SD3.0 ни MJ ничего путного не выдало. По поводу трехногих и трехглазых (а такие люди реально существовали, трехногие) то рисует ноги в ногах, глаза на руках, то просто двух человек одинаковых рядом. Видимо полагая, что у двух человек четыре ноги, а четыре это лучше чем три ))

Странное однорукое существо с одним глазом, одной рукой и двумя пальцами, гуляет в джунглях и орет. На стандартных моделях не добиться решения не стандартных, надуманных и очевидно безумных задач. Нужно искать такие же безумные модели.


2024-07-11
Мятный Дворецкий
Ну и самое главное, когда мы пишем, что что-то нейросеть не может, это уже не актуально или будет не актуально на днях, подход — "она этого не может" в корне не правильный. Нейронки развиваются очень быстро и слово невозможно тут не работает, все будет и при чем очень скоро, начиная с гибких инструментов и заканчивая супер гибкими моделями.

А я и не говорю, что не может. И в общем понимаю принцип как оно работает - вся эта история известна (и работала) еще с конца 80-х годов. https://znanierussia.ru/articles/%D0%A2%D0%B5%D0%B... Просто посетовал :)
2024-07-11
Мятный Дворецкий
Странное однорукое существо с одним глазом, одной рукой и двумя пальцами, гуляет в джунглях и орет. На стандартных моделях не добиться решения не стандартных, надуманных и очевидно безумных задач. Нужно искать такие же безумные модели.
Однорукие и одноногие люди, это вполне себе реальные люди и соотв. задачи. Даже трехногие бывают. Проблема в том, что ни SD ни MJ не могут сами нарисовать ничего. Смиксовать да, но додумать нет. В этом плане, даже фантазия кромоньёнца, увидевшего во сне трехрукого монстра даст фору любому AI. Люди как только научились рисовать уже сами могли придумывать таких человекоподобных монстров, не видя их в реальности, AI сети - похоже не могут, ибо им не показали и не скормили десятками тысяч.
2024-07-11
GoodMan Однорукие и одноногие люди, это вполне себе реальные люди и соотв. задачи. Даже трехногие бывают. Проблема в том, что ни SD ни MJ не могут сами нарисовать ничего. Смиксовать да, но додумать нет. В этом плане, даже фантазия кромоньёнца, увидевшего во сне трехрукого монстра даст фору любому AI. Люди как только научились рисовать уже сами могли придумывать таких человекоподобных монстров, не видя их в реальности, AI сети - похоже не могут, ибо им не показали и не скормили десятками тысяч.
Вы не умеете пользоваться нейросетями и правильно ставить задачи, нет проблемы получить человека с одной ногой, это вопрос не нейросетей, а лично вашего не умения это сделать.

Молодой мужчина, ампутант, у него нет одной ноги, он сидит в кресле и смотрит на зрителя, на нем одеты шорты и мы видим обрубок ноги.




По поводу того, что вы пишете дальше, в общем и целом это не так, просто пока в ряде специфических задач именно графического характера, имеются достаточно узкие рамки и высокий порог вхождения, чтобы получилось добиться определенных нестандартных результатов. Нужно уметь это делать, конкретно вы не умеете, я умею.
2024-07-11
Это где сделано? В SD - Какая модель? Я перепробовал 20 моделей которые "суперреалистично" делают людей и нигде не получил нужного результата что с моими, что с вашим промптом. Возможно это конкретно модель для генерации людей с ампутацией. И эта картинка ягко говоря странная: всё в мыле, "пальцы веером".
Подобное у меня получалось в SD с определёнными моделями даже когда я не задавал параметр одноногий. Просто нога не прорисовывалась. Давайте - нарисуйте мне этого же персонажа что у вас, но стоящего спиной к зрителю с смотрящего в окно например.

00158-3211187086-A-young-man-an-amputee-he-is-missing-one-leg-he-sits-in-a-chair-and-looks-at-the-vi
А то я тоже могу сказать, что получил человека с тремя ногами, всё возможно. Только это одна из нескольких генераций с вашим промптом про одногого парня, которая просто пошла не по плану )
2024-07-11
GoodManЯ перепробовал 20 моделей которые "суперреалистично" делают людей и нигде не получил нужного результата что с моими, что с вашим промптом.

Это не рабочий промт, это просто суть передал на русском языке, там все сложнее было с операторами. Это не специальная модель для ампутантов, я о такой модели не знаю, но возможно она есть.

Важный момент, когда вы качаете модель весом в 150 мб, не ждите хороших результатов, нормальные модели 3-10 гб.

GoodManИ эта картинка ягко говоря странная: всё в мыле, "пальцы веером".

Это вообще случайная модель обученная на аниме персонажах, полученная с 3-4 попытки. Можно доработать, но мне это не нужно, я честно сказать исчерпал свободное время на подобные задачи в рамках обсуждения на сайте. Просто двумя генерациями доказал, что то что вы утверждаете не соответствует действительности (проблемы конечно есть, но многое решаемо или будет решаемо уже очень скоро).
2024-07-11
GoodManА то я тоже могу сказать, что получил человека с тремя ногами, всё возможно. Только это одна из нескольких генераций с вашим промптом про одногого парня, которая просто пошла не по плану )

Рекомендую поискать разные модели вот тут и поработать с ними https://civitai.com/
2024-07-11
Да всякие модели пробовал.
photo-2024-07-11-15-06-15
2024-07-11
GoodManДа всякие модели пробовал.
photo-2024-07-11-15-06-15

Ну я точно не рисовал это :-) Нужно изучать написание промтов и операторов к ним более углубленно, а также использовать негативные промты.
2024-07-11
GoodMan Однорукие и одноногие люди, это вполне себе реальные люди и соотв. задачи. Даже трехногие бывают. Проблема в том, что ни SD ни MJ не могут сами нарисовать ничего. Смиксовать да, но додумать нет. В этом плане, даже фантазия кромоньёнца, увидевшего во сне трехрукого монстра даст фору любому AI. Люди как только научились рисовать уже сами могли придумывать таких человекоподобных монстров, не видя их в реальности, AI сети - похоже не могут, ибо им не показали и не скормили десятками тысяч.

И не страшно, что не могут. Миксовать - это всё, что от них нужно. Замиксовать фламенко с джазом и дум-металом либо кожу превратить в геометрический орнамент - разве мало?
2024-07-11
Сейчас мода такая пошла - если ты убогий, негр или ходишь напялив на свою голову одеяло, или старый гомосек, то нужно таким давать первые места, чтобы не обиделись? В чем красота женщины с одеялом на голове что она заняла первое место? Обычная арабская баба- беженка.
2024-07-11
Vlad VladВ чем красота женщины с одеялом на голове что она заняла первое место? Обычная арабская баба- беженка.

Победила марокканка. Ислам является государственной религией Марокко. 98,7 % марокканцев — мусульмане-сунниты, 1,1 % — христиане, 0,2 % — иудеи. Понятно почему так одета.
2024-07-12
Алексей Устинов
И не страшно, что не могут. Миксовать - это всё, что от них нужно. Замиксовать фламенко с джазом и дум-металом либо кожу превратить в геометрический орнамент - разве мало?

Да пожалуйста. В определённых случаях это именно то, что нужно. Но разве вы не видите разницу между композитором сочиняющим мелодию и диджеем миксующим уже существующие композиции?
Грубо говоря условный фотошопер тоже может вырезать лицо мароканки и вписывать его в разные одежды и окружения, создавая картинки порой неотличимые от реальных фоток. У сети правда ресурсов на несколько порядков больше и алгоритмы позволяющие бесшовно миксовать разные изображения более совершенные. Но и ошибки она допускает более грубые: переломанные ноги, загнутые пальцы и т.п.
2024-07-12
GoodManНо разве вы не видите разницу между композитором сочиняющим мелодию и диджеем миксующим уже существующие композиции?

А ее уже нет. Вы изучали современные системы создания музыки и песен на основе нейросетей? Вы выбираете стиль, число поющих, их голоса, тембры и т.д. Можете настроить очень много параметров или наоборот минимум, попросить написать текст песни в каком вам угодно стиле, от оперы, до аренби и очень приличная песня, неотличимая от человеческого труда готова. Если на русском языке там местами можно зацепиться, то на английском это безупречно. Он ничего не микширует, а пишет музыку и исполняет с нуля в определенном стиле.


GoodManГрубо говоря условный фотошопер тоже может вырезать лицо мароканки и вписывать его в разные одежды и окружения, создавая картинки порой неотличимые от реальных фоток. У сети правда ресурсов на несколько порядков больше и алгоритмы позволяющие бесшовно миксовать разные изображения более совершенные. Но и ошибки она допускает более грубые: переломанные ноги, загнутые пальцы и т.п.

Если правильно все делать, то ошибок не будет, но пока это требует углубленного изучения написания промтов (странно, что теперь это стало сложно, похоже мы уже деградируем), а через несколько месяцев и этой проблемы не будет, а через год вообще никаких, через 2-3 года вероятно это доберется и до видео (то что сейчас есть уже впечатляет).
2024-07-14
ну хоть не бородатый мужик в женском платье)
2024-07-15
Глобалисты дожимают.
Эра белых людей заканчиваеться.
черно...ая трансгендерная сатанистка исповедующая самую мирную религию..
2024-07-15
"Победительница конкурса ИИ моделей" - почему я не удивлён? Сегодня мусульманская тема переплюнула даже расовую и однопололюбивую в глазах обезумевших западных неомарксистов-глобалистов. Что ж, видимо они, таки, напорются на то, за что так сражаются. На глобальную резню. Собственно, оно уже то там, то там вспыхивает. Просто пока ещё точечно.
2024-07-15
Евгений Старков (Johnny Starkov)ну хоть не бородатый мужик в женском платье)

Так а что изменилось, кроме формы? Содержание то же. Просто сейчас модно жалеть бедную газочку, а эти бородатых в платьях вешают. Суть же осталась прежняя. Награждают не лучших, а идеологически правильных.
2024-07-15
Александр Холоповв хиджабе?

Дух времени. Награждают идеологически правильных.
2024-07-15
Vlad VladСейчас мода такая пошла - если ты убогий, негр или ходишь напялив на свою голову одеяло, или старый гомосек, то нужно таким давать первые места, чтобы не обиделись? В чем красота женщины с одеялом на голове что она заняла первое место? Обычная арабская баба- беженка.

Сегодня побеждают не те, кто лучше, а идеологически правильные.
2024-07-16
GoodMan
Да пожалуйста. В определённых случаях это именно то, что нужно. Но разве вы не видите разницу между композитором сочиняющим мелодию и диджеем миксующим уже существующие композиции?
https://www.udio.com/
2024-07-16
Дмитрий Волоснихин https://www.udio.com/
Отличный пример, почему диджеи теперь не нужны ) Ведь миксовать музыку научили и машину.
2024-07-16
GoodMan Отличный пример, почему диджеи теперь не нужны ) Ведь миксовать музыку научили и машину.

Ну если вы не поняли что тут не микс. Попробуйте потыкаться, там есть возможность работать с запросами типа "а вот тут добавь ударнички и вокал поагрессивнее". Если что и текст он гененрирует и в вокал переводит. Так что это уж прям далеко не микс. Больше половины известных мне разных музыкантов и такого качества не смогут выдать. А это бета.

То что у каких-то там специалистов с консерваториями за плечами и 15 годами музыкального стажа будет лучше. Ну да, возможно лучше. Ну вы сами понимаете что оно при таком росте возможностей скоро обгонит их и перегонит, потому-что разрыв раньше был скажем в 10 лет музыкального стажа по сравнению с професссиональными музыкантами, через год он стал в 5 лет, а еще через год будет 0, а еще через год музыканты уже не смогут догнать ИИ. Очень жаль, что вы этого просто не способны увидеть.
2024-07-16
GoodMan Отличный пример, почему диджеи теперь не нужны ) Ведь миксовать музыку научили и машину.
Чисто для смеха, 5 минут времени
https://www.udio.com/songs/9gkRrWS3rTpgzFBG9hsRR3
2024-07-16
Дмитрий Волоснихин
Ну если вы не поняли что тут не микс. Попробуйте потыкаться, там есть возможность работать с запросами типа "а вот тут добавь ударнички и вокал поагрессивнее". Если что и текст он гененрирует и в вокал переводит. Так что это уж прям далеко не микс. Больше половины известных мне разных музыкантов и такого качества не смогут выдать. А это бета.

То что у каких-то там специалистов с консерваториями за плечами и 15 годами музыкального стажа будет лучше. Ну да, возможно лучше. Ну вы сами понимаете что оно при таком росте возможностей скоро обгонит их и перегонит, потому-что разрыв раньше был скажем в 10 лет музыкального стажа по сравнению с професссиональными музыкантами, через год он стал в 5 лет, а еще через год будет 0, а еще через год музыканты уже не смогут догнать ИИ. Очень жаль, что вы этого просто не способны увидеть.
Микс, только развитый. Когда научится писать музыку для оркестров - тогда помотрим. А пока больше похоже на продвинутые миди-генераторы только с вокалом)
Музыку кстати не так то и сложно генерировать. А о том что всё что пишется сейчас , уже было когда-то кем то написано - споры ведутся не один год ) Количество нот и их благозвучных сочетаний не так уж и много.
Но спорить тут не хочу. Это как спорить о вкусах и картинах, тут либо нравится либо нет. Из того что я слышал - меня ничего не цепляет там просто какой-то ритм и благозвучная последовательность звуков. Хип-хопы и прочие рэпчики вообще не в счёт.
2024-07-16
Дмитрий Волоснихин Чисто для смеха, 5 минут времени
https://www.udio.com/songs/9gkRrWS3rTpgzFBG9hsRR3
Прикольно!) Но по мне мелодия и музыка это не одно и тоже, хотя и тождественно. Это как сравнивать хорошее кино или клип с например съёмкой видео ролика на телефон.
Музыка цепляет - а мелодия, просто звучит приятно уху, ну или не звучит совсем неприятно)
2024-07-16
GoodMan Микс, только развитый. Когда научится писать музыку для оркестров - тогда помотрим. А пока больше похоже на продвинутые миди-генераторы только с вокалом)
Да кстати там не генератор нот. Принцип работы совершенно другой на самом деле, он генерирует все целиком, причем начинает с общей структуры, потом детализирует, детализирует пока не получит нужный результат. В процессе детализации оценивает на каждом этапе насколько полученное соответствует запросу. Так что в целом он работает примерно так-же как и композитор, которому задано написать песню на заданную тему в заданном стиле. Ну и не только композитор, но и музыканты и вокалист.

Прикольно то, что никаких нот там нет, он про ноты ничего не знает абсолютно, в него это не заложено и не закладывалось никаким образом, никто их там не программировал, никаких "крутые сочетания нот" не закладывал, так-же как и не закладывали звучание разных инструментов и т.п. Знания о нотах, вокале, звучании инструментов, композиции он сам вывел при обучении из целых композиция. Учили с "чистого листа" Поэтому все-же принцип совершенно не похож на генераторы миди. Тут реально работает как человек, который слушал бы тот же самый набор музыки что "прослушал" ИИ. На основании обучения (опыта) у него наработалось понятие что такое хорошая музыка, хорошая музыка в стиле кантри, гитарные проигрыши и т.п.

И уж тем более этот ИИ не хранит никаких кусков записи музыки, он не может их хранить в принципе, так-же как модель SD XL объемом 6Гб не содержит конечно бесконечного набора изображений всего на свете в разных ракурсах и положениях чтобы их потом "склеивать". Это невозможно технически. Восстановление идет именно из шума. Если бы его обучали на музыке пришельцев, у которых другая музыкальная система, о которой люди, создатели этого ИИ, не имеют ни малейшего понятия, он с такой-же легкостью справился-бы и генерировал бы отличные песни на инопланетном языке в их музыкальной системе, хотя мы и не могли бы ничего ему об этой системе рассказать. Понимаете в чем разница между миксингом, "генераторами нот" и этим сервисом? Мы можем его обучить на любых наборах данных, даже если мы сами не знаем каким образом они друг с другом связаны....

Единственный, прям существенный минус современных нейросетей, что они работают уже по факту обученными. И если хотите засунуть в него новую "фишку", нужно его "дообучать", затратив опять много процессорного времени. Обучение - реально трудозатратная операция. Делать это в реальном времени - очень сложно, и именно для этого компании разрабатывающие ИИ следующего поколения инвестируют триллионы долларов, чтобы получить системы которые будут обладать достаточными мощностями чтобы обучаться дальше "на ходу".

Опять-же если мы говорим о огромных моделях. Более компактные, специализированные, вполне уже сегодня до обучать в реальном времени. Архитектуры нейросетей совершенствуются каждый год, как и алгоритмы их обучения. Так что в принципе никаких особых ограничений получить ИИ который генерирует прям вот "творчество" нет. Проблема больше в подходах и инструментах. Было бы не очень если бы ChatGPT начал бы рассуждать о том что "хорошо бы убить всех людей", правильно?

Поэтому компании сами предпочитают использовать такие модели и архитектуры, которые дают не мегакреативный, но зато " предсказуемый и политически корректный, приятный для пользователя" результат. А не потому-что нельзя этого делать. Больше опасаются что результат выйдет из-под контроля, настолько необычными он может оказаться ) Будет вам генерить инопланетную музыку офигенной креативности, а вы скажете "а че это он какой-то шум непонятный мне выдает, где мой тыц-тыц...?". Такой ИИ компаниям, которые хотят заработать бабки, не нужен.

Энтузиасты на коленках с нейросетями делают чудеса, просто нужно немного быть в теме, а не только читать об ИИ на популярных сайтах. Море потрясающих ресурсов, уже 3д модели делают очень круто из картинки, буквально месяц назад новая какая-то прорывная штука у одного чел была, видел на ютубе, сейчас ссылку не припомню. Жду когда зарелизят, сразу бомба будет, чувствую, сразу говорить начнут везде. А глядишь за это время кто-то еще более крутую штуку уже запилил. Скорость развития просто потрясающая...Два года назад про генерацию музыки такого качества никто и подумать не мог. Генераторы нот, говорили они....

Оркестры... ну поищите там по фильтру classical music, полно всего, причем иногда аж у-х-х-х.
В топе например есть композиция: https://www.udio.com/songs/ocYMEPXWYkD19egp8ivZZJ


2024-07-16
Дмитрий Волоснихин Да кстати там не генератор нот. Принцип работы совершенно другой на самом деле, он генерирует все целиком, причем начинает с общей структуры, потом детализирует, детализирует пока не получит нужный результат. В процессе детализации оценивает на каждом этапе насколько полученное соответствует запросу. Так что в целом он работает примерно так-же как и композитор, которому задано написать песню на заданную тему в заданном стиле. Ну и не только композитор, но и музыканты и вокалист.

Прикольно то, что никаких нот там нет, он про ноты ничего не знает абсолютно, в него это не заложено и не закладывалось никаким образом, никто их там не программировал, никаких "крутые сочетания нот" не закладывал, так-же как и не закладывали звучание разных инструментов и т.п. Знания о нотах, вокале, звучании инструментов, композиции он сам вывел при обучении из целых композиция. Учили с "чистого листа" Поэтому все-же принцип совершенно не похож на генераторы миди. Тут реально работает как человек, который слушал бы тот же самый набор музыки что "прослушал" ИИ. На основании обучения (опыта) у него наработалось понятие что такое хорошая музыка, хорошая музыка в стиле кантри, гитарные проигрыши и т.п.

И уж тем более этот ИИ не хранит никаких кусков записи музыки, он не может их хранить в принципе, так-же как модель SD XL объемом 6Гб не содержит конечно бесконечного набора изображений всего на свете в разных ракурсах и положениях чтобы их потом "склеивать". Это невозможно технически. Восстановление идет именно из шума. Если бы его обучали на музыке пришельцев, у которых другая музыкальная система, о которой люди, создатели этого ИИ, не имеют ни малейшего понятия, он с такой-же легкостью справился-бы и генерировал бы отличные песни на инопланетном языке в их музыкальной системе, хотя мы и не могли бы ничего ему об этой системе рассказать. Понимаете в чем разница между миксингом, "генераторами нот" и этим сервисом? Мы можем его обучить на любых наборах данных, даже если мы сами не знаем каким образом они друг с другом связаны....

Единственный, прям существенный минус современных нейросетей, что они работают уже по факту обученными. И если хотите засунуть в него новую "фишку", нужно его "дообучать", затратив опять много процессорного времени. Обучение - реально трудозатратная операция. Делать это в реальном времени - очень сложно, и именно для этого компании разрабатывающие ИИ следующего поколения инвестируют триллионы долларов, чтобы получить системы которые будут обладать достаточными мощностями чтобы обучаться дальше "на ходу".

Опять-же если мы говорим о огромных моделях. Более компактные, специализированные, вполне уже сегодня до обучать в реальном времени. Архитектуры нейросетей совершенствуются каждый год, как и алгоритмы их обучения. Так что в принципе никаких особых ограничений получить ИИ который генерирует прям вот "творчество" нет. Проблема больше в подходах и инструментах. Было бы не очень если бы ChatGPT начал бы рассуждать о том что "хорошо бы убить всех людей", правильно?

Поэтому компании сами предпочитают использовать такие модели и архитектуры, которые дают не мегакреативный, но зато " предсказуемый и политически корректный, приятный для пользователя" результат. А не потому-что нельзя этого делать. Больше опасаются что результат выйдет из-под контроля, настолько необычными он может оказаться ) Будет вам генерить инопланетную музыку офигенной креативности, а вы скажете "а че это он какой-то шум непонятный мне выдает, где мой тыц-тыц...?". Такой ИИ компаниям, которые хотят заработать бабки, не нужен.

Энтузиасты на коленках с нейросетями делают чудеса, просто нужно немного быть в теме, а не только читать об ИИ на популярных сайтах. Море потрясающих ресурсов, уже 3д модели делают очень круто из картинки, буквально месяц назад новая какая-то прорывная штука у одного чел была, видел на ютубе, сейчас ссылку не припомню. Жду когда зарелизят, сразу бомба будет, чувствую, сразу говорить начнут везде. А глядишь за это время кто-то еще более крутую штуку уже запилил. Скорость развития просто потрясающая...Два года назад про генерацию музыки такого качества никто и подумать не мог. Генераторы нот, говорили они....

Оркестры... ну поищите там по фильтру classical music, полно всего, причем иногда аж у-х-х-х.
В топе например есть композиция: https://www.udio.com/songs/ocYMEPXWYkD19egp8ivZZJ

Т.е они всё таки миксуют, а не пишут сами?) И методы у них такие же как и у картиночных генераторов. А значит и все те же ограничения. Только как я уже писал, мелодии проще картинок в плане поиска закономерностей ввиду ограниченности возможных комбинаций нот. Не даром в современном мире музыки сплошные обвинения в плагиате.
Меня удивляет, что с современными технологиями проще было не нарезать миллионы семлов разных инструментов и через гсч миксовать их с поправками на мелодичность и некую структуру (хотя может и есть такие я не в курсе), а извлекать закономерности из целых композиций.
2024-07-17
GoodMan
Т.е они всё таки миксуют, а не пишут сами?) И методы у них такие же как и у картиночных генераторов. А значит и все те же ограничения. Только как я уже писал, мелодии проще картинок в плане поиска закономерностей ввиду ограниченности возможных комбинаций нот. Не даром в современном мире музыки сплошные обвинения в плагиате.
Меня удивляет, что с современными технологиями проще было не нарезать миллионы семлов разных инструментов и через гсч миксовать их с поправками на мелодичность и некую структуру (хотя может и есть такие я не в курсе), а извлекать закономерности из целых композиций.

Не миксуют, а ищут закономерности. Микс - это когда вы берете два фрагмента написанных человеком и соединяете их. Выделение закономерностей это другой процесс. У меня такое ощущение что вы просто не понимаете абсолютно принцип работы. Почитайте хотя-бы что-нибудь на эту тему, прежде чем критиковать. Сейчас вы мне напоминаете человека который "не читал, но осуждаю"...

И в этой вашей аналогии художник тоже миксует. Не только музыкант. Тут вот глаза, тут ухо, тут вот пинджак синий, с отливом, тут елка будет. Нет? И работа музыканта не проще чем работа художника, не нужно вот этих вот подмен. Изучите какой-нибудь томик по музыкальной гармонии (известный "бригадный" или Дубровского), книги по инструментоведению, особенности музыкальных жаноров, стилей и ответвлений. Например блюз, индийскую музыку. И попробуте после этого посочинять и записать. И еще попробуйте после этого быть "не таким как все". Это единицы могут производить что-то такое что не основано на тех данных на которых они были обучены, это тот самый 1% гениев, остальные по сути занимаются копированием, но это не мешает производить им хороший контнет и быть уважаемыми композиторами и музыкантами.

Даже какой-то прям креативный очень художник тоже миксует: Нарисую тут нос, только чтобы по форме как клюв и синий был, а вместо руки будет такая хреновина с лехвием. Что это? Не микс? Берет понятные ему термины и соединяет "чтоб было красиво". Абсолютно тот же принцип. Не может придумать человек то, чего не видел. В принципе не может. Все "креативные идеи" - это заимствования. Ну вместо носа руку нарисует, ну лицо вместо обычного цвета синим сделает. Но все те-же понятия которым он обучен "лицо", "нос", "рука", "синий". Ничего нового абсолютно. И что, мешает это? Дали вот гений или нет? Что нейросеть не может нарисовать слона с длинными кривыми ногами или изогнутые часы? И для этого ее не нужно обучать на работах Дали, уж поверьте мне.

То что нейросеть какие-то вещи не улавливает - значит специально ее этому не обучали. Если бы Дали не видел никогда в жизни слонов, он вряд-ли их изобразил в своей известной картине, были бы какие-нибудь известные ему коровы. Тоже, собака, миксует...
2024-07-17
Дмитрий Волоснихин
Не миксуют, а ищут закономерности. Микс - это когда вы берете два фрагмента написанных человеком и соединяете их. Выделение закономерностей это другой процесс. У меня такое ощущение что вы просто не понимаете абсолютно принцип работы. Почитайте хотя-бы что-нибудь на эту тему, прежде чем критиковать. Сейчас вы мне напоминаете человека который "не читал, но осуждаю"...

И в этой вашей аналогии художник тоже миксует. Не только музыкант. Тут вот глаза, тут ухо, тут вот пинджак синий, с отливом, тут елка будет. Нет? И работа музыканта не проще чем работа художника, не нужно вот этих вот подмен. Изучите какой-нибудь томик по музыкальной гармонии (известный "бригадный" или Дубровского), книги по инструментоведению, особенности музыкальных жаноров, стилей и ответвлений. Например блюз, индийскую музыку. И попробуте после этого посочинять и записать. И еще попробуйте после этого быть "не таким как все". Это единицы могут производить что-то такое что не основано на тех данных на которых они были обучены, это тот самый 1% гениев, остальные по сути занимаются копированием, но это не мешает производить им хороший контнет и быть уважаемыми композиторами и музыкантами.

Даже какой-то прям креативный очень художник тоже миксует: Нарисую тут нос, только чтобы по форме как клюв и синий был, а вместо руки будет такая хреновина с лехвием. Что это? Не микс? Берет понятные ему термины и соединяет "чтоб было красиво". Абсолютно тот же принцип. Не может придумать человек то, чего не видел. В принципе не может. Все "креативные идеи" - это заимствования. Ну вместо носа руку нарисует, ну лицо вместо обычного цвета синим сделает. Но все те-же понятия которым он обучен "лицо", "нос", "рука", "синий". Ничего нового абсолютно. И что, мешает это? Дали вот гений или нет? Что нейросеть не может нарисовать слона с длинными кривыми ногами или изогнутые часы? И для этого ее не нужно обучать на работах Дали, уж поверьте мне.

То что нейросеть какие-то вещи не улавливает - значит специально ее этому не обучали. Если бы Дали не видел никогда в жизни слонов, он вряд-ли их изобразил в своей известной картине, были бы какие-нибудь известные ему коровы. Тоже, собака, миксует...

Как раз я прекрасно понимаю что значит миксовать. Это взять готовое - обработать (диффузией или чем-то другим) и слепить с другим готовым, тоже предварительно обработанным. Не на прямую, а посредством такой обработки сотен миллионов заготовленных (людьми!) готовых решений (композиций, картинок и т.п.), выявивь общие паттерны и закономерности.
Поэтому всё что могут сети основанные на таком методе это миксовать уже существующее, предварительно обработав их своим способом. Но не сделать своё. Именно поэтому они ограничены обучающим набором и за его рамки выйти не могут.
Я уже приводил пример для картинок и их невозможности рисовать тех же людей с(или без) опр. частей тела, т.к. им их заранее не скормили. Тоже будет с музыкой. В этом основное наше отличие - люди способны придумавать то, чего не видели или не слышали, а сети - не могут.
Как не сможет даже последний ГПТ, обладающий "знаниями" всех учёных мира найти лекарство от рака (иначе бы уже давно нашёл - ведь там такие мощности), или решить проблему несовместимости общей теории относительности с квантовой механикой на разных маштабах, выдвинув свою новую теорию.

P.S. Чтобы вы понимали - для меня все эти генеративные сети, это по сути сложные механизмы по обработке и ситематизации информации. Именно поэтому я критически отношусь ко всем этим крикам о революции на пороге и т.п. И не воспринимаю это как революцию вообще. Новое и уникальное в обработке данных - возможно, но более. Зато хайпа развели...
P.P.S. Я никогда не видел человека с ногой, вместо руки или с пятью ушами и тремя глазами одновременно (доказать не смогу, но уж поверьте)). А нарисовать смогу, в рамках моих способностей )) Я круче нейросети! ))
2024-07-18
ИИ годится для быстрого решения шлак задач - типа нарисовать рекламный баннер. С этим они неплохо справляются. И качество очень даже не плохое. Конечно потребуется частичная правка, но вы выиграете время, а результат вполне себе годный для некритических задач. А эти типа рисунки девушек. Если бы это были реальные роботы которых еще можно потрогать, а то картинки.... Да тьфу на вас.
2024-07-25
GoodMan
Как раз я прекрасно понимаю что значит миксовать. Это взять готовое - обработать (диффузией или чем-то другим) и слепить с другим готовым, тоже предварительно обработанным. Не на прямую, а посредством такой обработки сотен миллионов заготовленных (людьми!) готовых решений (композиций, картинок и т.п.), выявивь общие паттерны и закономерности.

P.P.S. Я никогда не видел человека с ногой, вместо руки или с пятью ушами и тремя глазами одновременно (доказать не смогу, но уж поверьте)). А нарисовать смогу, в рамках моих способностей )) Я круче нейросети! ))

В то время, пока вы не можете сделать нормальные пальцы..
2024-07-25
Не впечатляет)
2024-07-25
Дмитрий Волоснихин
В то время, пока вы не можете сделать нормальные пальцы..

Как то так)
RENDER.RU