21.04.2024
Читалка

Fantom творчества. Способен ли искусственный интеллект на вдохновение?

Публикуем фрагмент из книги математика и популяризатора Маркуса дю Сотой «Нейросеть разумная...»

Фрагмент из книги Маркуса дю Сотоя «Нейросеть разумная: Как искусственный интеллект осваивает человеческие навыки, творит, думает и учится» / azbooka.ru
Фрагмент из книги Маркуса дю Сотоя «Нейросеть разумная: Как искусственный интеллект осваивает человеческие навыки, творит, думает и учится» / azbooka.ru

Текст: Андрей Васянин

Маркус дю Сотой — британский математик, профессор математики Оксфордского университета, занимающийся теорией групп и теорией чисел. И еще – пишущий книги о связях между математическими формулами, искусством и природой – «О том, чего мы не можем знать», Finding Moonshine («В поисках фантазии»), The Music of the Primes («Музыка простого числа»)...

В «Нейросети разумной ...» Маркус дю Сотой раздумывает о том, имеет ли искусственный интеллект, при всех своих нынешних возможностях расширить творческий потенциал человечества, то, что автор называет «кодом творчества» – способность создавать произведения искусства, которые возвышают, расширяют и преобразуют самую суть человека? Вопрос спорный, но надо учитывать, что возможности ИИ постоянно расширяются – и того и гляди машина узнает, что значит быть человеком, то есть расшифрует этот самый «код». И не приведет ли это к тому, что произведения искусства будут создаваться не только людьми?

Публикуем фрагмент из книги математика и популяризатора.

Маркус дю Сотой «Нейросеть разумная: Как искусственный интеллект осваивает человеческие навыки, творит, думает и учится»

  • Перевод с англ. Д. А. Прокофьева
  • Издательство: М. : КоЛибри, Азбука-Аттикус, 2024

Квантовая композиция

Один из центральных аспектов художественного творчества заключается в идее, что художник создает произведение, которое должно затронуть множество разных людей, которые его увидят, услышат или прочтут. Но у всех слушателей разные вкусы, ожидания и настроения. А что, если можно было бы создавать произведения, переворачивающие эту концепцию «одного для многих», — идти от многих работ к одному человеку? Наши смартфоны собирают большое количество информации о нас. Нельзя ли использовать всю эту информацию для создания произведений искусства «по индивидуальной мерке»? Именно этим путем решила пойти рок-группа Massive Attack. После вышедшего в 2010 году альбома Heligoland музыканты долгое время не выпускали ничего нового, пока, в начале 2016 года, у них не вышли четыре новые песни, которые группа решила выпустить новым и необычным способом. Ее поклонники могли прослушать эти композиции, только скачав новое, специально разработанное приложение под названием Fantom. Дальше начиналось самое интересное: слушатель разрешал приложению доступ к информации о своем местоположении, времени суток, текущих изображениях видеокамеры, частоте пульса и ленте сообщений в твиттере, и алгоритм решал, как именно следует воспроизводить композиции для данного пользователя.

По сути дела, алгоритм Massive Attack играл в усложненный вариант моцартовских музыкальных костей. Оригинальная композиция разбивается на мини-композиции, которые можно использовать в качестве сырья для создания новых, индивидуализированных пьес. В каждой точке развития такой новой песни принимаются решения о том, какую именно мини-композицию нужно добавить следующей и как она будет смикширована. На эти решения влияют данные, которые алгоритм получает от конкретных пользователей. Если у слушателя высокий пульс, он быстро перемещается, а камера регистрирует яркие цвета, эта информация повлияет на настроение и фактуру той песни, которую он услышит.

Тонкость состоит в создании дерева возможностей, достаточно богатого и разнообразного, но в то же время достаточно согласованного, чтобы результат казался логичным и естественным, какой бы путь развития ни выбрал алгоритм. Здесь нельзя полагаться на абсолютную случайность. Моцарт тщательно подбирал каждый такт, чтобы предложить 11 вариантов, каждый из которых было бы логично использовать в качестве следующего такта вальса. Общая структура вальса задает правила, в рамках которых можно играть в эту игру. То же справедливо и в отношении алгоритма Massive Attack. Было бы неприятно, если бы припев неожиданно начинался посреди очередного куплета.

Роб Томас, программист, участвовавший в создании этого приложения, изящно назвал результат этой работы «квантовой композицией». В квантовом мире электрон может находиться в одно и то же время во многих разных местах благодаря явлению так называемой квантовой суперпозиции. Редукция (или коллапс) электрона в одно из множества возможных состояний вызывается актом наблюдения. По мнению Томаса, идея состояла в создании композиции, которая может существовать во многих возможных состояниях. Когда я решаю прослушать эту композицию, алгоритм берет мои данные и выбирает, как именно должна произойти редукция «волновой функции» группы Massive Attack в одну-единственную песню, которую я услышу.

Томаса интересует диалог между нашими эмоциональными состояниями и той музыкой, которую мы слушаем, а также то влияние, которое они оказывают друг на друга. «Музыка — это инструмент эмоциональной манипуляции, — говорит он. — Я хочу узнать, как можно использовать эту музыкальную тактику для создания у тех, кто слушает музыку, того или иного эмоционального состояния». Сейчас он исследует применение музыки, созданной искусственным интеллектом, в приложениях развития осознанности для ввода в медитативное состояние. Принцип состоит в следующем: музыка реагирует на данные о текущем состоянии разума и тела, пытаясь привести организм в состояние расслабленного покоя. Разумеется, как признает Томас, чтобы получить самое действенное средство для манипуляции эмоциями, на самом деле нужно создать человека. «Есть гораздо более простые и приятные способы производить людей, чем применение искусственного интеллекта», — заключает он со смехом.

Приложению Fantom требуется музыкант, способный подобрать составные элементы композиций. Но участники Massive Attack сознают, что машинное обучение дает возможность создавать гораздо более органичные деревья возможных вариантов развития. В следующем проекте группа собирается позволить машине создавать свои собственные варианты композиций. Роб Томас работает над этим новым этапом вместе с Миком Грирсоном из колледжа Голдсмит Лондонского университета.

Грирсон тесно сотрудничает с авангардной исландской рок-группой Sigur Rós. Он взял одну из песен этой группы под названием Óveður и продлил ее, создав вариант длительностью 24 часа, который ни разу не повторяется, но сохраняет звучание исходной пятиминутной композиции. Эта двадцатичетырехчасовая пьеса была предназначена для поездки вокруг всей Исландии, которая снималась на телекамеры и была показана на исландском государственном телеканале. Путешествие, задуманное в стиле новомодного «медленного телевидения», началось накануне летнего солнцестояния 20 июня 2016 года. Авторы фильма проехали 1332 км, продвигаясь против часовой стрелки по прибрежному исландскому шоссе № 1. По пути они проехали мимо крупнейшего в Европе ледника Ватнайёкюдль, покрытой льдом лагуны, Восточных фьордов и безотрадных черных песков долины Мёдрудалур.

Создание двадцатичетырехчасового музыкального сопровождения без повторений было бы трудной и затратной задачей для композитора-человека. Программное обеспечение, разработанное Грирсоном, создает музыку, соответствующую изображениям, которые она сопровождает, при помощи вероятностных инструментов. Впоследствии Грирсон создал еще более длинный вариант той же песни: эта композиция может играть вечно, ни разу не повторяясь. Когда группы Massive Attack и Sigur Rós распадутся, такие алгоритмы позволят нам слушать все новые и новые варианты их композиций столько, сколько мы захотим.

Брайан Ино пустил в оборот термин «генеративная музыка», описывающий постоянно изменяющуюся музыку, создаваемую системой или алгоритмом. Ино любит говорить, что эта музыка мыслит самостоятельно. Это своего рода музыкальный сад, в котором композитор засевает семена, а в результате взаимодействия алгоритма с внешним миром — когда человек играет в компьютерную игру или занимается повседневными делами, — из этих семян вырастает сад звуков. В некоторых отношениях та же идея используется в концертных выступлениях: переход от нот на бумаге к живому исполнению каждый раз производит нечто новое и уникальное. Ино хотел развить эту идею еще дальше. Его приложения — например, Bloom или Scape или же последняя его разработка, Refl ection, созданная в сотрудничестве с Питером Чилверсом, — выдают бесконечную музыку в стиле Ино, которая создается в результате взаимодействия пользователей с экранами смартфонов. Сам он говорит, что процесс ее создания подобен наблюдению за рекой: «Река остается той же, но все время меняется».

Ино активно использует в своем творчестве новые технологии, но не верит, что алгоритмы, с которыми он работает, когда-нибудь смогут произвести нечто большее того, что заложили в них их создатели. «В них уже заложено множество замыслов и множество уже принятых эстетических решений. Когда кто-нибудь берет их и создает с их помощью музыкальное произведение, он создает его в сотрудничестве с нами».

В 2016 году алгоритм под названием AIVA стал первой программой, которую признало композитором Общество авторов, композиторов и издателей музыки (Société des auteurs, compositeurs et éditeurs de musique, SACEM), французская организация, занимающаяся авторскими правами. Этот алгоритм, созданный братьями Пьером и Венсаном Барро, объединил машинное обучение с нотами произведений Баха, Бетховена, Моцарта и других композиторов и создал композитора с искусственным интеллектом, который сочиняет свою собственную, уникальную, музыку. Хотя сейчас он пишет музыкальные темы для компьютерных игр, целится он гораздо выше: «Оставить след в неподвластной времени истории музыки». Когда я слушал первый альбом AIVA, выпущенный под вполне уместным названием Genesis, мне показалось, что Баху и Бетховену пока не о чем беспокоиться. Но, как намекает название, это лишь начало музыкальной революции искусственного интеллекта.