УДК 004.8

Сравнение эффективности средств автоматизации практических задач дизайнера

Акатьев Ярослав Алексеевич – ассистент кафедры Практической и прикладной информатики МИРЭА – Российского технологического университета.

Верховод Никита Сергеевич – студент МИРЭА – Российского технологического университета.

Морозова Ирина Олеговна – студентка МИРЭА – Российского технологического университета.

Аннотация: В данной статье исследуется применение средств автоматизации практических задач дизайнера. В ходе работы рассматриваются процессы, выполняемые дизайнером и технологии, которые автоматизируют его деятельность на каждом этапе, формируется сравнительная таблица и предлагаются комплексные методы работы со средствами автоматизации.

Ключевые слова: средства автоматизации, искусственный интеллект, дизайнер, креативность, автоматизация.

Что делают современные люди, когда хотят узнать что-то новое? Заходят в поисковую систему. Если посмотреть рейтинги посещений сайтов в интернете, то можно заметить, что первым всегда является google.com[1]. С помощью него, можно узнать большинство интересующей информации. Однако процесс поиска и анализа информации занимает много времени, для его ускорения существует большое количество сервисов с различным функционалом и областями применения. 

Помимо агрегаторов, свою популярность набирают нейросети, они могут собирать информацию, выбирать и выдавать только нужную. Сейчас уже существует популярный и эффективный инструмент – chatGPT, на основе которого создано множество сайтов и ботов.

Помимо поиска нужной информации у пользователей появилась еще одна потребность – выполнение работы в цифровой среде. Для многих сфер переход в онлайн-пространство провел настоящую революцию, компании смогли автоматизировать огромное количество бизнес-процессов и укорить время предоставления услуг. Одной из таких профессий, на которую интернет и нейросети оказали огромное влияние, является дизайнер.

У современного интернет художника есть множество обязанностей, которые он должен уметь выполнять, будь то работа с шрифтами, логотипами, колористикой и многим другим. Все задачи можно выполнять вручную, но будет страдать скорость и креативность – человек сохраняет в подсознании уже увиденные примеры и паттерны, и неосознанно повторяет их. У электронных средств таких проблем нет; идеи, увиденные последними, не влияют на результат работы.

Для обеспечения наиболее эффективного процесса работы дизайнера, необходимо рассмотреть основные его задачи, и понять, какое средство автоматизации будет наилучшим.

Процесс начинается с проведения исследования и анализа целевой аудитории, рынка и конкурентов. Дизайнер изучает тренды, анализирует потребности клиентов и собирает информацию, необходимую для создания эффективного дизайна.

Для задач такого типа лучше всего подходят технологии обработки естественного языка (Natural Language Processing). NLP-технологии могут использоваться для анализа текстового контента, такого как обзоры пользователей, комментарии или отзывы о продуктах или услугах. Это может помочь для извлечения полезной информации о предпочтениях и мнениях целевой аудитории.

На российском рынке стремительно развивается YandexGPT. Нейросеть обладает обширными знаниями о мире, обучена на сотнях тысяч материалах наиболее полезных книг, сайтов, статей. Для российского дизайнера в контексте проведения исследования и анализа данная нейронная сеть обладает несомненным преимуществом, ввиду актуальности источников обучения.

С другой стороны, для вдохновения и исследования трендов в мире дизайна можно использовать агрегатор Muzli 2, который непрерывно собирает информацию с более 150 социальных медиа-платформ и позволяет найти похожие дизайн проекты. Такие сервисы помогают найти вдохновение и понять, какие идеи коллеги используют в своих работах и какие стилевые решения сейчас в тренде. Однако данный подход, больше используется начинающими специалистами, ввиду легкости поиска готового результата, нежели создания своего собственного.

Следующим этапом является разработка концепции и идей: дизайнер работает над созданием визуальных концепций, выбором цветовой палитры и других элементов дизайна, чтобы передать заданные заказчиком посыл и эмоции.

Подбор цветовой палитры является важным этапом проектирования, который помогает установить общий визуальный стиль и создать целостность проекта. Одним из популярных решений на рынке является Khroma[9]. Это генератор комбинаций цветов на основе искусственного интеллекта, который использует выбранные пользователем цвета и тысячи цветовых палитр, созданных людьми, из разных источников в интернете.

Для генерации персонализированного списка комбинаций цветов сначала необходимо выбрать 50 цветов на веб-сайте Khroma, тем самым обучив нейросеть. Можно просматривать их как градиент, палитру, типографику и изображение. Также можно открывать новые комбинации, искать их и создавать свою персонализированную коллекцию. Кроме того, есть возможность загрузки собственных изображений для проверки сочетания с уже подобранной цветовой палитрой.

Khroma использует алгоритм расстояния между цветами deltaE для экстраполяции 9000 не понравившихся и понравившихся цветов в соотношении 5:1, которые затем обучают локальную нейронную сеть прямого распространения. Результатом является точность обучения в диапазоне от 96% до 99%.

Khroma также имеет два других алгоритма машинного обучения: один для сопоставления двух цветов и другой для сопоставления четырех цветов, оба обучены на выборке из более чем 2000 популярных цветовых палитр. Причина, по которой они представлены в виде двух отдельных алгоритмов, заключается в том, что для алгоритма сопоставления двух цветов требуется ограничение на минимальный контраст.

Создание и редактирование шрифтов – это творческий процесс, требующий определенного набора навыков, знаний и опыта. Однако, применение нейросетей и сайтов может упростить этот процесс и помочь дизайнеру создавать шрифты быстрее и более эффективно. Существует несколько подходов, которые могут быть использованы при автоматизации создания и редактирования шрифтов. Рассмотрим наиболее важные из них.

  1. Использование генеративных нейронных сетей.

Технология генеративных нейронных сетей может быть использована для автоматизированного создания новых шрифтов из набора данных. В этом случае, нейросеть может обучаться на основе большого количества существующих шрифтов и создавать новые, ранее невиданные формы символов. Примером такой нейросети является проект deep-fonts [4], она позволяет автоматически создавать шрифты, и дизайнер может использовать один из них.

  1. Автоматизация редактирования шрифтов.

Существует несколько способов редактирования шрифтов, при которых можно использовать нейросети. Например, можно обучить нейросеть для автоматического исправления ошибок в шрифте, для изменения размера или стиля шрифта, для улучшения качества глифов, добавления новых символов и т.д. Примером является сервис fontMap, который позволяет сравнивать шрифты с уже существующими, и использовать наработки других дизайнеров для улучшения шрифтов.

  1. Использование сайтов с примерами.

Сайты с примерами могут помочь дизайнеру быстрее и эффективнее создавать шрифты. Такие сайты могут предоставлять пользователю доступ к большой базе данных шрифтов, которые могут быть использованы для исследования различных стилей и форм. Примером такого сайта является fonts-online – сервис с 94108 шрифтами, которые можно выбирать по категориям.

Кроме того, в основные задачи дизайнера входит работа с графикой – создание логотипов, иллюстраций, веб-дизайна, рекламных материалов и других визуальных компонентов проекта.

Генеративные нейронные сети являются достаточно универсальными и могут создавать не только шрифты, как было упомянуто выше, но и всевозможные изображения.

Например, Midjourney может преобразовывать текстовые запросы на естественном языке в высококачественные изображения. Он является одним из множества генераторов изображений, основанных на машинном обучении, которые появились в последнее время. Несмотря на это, он стал одним из крупнейших нейросетей вместе с DALL-E и Stable Diffusion. [7]

Самое главное с точки зрения дизайна – Midjourney хорошо работает с логотипами. Работы не всегда получаются идеальными, но как идеи и эскизы они просто гениальны. Midjourney создает изображения всего за 20-40 секунд [8], в то время как раньше создание одного логотипа на холсте могло занимать месяцы, а работа в графических редакторах неделю.

Midjourney основан на двух относительно новых технологиях машинного обучения, а именно на больших языковых моделях и моделях диффузии. Большая языковая модель помогает Midjourney понять смысл вводимых пользователем запросов. Затем это преобразуется в так называемый вектор, который можно представить как числовую версию запроса. Наконец, вектор направляет другой сложный процесс, известный как диффузия.

Модель диффузии стала популярной только в последнее десятилетие, что объясняет внезапное появление генераторов изображений на основе искусственного интеллекта. В модели диффузии компьютер постепенно добавляет случайный шум к обучающему набору изображений. Со временем он учится восстанавливать исходное изображение, обратившись к шуму. После достаточного обучения модель может генерировать совершенно новые изображения, удаляя шум с случайного изображения.

Как это выглядит с точки зрения генератора изображений на основе искусственного интеллекта? Когда вы вводите текстовый запрос, например, «белые кошки в постапокалиптическом Таймс-сквер», вначале генератор создает поле визуального шума. Можно сравнить этот первый шаг с шумом на телевизионном экране. На этом этапе изображение не похоже ни на что. Однако обученная модель искусственного интеллекта может использовать латентную диффузию для постепенного устранения шума. В результате будет получено изображение, которое напоминает объекты и идеи из реального мира.

Таким образом, исследовав возможности рынка, была составлена сравнительная таблица, отражающая возможности проанализированных средств автоматизации для деятельности дизайнера.

Таблица 1. Сравнительная таблица возможностей средств автоматизации в деятельности дизайнера.

ИИ

Процесс

YandexGPT

Muzli 2

Khroma

deep-fonts

fontMap

fonts-online

Midjourney

Анализ и исследование рынка

+

+

-

-

-

-

-

Разработка концепций и идей

+

+

+

-

-

-

-

Создание шрифтов

-

-

-

+

+

+

+

Работа с графикой

-

+

-

-

-

-

+

По результатам сравнительной таблицы видно, что ни одна система полностью не закрывает все потребности дизайнера, поэтому было разработано 2 сочетания систем, которые помогут сделать готовый проект.

«Легкая» – системы для начинающих специалистов. Основным упором будет заимствование готовых идей у других, более профессиональных дизайнеров. Для анализа и исследования рынка, разработки концепций и идей, работы с графикой новичкам стоит использовать Muzli 2. Сервис поможет сделать качественную работу, опираясь на уже существующие решения. Для создания шрифтов стоит использовать fonts-online. С его помощью дизайнер может легко подобрать уже созданные шрифты, даже с первой страницы каталога.

«Продвинутая» – системы для продвинутых дизайнеров. Основным упором будет реализация собственных идей и создание уникальных дизайн-проектов. Для этой цели системы с готовыми работами из «легкого» сочетания рассматриваться не будут. Первоначально нужно провести аналитику и разработку концепции с помощью YandexGpt, которая может сгенерировать описание, что нужно проекту для успеха. После корректировки описания, с его помощью провести генерацию шрифта и графики в MidJourney. При возникновении несоответствий с реальными пожеланиями, следует использовать Khroma для графики и deep-fonts для шрифтов.

Одно из возможных средств автоматизации не подошло ни под какое сочетание систем. fontMap слишком сложна для начинающих специалистов, и слишком опирается на готовые решения для продвинутых специалистов.

Подводя итоги, можно сделать вывод, что использование автоматизированных инструментов значительно повышает производительность и точность в выполнении задач дизайна. Особенно полезными оказались инструменты, основанные на технологиях искусственного интеллекта, такие как генеративные модели и алгоритмы обработки изображений. Они позволяют дизайнерам сократить время на рутинные задачи и сосредоточиться на более творческой и стратегической работе. Однако, несмотря на преимущества автоматизации, важно подчеркнуть, что роль дизайнера остается незаменимой в создании уникальных и инновационных дизайнерских решений. Таким образом, использование средств автоматизации в дизайне является мощным инструментом, который может значительно улучшить процесс работы дизайнера и ускорить достижение желаемых результатов.

Список литературы

  1. Рейтинг «Топ-50 самых посещаемых веб-сайтов в мире» [Электронный ресурс] URL: https://www.visualcapitalist.com/top-50-most-visited-websites/ (Дата обращения: 17.05.2023).
  2. Статья «12 нейросетей для нейминга, создания текста, заголовков, картинок, логотипов и видео» [Электронный ресурс] URL: https://news.pressfeed.ru/12-nejrosetej-dlya-nejminga-sozdaniya-teksta-zagolovkov-kartinok-logotipov-i-video/ (Дата обращения: 24.05.2023).
  3. Статья «Анализ 50 тысяч шрифтов с использованием глубоких нейронных сетей» [Электронный ресурс] URL: https://erikbern.com/2016/01/21/analyzing-50k-fonts-using-deep-neural-networks (Дата обращения: 25.05.2023).
  4. Deep-fonts [Электронный ресурс] URL: https://github.com/erikbern/deep-fonts (Дата обращения: 26.05.2023).
  5. Статья «Нейросетевые инструменты для дизайна и разработки» [Электронный ресурс] URL: https://gb.ru/posts/neural_network_design_instruments (Дата обращения: 23.05.2023).
  6. Официальный сайт "fonts-online" [Электронный ресурс] URL: https://fonts-online.ru/ (Дата обращения: 27.05.2023).
  7. Статья «Что такое Midjourney AI и как он работает?» [Электронный ресурс] URL: https://www.androidauthority.com/what-is-midjourney-3324590/ (Дата обращения: 26.05.2023).
  8. Статья «Как Midjourney перевернул игру в дизайне: наглядное пособие?» [Электронный ресурс] URL: https://vc.ru/marketing/607338-kak-midjourney-perevernul-igru-v-dizayne-naglyadnoe-posobiehttps://vc.ru/marketing/607338-kak-midjourney-perevernul-igru-v-dizayne-naglyadnoe-posobie (Дата обращения: 24.05.2023).
  9. Официальный сайт "Khroma" [Электронный ресурс] URL: https://www.khroma.co/ (Дата обращения: 25.05.2023).
  10. Репозиторий с исходным кодом "YaLM-100B" [Электронный ресурс] URL: https://github.com/yandex/YaLM-100B (Дата обращения: 28.05.2023).

Интересная статья? Поделись ей с другими: