«Нейросети и человек работают в тандеме»: как Fix Price использует нейросети для работы с контентом
Генерация изображения для упаковки, персонализация писем и создание раскадровок — какие задачи способны решать нейросети в ретейле, в колонке для AdIndex рассказала директор по коммуникациям Fix Price Екатерина Гончарова
Как появилась идея использовать нейросети
Мы начали использовать нейросети в 2022 году, когда они начали набирать популярность как источник контента. В первую очередь было интересно попробовать, как искусственный интеллект может помочь именно в нашей работе — создании аудио и видеоконтента. Изучать нейросети начали с ChatGPT и Midjourney, чуть позже стали использовать отечественную разработку Kandinsky.
Во внутренних коммуникациях есть потребность в большом количестве однообразного контента, который при этом не может быть одинаковым — например, дайджесты с новостями компании, персональные или общие поздравления. Мы попробовали использовать нейросети для этой задачи, но результат казался не самым успешным: сгенерированные тексты и изображения были достаточно примитивны и требовали значительной доработки. На тот момент многие продукты находились в фазе бета-теста.
Но в целом опыт оказался интересным, и уже в 2023 году мы стали использовать искусственный интеллект для маркетинговых задач: в частности, для создания рекламных баннеров и email-рассылки, в видеопродакшене и в меньшей степени — для социальных сетей.
Какие нейросети мы используем и для чего
Сегодня мы работаем с ChatGPT, Adobe Podcast Beta, Generative Fill в Photoshop и Kandinsky. Планируем работать и с Midjourney – качество генерируемых изображений в последнее время там стало очень высоким. Кстати, мы уже напечатали упаковку одного из продуктов с использованием дизайна от искусственного интеллекта.
ChatGPT используем для рерайта: это новые текстовые формулировки, персонализация писем, генерация описаний карточек товаров. Например, время ограничено, и нужно быстро получить большое количество вариантов озвучки видеороликов. Это не творческая работа, поэтому нейросеть с ней отлично справляется. В итоге мы получаем 6–8 единиц текста, дорабатываем его, озвучиваем и переходим к следующей нейросети.
Adobe Podcast Beta — нейросеть, которая занимается очисткой и подготовкой звука. То, что раньше мы делали в Аudition и то, что занимало у монтажера значительное время, программа делает намного быстрее: если раньше для подобной работы вручную требовалось около 10 минут, то сейчас результат мы получаем в течение 20-30 секунд. Конечно, нейросеть еще находится в beta-версии, но уже сейчас дает результат, который в 80 процентах случаев нас устраивает.
Позже появился Generative Fill в Photoshop. С его помощью мы можем дорисовывать фон, создавать отдельные элементы статичной анимации в своих социальных сетях и рассылках. Мы можем анимировать объекты, добавить их в гифку, поменять фон и быстро убрать лишнюю информацию. Получается гораздо быстрее и аккуратнее, чем вручную. Инструмент позволяет создавать неограниченное количество анимаций: всегда можно выбрать что-то, а потом доработать. Таким образом мы генерируем GIF-анимации для рассылок или для соцсетей. Кроме того, Generative Fill незаменим в видеопроизводстве при подготовке различных форматов вещания (например, когда съемку нужно переформатировать). Словом, нейросети оказались очень востребованы и полезны для создания видеоконтента.
Также мы используем Kandinsky — например, для раскадровки сцены. Он прост в работе и хорошо понимает запросы на русском языке.
В будущем планируем активно применять ИИ и при работе с изображениями – например, TOPAZ AI, Retouch4me улучшают качество изображения в пикселях, ускоряют процесс ретуши, что актуально нам при работе с рекламой и упаковкой.
Пример работы Generative Fill в Photoshop
Генерация gif
Генерация фонов
Итоги использования нейросетей и нюансы
Темп развития технологий не позволяет прийти к какому-то финальному выводу: то, что мы знаем сегодня, может безнадежно устареть завтра. Но сегодня мы видим как минимум три полезных эффекта от использования нейросетей в работе.
Оптимизация временных затрат. В среднем на задачи, которые выполняет нейросеть, мы тратим минимум вдвое меньше времени, чем при работе «вручную». Больше всего удалось оптимизировать временные затраты на создание видеоконтента: мы не тратим время на досъемку или пересъемку, например, если необходимо поменять формат видео с вертикального на горизонтальный.
Количество контента. Тот объем контента, который мы можем получить, близок к бесконечному. Мы можем менять запрос и дорабатывать его в соответствии с разными потребностями и брифом. Таким образом удается генерировать большое количество макетов, текстов для озвучки, баннеров.
Развитие горизонтальных связей. Внедрение нейросетей — это всегда командная работа, здесь важен совместный творческий подход. Чтобы в конечном результате получить материал, который можно было бы использовать в качестве рекламы, нужен значительный объем работы. В тандеме работают коллеги из разных отделов. Разумеется, такая деятельность хорошо сказывается на связях в команде.
Глобально то качество контента, который делают нейросети, пока оставляет желать лучшего: использовать генерации без ручной доработки пока не получается. Например, мы не можем позволить себе выложить баннер с нашим амбассадором с десятком пальцев на одной руке. С другой стороны, иногда такие ошибки тоже идут на пользу: например, недавно в соцсетях вирусилось видео, в котором фигурировал сгенерированный баннер со странным количеством пальцев у инфлюенсера. Такие истории привлекают дополнительное внимание, и узнаваемость компании растет.