Почему возможности Big Data не используются: мнение экспертов
О Data Science говорят повсеместно: бестселлер Сета Стивенса-Давидовица о секретах пользователей сети, которые раскрывает Big Data, стал книгой года по мнению редакции The Economist, специалисты по анализу больших данных стабильно входят в топ лучших профессий по версии Glassdoor в США и Великобритании, а руководители компаний, в том числе российских, все чаще обращаются к data-driven маркетингу. Но согласно результатам опроса, опубликованным Forbes Insights и Treasure Data, потенциал Big Data используется далеко не в полной мере. Редакция AdIndex узнала у экспертов, в чем могут быть причины и почему рекламистам непросто работать с большими данными
Несколько лет назад технологии анализа Big Data были актуальны в основном только для крупных компаний, обладавших техническими и финансовыми возможностями наладить сложную систему работы с большими данными. Сегодня же машинное обучение и data analysis вполне доступны представителям среднего и малого бизнеса. Уже в прошлом году, по данным SMB, 57% компаний, которые относятся к малому бизнесу, использовали Big Data при разработке решений для роста предприятий.
Государственные структуры также внедряют в свои процессы автоматизированные подходы. При поддержке Минздрава РФ «Национальная база медицинских знаний» создаст единого оператора биомедицинских данных граждан. Генпрокуратура заявила о стремлении интегрировать инструменты обработки больших данных к 2025 году, стоимость проекта оценивается в 4,5 млн рублей. Центробанк подключается к диджитализации банковского сектора, обращаясь к регтеху (Regulation Technologies) и принципу KYD (Know Your Data).
В бизнесе к анализу больших данных прибегают, как правило, для создания детального портрета аудитории и, соответственно, для разработки и корректировки маркетинговых и коммуникационных стратегий. Множество кейсов data-driven кампаний доказывают реально существующую корреляцию между подобной работой с Big Data и уровнем прибыли. Тем не менее, далеко не все компании и маркетологи умеют эффективно работать с большими данными. Только 13% руководителей, по данным глобального исследования Forbes Insights и Treasure Data, удовлетворены тем, как используются возможности Big Data.
Forbes Insights и Treasure Data провели опрос 400 руководителей в области маркетинга из компаний с годовым доходом более $1 млрд и обнаружили, что, хотя 78% респондентов обращаются к Customer Data Platform для анализа данных, большинство компаний только начинают осознавать потенциал Big Data. При этом 73% маркетологов предпочитают комплексный подход к сбору и обработке данных. Согласно этому же опросу, технологиям геймификации доверяют 68%.
Опрошенные маркетологи дали оценку эффективности анализа Big Data в своих организациях, в соответствии с ней компании в исследовании были разделены на две категории — «лидеры» и «аутсайдеры». Первые добиваются неплохих финансовых показателей: 26% компаний, которые эффективно, по их словам, используют Big Data, имеют прирост выручки свыше 10%. Из группы «аутсайдеров» подобные показатели доходов показывают лишь 8% компаний.
Эксперты полагают, что ключевой причиной, почему ряд компаний не достигает желаемых результатов при использовании Big Data, может быть то, что в большинстве случаев исключительно руководители имеют доступ к данным. 81% респондентов заявили, что именно топ-менеджеры в их компаниях непосредственно работают с Big Data при формировании бизнес-стратегий, и только 26% участников опроса отметили, что подчиненные также работают с большими данными.
Кроме того, остаются актуальными и прочие вызовы, с которыми сталкиваются компании: дефицит специалистов в области Data Science, погрешность анализа, необходимость перестройки внутренних бизнес-процессов. Представители даже тех компаний, которые считают работу с Big Data приоритетной для развития, признаются в недостаточном уровне экспертизы. Только 43% опрошенных признались, что могут сегментировать аудитории, и лишь каждый четвертый считает, что может в полной мере использовать все доступные данные.
Однако около половины маркетологов, принявших участие в опросе, хотели бы иметь возможность принимать решения в режиме реального времени на основе анализа данных о клиентах. Менеджеры, по их словам, стремятся к такой модели data-driven бизнеса, когда практически каждый сотрудник имеет определенные навыки аналитики и вовлечен в процесс оценки Big Data. Об этом сообщили 47% участников опроса. Тем не менее, на сегодняшний день только 14% специалистов в маркетинге могут использовать Big Data свободно, без согласования с руководством. Среди «лидеров» эта цифра ожидаемо оказалась выше: о глубокой вовлеченности в анализ Big Data заявили 17% респондентов этой категории, а о практически отсутствующей возможности работы с данными – 0%.
Екатерина Шинкевич, General Manager CPAExchange
Использование Big Data не очень распространено на российском интернет-рынке. Это связано в первую очередь со сложностью ее получения, а также с тем, что данные о пользователях необходимо где-то хранить, иметь под них законную базу для использования; к тому же они быстро «протухают». Прежде чем их купить, необходимо сразу понимать, кому они могут быть проданы, причем очень оперативно.
Безусловно, на российском рынке есть решения, которые продают аудиторные закупки, но пока рынок в зачаточном состоянии. Данных в интернете очень много, но необходимо крайне аккуратно и законно их использовать.
Другая проблема такова, что чем более таргетированной и умной становится реклама, тем она ближе к «телу» пользователя, и, как следствие, она может сильно раздражать. Тут нужно быть очень осторожными и деликатными.
Возможности больших данных не реализуются в полной мере также в связи с отсутствием качественных DMP (data-management-platforms). Пожалуй, самой адекватной является «Яндекс.Аудитории», но пока нельзя просто купить аудиторию. Продукт в процессе доработки, хотя должен получиться очень крутой.
Для того чтобы улучшить механику работы с Big Data, нужно изучать все DMP-решения, которые есть на российском рынке. Не бояться их тестировать и ошибаться. Думать о пользователях и последствиях использования данных о них.
Владимир Кирко, старший аналитик отдела Business Intelligence i.com
Уже более десяти лет во всем мире и, как минимум, последние три года в России все больше компаний внедряют в свои бизнес-процессы работу с большими данными или же думают об этом. Ключевыми словами являются «внедряют» и «думают» – успешных и финансово эффективных внедрений можно пересчитать по пальцам, и все они от крупных IT-компаний (но, если говорить откровенно, даже у IT-гигантов есть много не очень успешных и не всегда эффективных решений).
Главная проблема, по моему мнению, в отсутствии конкретных и измеряемых целей и гипотез, которые должен придумать человек на основе своего опыта в той или иной бизнес-среде.
Узнав про тренд на Big Data, компании начали бездумно собирать все возможные данные, возлагая «ответственность» на аналитиков и IT-специалистов (системные администраторы и программисты). А когда накапливается весомый объем данных, руководства компаний сталкиваются с не очень приятными фактами:
1. Поддержка архитектуры сбора, хранения и калькуляции таких данных стоит гигантских денег;
2. Маркетологи не понимают, что они могут делать с такими данными, а главное зачем?
Это логично, т.к., в целом, по своей природе человек стремится к простоте выводов. Чтобы было понятно, о чем речь, приведем в качестве примера ритейл (магазины). Снизили цену на продукт – продажи выросли, логистика не справляется с возросшими объемами. Повысили цену на продукт – продажи упали, товар портится на складе. Цена нормализовалась – продажи продукта на том уровне, что логистика справляется, товар не портится. Зачем тут вообще Big Data? Сотни различных бизнесов отлично работали без нее и завоевывали рынки!
Как же исправить ситуацию, выжав пользу из больших данных? Привожу краткую пошаговую инструкцию:
1. Поставьте конкретные цели, которые нужно решить для вашего бизнеса или задайте себе и сотрудникам конкретные вопросы, на которые хотите получить четкий качественный/количественный анализ-ответ.
2. Подумайте, какие данные и насколько детализированные вам понадобятся для решения задачи.
3. Сделайте в Excel небольшую таблицу, где в заголовке столбцов будет тип данных из п.2, а в строках значения (любые значения, которые так или иначе, по вашему мнению, приближены к реальным).
4. Создайте из этих данных сводную таблицу, постройте несколько графиков и найдите ответ из п.1. Не получилось? Значит вы ошиблись с целью/вопросом или с набором данных. Получилось? Переходим к следующему пункту.
5. Узнайте, реально ли получить нужные данные из п.2. (желательно, поступающие в реальном времени) и сколько это стоит.
6. Примерно посчитайте поступающие объемы таких данных в секунду/минуту/час/месяц.
7. Покажите IT- и data scientist-руководителям все предыдущие пункты – они рассчитают затраты на построение серверной архитектуры, команду специалистов для правильной обработки таких данных и выводу их в удобный вид (дашборд). Не забывайте про время на реализацию.
8. Посчитайте экономику – будет ли выгода от выполнения цели или ответа на вопрос из п.1, или затраты на Big Data решение не окупятся? Возможно, для решения вашей задачи вообще не нужны большие данные?
Подводя итог всему вышесказанному, Big Data – это не более чем Excel в умелых руках. Пока это кажется большинству чем-то более сложным, невозможно повсеместное эффективное внедрение и использование. Вместе с этим проблемой может стать недоступность ряда данных (отсутствие соглашений с ключевыми data-партнерами и законодательные ограничения), а также высокая стоимость создания необходимой архитектуры сбора, хранения, обработки и анализа данных.
Евгений Доронин, директор MediaSniper
Если мы говорим не о programmatic, а об использовании Big Data маркетологами в целом, то, по нашим наблюдениям, возможности этого ресурса не реализуются на все 100%. И это нормально, потому что наш рынок работы с данными только формируется.
Есть ряд причин, по которым доля проникновения данных невелика. Во-первых, начнем с доступности данных. Как правило, непосредственный доступ к ним может находиться либо в смежных с маркетингом отделах, либо ограничен корпоративной иерархией. В связи с этим, чтобы маркетологу получить доступ к данным, необходимо пройти не один круг запросов и согласований, включая службы безопасности. К тому времени, пока данный процесс успешно завершится, задача уже может потерять актуальность.
Следующим шагом к работе будет непосредственный инструментарий, который позволит вычленить из данных именно ту информацию, которая необходима. Появляется вторая проблема — рынок не имеет достаточного количества компетентных сотрудников для анализа данных, по крайней мере в маркетинговых целях, наличие у компаний инструментов работы с ними тоже во многих случаях оставляет желать лучшего. Ввиду того, что классического Excel не хватит, очевидно, что среднестатистический маркетолог не имеет ни компетенций, ни инструментов для принятия решений, основанных на больших data-массивах.
Еще один аспект, который выступает барьером, — это опасения юридических последствий использования данных. Нежелание экспериментировать и принимать риски на стороне legal-департаментов способно убить любой пилот. И, как правило, чем больше компания (и объем имеющихся в ее распоряжении данных), тем сильнее там юридические gatekeeper’ы.
И, конечно же, самая большая проблема — на рынке не сформировалась экосистема обмена данными и основных кейсов ее использования (за пределами, пожалуй, CRM-аналитики, скоринга и digital-рекламы, да и то лишь отчасти). Использовать данные можно в разных целях, начиная от формирования характеристик новых продуктов и услуг, управления ассортиментом, ценовыми параметрами и заканчивая финансовыми и страховыми скорингами. Решения на основе больших данных покрывают широкий спектр бизнес-задач, которые далеко выходят за пределы маркетинга.
В итоге самым неочевидным барьером в использовании больших данных является ограниченная их доступность. Многие компании, которым пригодились бы данные ритейла, телекома, автопроизводителей, пока не имеют ни платформы для их покупки, ни возможности их протестировать. Тем не менее общий тренд очевиден: с течением времени, под давлением акционеров и по мере накопления опыта позитивных тестов, предложение данных в ответ на рост спроса не заставит себя ждать. А с ростом их доступности появятся еще более эффективные / инвазивные продукты (выберите вариант в зависимости от вашей любви к Оруэллу или Хаксли).
Надежда Бабиян, коммерческий директор Getintent
Сейчас Big Data в России — это не просто модный тренд, а способ работы с данными, который фундаментально преобразовывает бизнес. В самых разных отраслях, в том числе в digital-индустрии, компании используют большие данные — самостоятельно или с помощью партнеров. Решения, основанные на данных, — это прогрессивные решения, и компании, которые это понимают, обладают конкурентным преимуществом. Нужно сказать, весь бизнес RTB построен на технологиях, связанных с обработкой и использованием больших данных. Применение алгоритмов машинного обучения к данным позволяет нам составить четкий портрет целевого пользователя, оценить вероятность его взаимодействия с рекламой и трансформировать эти знания в более эффективные решения: в отношении таргетинга, формы и языка рекламного сообщения (если это динамический креатив), а также размера ставки и других параметров. Таким образом, грамотная работа с большими данными помогает нам постоянно улучшать результаты programmatic-кампаний.
Одна из проблем, с которой сегодня сталкивается российский digital-рынок при работе с большими данными, — это нехватка сильных специалистов в области. Для эффективного использования Big Data компаниям необходимы опытные data scientists, data engineers и machine learning engineers, которые знают, как организовывать данные, умеют находить паттерны в больших наборах данных и проводить эксперименты с целью поиска полезной для бизнеса информации. Они свободно говорят на языке бизнеса, разбираются в своей предметной области, понимают ее основные проблемы и помогают подойти к их решению со стороны данных. Перечисленные навыки редко приобретаются на курсах статистики, поэтому специалисты, обладающие такой экспертизой, пользуются большим спросом.
В то же время рынок переполнен компаниями, декларирующими data-driven подход, однако немногие из существующих технологий могут подтвердить экономическую ценность собственных data-решений. От этого выбрать достойного data-партнера становится все тяжелее. Кроме того, уже не первый год рынок говорит о широких перспективах использования 1st party data. Но, к сожалению, немногие клиенты сегодня видят ценность собственных данных и начали эффективно работать с ними.
Помимо кадровой экспертизы, успех работы с Big Data зависит от того, насколько регулярно компания совершенствует алгоритмы анализа данных и тестирует новые гипотезы. Поэтому, чтобы data-driven подход приносил ощутимую ценность для бизнеса, необходимо развивать экспериментаторский дух и поддерживать его соответствующим бюджетом. Кроме того, для получения долгосрочных преимуществ от использования больших данных маркетологам не стоит ограничиваться задачей мотивировать пользователя совершить покупку, а искать ответы на более стратегические вопросы, пытаясь понять, как повысить лояльность аудитории.
Дмитрий Юхневич, COB LT Digital Group
За последний год многие компании активизировали внутреннюю работу по сбору и анализу данных. Сложно пока сказать, насколько результативна эта работа, но по моим ощущениям, новые гипотезы уже построены, и бренды ищут каналы для их реализации. Big Data существенно повлияла на движение рынка в сторону персонализации контента и улучшение таргетинга. Многие бренды особенно заинтересованы в пересечениях аудиторий с другими рекламодателями и ищут возможности создания коллабораций.
Рынок занят профилированием пользователей с помощью CDP-систем — это одна из последних стадий, достигнутых представителями рынка digital. Data Science должна существенно расширить границы понимания агрегируемых данных. Сейчас мы оцениваем эффективную пользовательскую активность, что хорошо подходит для работы с новой аудиторией, но, учитывая движение рынка в сторону персонализации маркетинговых коммуникаций, можно полагать, что бренды заинтересованы в более сложной и результативной работе с лояльными пользователями, для которых разрабатываются новые продукты, основанные на пользовательских данных.
Для брендов сейчас также встает вопрос релевантности и ценности данных. Насколько верны предпосылки, которые мы используем для формирования выводов? Ведь уравнение под названием «платежеспособный и лояльный клиент» содержит в себе гораздо больше информации, чем способен показать прямой маркетинговый анализ его digital footprint. Data Science — это постоянный поиск закономерностей из всех доступных источников и порой в непредсказуемых комбинациях.
Машинное обучение и автоматизация процесса анализа данных будут постоянно подтягиваться за data science: сейчас специалисты рынка формируют новые, более сложные пользовательские паттерны. Они лягут в основу более сложных систем, которые смогут поставить перед рынком новые задачи и открыть глаза на новую прибыль.
На мой взгляд, существует несколько основных стопперов для развития Big Data и Data Science, каждый из которых условно можно свести к проблеме цивилизованности рынка.
Первый — жесткая правовая регуляция в отношении персональных данных и их операторов. Не секрет, что в отношении персональных данных в последнее время задается много вопросов, в том числе и от самих пользователей. Они начинают осознавать ценность этих данных и хотят понимать целесообразность их применения. Один только закон о Big Data грозит рынку неоценимыми потерями в скорости и качестве развития аналитических систем. Эта инициатива может привести к существенному сокращению источников получения персональных данных.
Второй — человеческие ресурсы компаний, использующих данную технологию. Несмотря на то, что большинство аналитических систем автоматизированы, мы не можем исключать специалистов, которые настраивают их и управляют ими. Рыночная ценность такого специалиста очень высока, при этом не каждая компания может себе его позволить, и далеко не каждая сможет оценить его профессионализм. Думаю, это в этом заключается причина относительно низкой стоимости облегченных версий систем аналитики для малого и среднего бизнеса, которые могут обойтись без участия data scientist.
Третий — мошенничество и фальсификация отправляемых данных. Я ставлю эти понятия на один уровень по общему признаку — влиянию на общую картину целевой аудитории брендов. Гораздо опаснее для больших компаний возможность утечки данных. Для больших брендов это может вылиться в длительный и дорогостоящий публичный процесс восстановления репутации, а для малых и средних брендов — в неконтролируемый отток целевой аудитории и реализацию нерелевантных маркетинговых стратегий.
Игорь Нагорнов, Chief Executive Officer Performance Marketing Lab
В целом, по моим предположениям, большими данными пользуются порядка 20% всех рекламодателей в России. Если говорить о First Party Data (данные с сайтов самих рекламодателей), то таких рекламодателей гораздо больше, так как использование этой информации в ретаргетинге уже доказало свою эффективность.
Вопрос реализации возможностей Big Data связан со стереотипом восприятия людьми того факта, что, используя тот или иной плагин, хостинговую кампанию или сервис, они не готовы отдавать свою дату безвозмездно. А те, кто эту дату собирают, естественно, не хотят делиться там, где они могут этого не делать, предоставляя другой полезный продукт или сервис. Исходя из этого, в России стоит эра «темной стороны данных», когда нет полного понимания критериев и источников создания того или иного сегмента, за который просят немаленькие деньги.
Когда рынок данных будет строиться на прозрачных алгоритмах, на прозрачных источниках, и рекламодатели смогут увидеть, по какой логике сформированы сегменты, — они будут больше доверять этой технологии и, естественно, активно использовать во всех своих рекламных активностях, ведь попадание в ЦА — это одна из важнейших целей, которая помогает использовать имеющийся бюджет максимально эффективно.
Для того чтобы улучшить механику работы с Big Data, необходимо сделать рынок данных прозрачным со всех сторон, а также показать много примеров проведения рекламных кампаний без данных и с данными. Результаты будут впечатляюще отличаться — конечно же, в пользу использования данных. Открытость, прозрачность — формируют доверие, а результаты наглядно показывают эффективность и выгоду, как следствие.
Источник: Martechtoday, Forbes Insights