Анализ данных маркетингового исследования

Вопрос, как будут анализироваться данные, полученные в процессе маркетингового исследования, поднимается задолго до того, как этот анализ будет проведен. Планирование анализа данных предшествует разработке инструментария сбора данных — вопросов для анкетирования и стандартного листа наблюдения. Очень важным моментом является следующее: собирать данные можно только тогда, когда имеется понимание, каким методом они будут анализироваться. Это означает, что если сбор данных происходит через опрос или анкетирование, то форма вопросов должна жестко определять не только структуру данных и формат ответов, но и шкалу, по которой ответы будут измеряться. Это связано с тем, что большинство маркетинговых исследований требует использования статистических методов анализа данных.

Для понимания дальнейшего материала напомним некоторые базовые понятия статистики, в частности, что такое «переменная», «шкалы», в которых измеряются статистические данные.

Данные, анализируемые в маркетинговых исследованиях, как правило, совершенно различны. Это могут быть данные о покупателях: об их возрасте, составе семьи, покупательных возможностях, образовании; данные о фирмах-конкурентах, характеристиках товаров и т.д. Такие характеристики называются переменными.

Под переменными при обработке результатов маркетинговых (и не только) исследований понимается то, что можно измерять, контролировать или изменять. Таким образом, переменными могут являться пол опрашиваемых покупателей, их возраст, оценка товара (отличная, удовлетворительная, плохая), сумма, которую готов заплатить клиент за товар, и т.д. Для минимизации различного рода ошибок было введено понятие шкалы, в которой измерена переменная. Типы переменных определяют методы их статистического анализа. Традиционно различают три вида шкал.

Номинальная (или качественная) шкала — это шкала, значения которой служат только в качестве условных имен для переменных. Например, переменная может принять два варианта значений: «мужчина / женщина»; «придерживаюсь /не придерживаюсь диеты», ответ на любой вопрос с вариантами ответа «да / нет / затрудняюсь ответить» и т.д.

Следующим видом является порядковая шкала. Говорят, что переменная измерена в порядковой (ранговой) шкале, если значения переменной можно сравнивать между собой, но разность значений не имеет смысла. Например, первый, второй, третий сорт товара; высокий, средний, низкий уровень продаж; ранги предпочтений покупателей и т.д.

Количественная (интервальная) шкала позволяет отражать абсолютные количественные характеристики исследуемых объектов. Например, время, проведенное покупателем в магазине, сумма чека, средняя сумма чека в магазине за каждую неделю и т.д.

Файлы большинства статистических пакетов, используемых для анализа маркетинговых данных, организованы в виде таблиц, строки которых называются наблюдениями, а столбцы соответствуют переменным. Достаточно часто наблюдения представляют собой набор ответов отдельных респондентов опроса. Л переменные представляют ответы на вопросы, задававшиеся в ходе опроса.

Рассмотрим типовые маркетинговые ситуации (маркетинговые задачи), которые требуют применения статистических методов, обычно изучаемых в курсах «Прикладной статистический анализ», «Эконометрика», «Бизнес- анализ информации» и т.д.

Группа 1 типовых маркетинговых задач.

Определение вида зависимости между количественными переменными, например:

  • • стоимости аренды помещения под торговые нужды — от плотности транспортного потока и пешеходного потока;
  • • стоимости квартиры — от ее площади, количества комнат, удаленности квартиры от метро;
  • • объема продаж магазина — от его площади, удаленности от метро;
  • • стоимости кольца с бриллиантом — от величины камня в нем.

По сути, эти сформулированные задачи предполагают нахождение вида зависимости маркетингового показателя, измеряемого в количественной шкале, от одного или нескольких влияющих показателей, также измеряемых в количественной шкале.

Статистический метод, используемый для решения таких задач, — метод регрессионного анализа — позволяет определить наличие и вид связи между переменными и прогнозировать значения зависимой переменной от значений влияющих переменных (для простоты рассмотрим сначала ситуацию, когда в качестве влияющей переменной выступает только одна переменная). Более того, часто маркетинговые исследования начинаются с проверки гипотезы о наличии линейной связи между переменными. В этом случае целью линейного регрессионного анализа является определение коэффициентов а и Ъ, уравнения регрессии у = а + Ьх. В чем суть описываемого метода? Как его применять?

Рассмотрим следующий пример. Компания X каждый месяц вкладывает средства в телевизионную рекламу кетчупа. Покупателей можно разделить на группы — часть из них видела и поверила рекламе, часть из которых в принципе не верит рекламе, а остальные не смотрят телевизор, покупают товары и не заботятся о том, чтобы их поведение подчинялось какому- нибудь закону и тем более прогнозировалось. Тем не менее маркетологам интересно, эффективны ли их вложения в рекламу, поэтому они сопоставляют замеренные в каждом месяце затраты на рекламу и объем продаж. В табл. 5.4 приведены данные по затратам на рекламу и объемам продаж кетчупа за 12 мес.

Таблица 6.4

Затраты на телевизионную рекламу кетчупа и объем продаж

Месяц

Затраты на рекламу (.г)

Объем продаж (у)

1

1200

12000

2

1400

10700

3

1780

9200

4

2100

10400

5

2000

12300

в

2800

17800

7

3300

19200

8

3400

23000

9

3800

24000

10

4100

23900

11

3900

27200

12

3900

24500

«Мечтой» каждого маркетолога является не просто доказательство факта зависимости между переменными, но получение вида связи между переменной, которой можно управлять (в нашем примере — затратами на рекламу), и зависящим от нее показателем (объемом продаж). Методом, определяющим вид связи между переменными, является метод регрессионного анализа, реализованный во многих статистических пакетах, таких как SPSS, Statistics Eviews и даже в MS Excel. Он всегда находит коэффициенты уравнения, связывающего анализируемые переменные, параллельно рассчитывая характеристики качества полученного уравнения. При этом выбор вида связи (линейная, степенная, логарифмическая) — это ответственность аналитика. В большом количестве ситуаций анализ начинается с линейной связи.

В рассматриваемом примере уравнение линейной связи, по результатам процедуры регрессионного анализа, проведенной в среде SPSS, имеет вид

где Y — объем продаж, х — вложения в рекламу.

Программа автоматически рассчитывает набор характеристик полученной зависимости, среди которых коэффициент детерминации R2. В рассматриваемом примере этот коэффициент равен 90%, что позволяет доверять полученному уравнению, так как R2 — это процент изменения У, определяемый изменениями х.

Чем «радует» исследователя полученное уравнение? Во-первых, есть доказательство эффективности рекламы, во-вторых, можно объективно утверждать, что увеличение вложений в рекламу на рубль увеличит объем продаж на 5,9 руб. И главное, можно рассчитывать объемы продаж для возможных вариантов вложений в рекламу. Для этого варианты вложений в рекламу нужно подставить в уравнение регрессии.

Конечно, в нашем примере мы сильно упростили описание процедуры и интерпретации результатов регрессионного анализа. Технические детали можно найти в отдельных публикациях, целиком посвященных маркетинговым исследованиям. Обратим внимание на то, что в прикладном статистическом анализе существенную роль играет проверка адекватности полученных результатов профессиональной интерпретацией полученных результатов.

Если в рассмотренном выше примере о продажах кетчупа исследователь захочет получить более точную модель, описывающую зависимость объема продаж от нескольких количественных факторов, например, еще и от цены товара, то тогда применимо прогнозирование переменной Y на основании двух или нескольких переменных, называемое множественной регрессией.

Метод линейной множественной регрессии позволяет:

  • • описывать взаимосвязь между зависимой переменной у и несколькими независимыми переменными xt, х2,..., хп в виде уравнения: у = b + ах х х хх + а2х2+ ... +а„
  • • прогнозировать значения отклика (зависимой переменной), отсутствующего в анализируемой выборке по значениям предикторов (независимых переменных).

На практике применение регрессионных процедур выглядит следующим образом. Исследователь формулирует гипотезу о том, какие количественные факторы влияют на интересующий его показатель; далее собирает данные, обрабатывает данные в статистической среде и анализирует результаты, подтверждающие или опровергающие его гипотезу. Процедура множественной регрессии позволяет определить, какие параметры значимо влияют, а какие нет на зависимую переменную.

Группа 2 типовых маркетинговых задач.

Определение различий между выборками, например:

  • • различия объемов продаж одного и того же товара при расположении его на разных полках;
  • • различия объемов продаж товаров во время работы разных смен продавцов;
  • • различия объемов продаж товара до изменения сайта интернет-магазина и после.

В основе всех этих методов лежит доказательство значимой зависимости количественного показателя от одного качественного параметра. Статистический метод, применяемый в таких ситуациях, — однофакторный дисперсионный анализ, который устанавливает, значимо ли различаются средние значения нескольких независимых выборок.

Рассмотрим данные из табл. 5.5. В ней приведены данные об объемах продаж кетчупа. Директор сети супермаркетов хочет знать, влияет ли на сбыт кетчупа различное размещение продукта в супермаркете. В одном из супермаркетов кетчуп расположен на так называемых «нормальных полках», в другом — в варианте «парного размещения», в третьем — в «холодильнике». Предполагается, что все три супермаркета находятся в одинаковых условиях (расположение, близость конкурентов и т.д.).

Можно предположить, что если размещение товара не влияет на объем сбыта, то средние значения объемов сбыта маргарина для каждого варианта размещений будут приблизительно равны. Таблица 5.5 показывает результаты трех выборок. В каждом случае эксперимент продолжался одно и то же время, в течение 1000 кассовых операций.

Таблица 5.5

Сбыт кетчупа за 1000 кассовых операций в трех супермаркетах в зависимости от размещения, кг

Супермаркет

День 1

День 2

День 3

День 4

День 5

Супермаркет 1 «нормальные» полки»

47

39

40

46

45

Супермаркет 2 «парное размещение»

68

65

63

59

67

Супермаркет 3 «холодильник»

59

50

51

48

53

Таблица 5.6

В табл. 5.6 приведены средние значения сбыта кетчупа в трех супермаркетах.

Средние значения сбыта кетчупа в супермаркетах

Супермаркет

Среднее значение сбыта кетчупа для супермаркета

Супермаркет 1 «норматьные полки»

У =43,4

Супермаркет 2 «парное размещение»

У2 =64,4

Окончание табл. 5.6

Супермаркет

Среднее значение сбыта кетчупа для супермаркета

Супермаркет 3 «холодильник»

у3=52,2

Общее среднее значение

/7 = 53,3

Дисперсионный анализ определяет, является ли различие в рассчитанных средних значениях случайным или нет. Другими словами, он определяет, объясняется ли разница в средних значениях размещением товара или какими-то случайными внешними факторами. Сама процедура применения этого метода технически совсем несложная.

Группа 3 типовых маркетинговых задач.

Доказательство значимой зависимости качественных переменных, например:

  • • доказательство значимой зависимости предпочтений при выборе товара от пола покупателя;
  • • доказательство значимой зависимости предпочтений при выборе товара от психотипа покупателя;
  • • доказательство значимой зависимости факта «респондент придерживается диеты» от его семейного статуса «в браке / не в браке».

По сути, решение всех этих задач предполагает доказательство значимой зависимости качественного показателя от одного или нескольких качественных показателей. Статистический метод, применяемый для доказательства зависимости качественных переменных — метод у} (Хи-квадрат), — состоит из двух этапов:

  • 1) составление таблиц сопряженности признаков (перекрестных таблиц);
  • 2) проверки зависимости переменных.

Рассмотрим на примере ниже, что собой представляет перекрестная таблица и как она строится.

По результатам анкетного опроса сформирована общая таблица из 181 наблюдения о предпочтениях городских и сельских жителей в выборе масло — маргарин. Независимой переменной в этой таблице является район проживания покупателя: город или сельская местность, зависимой переменной — его выбор: масло или маргарин (фрагмент общей таблицы представлен в табл. 5.7).

Таблица 5.7

Предпочтения городских и сельских жителей в отношении масла или маргарина

Место проживания

Предпочтение

Город

Масло

Город

Маргарин

Село

Масло

Город

Маргарин

Перекрестная таблица но этим данным имеет вид табл. 5.8.

Таблица 5.8

Перекрестная таблица предпочтений городских и сельских жителей в отношении масла или маргарина

Район

Товар

Всего

Масло

Маргарин

Город

30

83

113

Сельская местность

45

23

68

Всего

75

106

181

Рассмотрим, как интерпретируются данные из этой перекрестной таблицы:

  • • 30 городских жителей из 113 опрошенных предпочитают покупать масло, а 83 городских жителя предпочитают покупать маргарин;
  • • 45 сельских жителя из 68 опрошенных предпочитают покупать масло, а 23 — маргарин.

Строки табл. 5.8 показывают профиль предпочтений городских и сельских жителей. Исходя из полученных результатов, можно предположить, что городские жители предпочитают использовать маргарин, а сельские жители — масло. Последнее утверждение и является гипотезой, которую надо подтвердить или опровергнуть. Соответствующая статистическая процедура рассчитывает статистику (показатель х2), которая позволяет судить о наличии или отсутствии зависимости между качественными переменными.

Группа 4 типовых маркетинговых задач.

Примерами задач из этой группы являются: прогнозирование уровня продаж нового вида товара на основе количественных показателей объемов продаж аналогичных товаров и определение требуемого клиенту типа товара в зависимости от требований к товару, сформулированных в виде оценки по определенной шкале.

В основе решения задач этой группы лежит доказательство значимой зависимости качественного показателя от одного или нескольких количественных параметров. Такого рода задачи могут быть решены с помощью дискриминантного анализа.

Группа 5 типовых маркетинговых задач содержит все виды задач, связанных с классификацией товаров, услуг, потребителей, например:

  • • классификация потребителей по результатам выставленных ими оценок при опросе;
  • • классификация филиалов магазинов на основе таких показателей, как площадь магазина, удаленность от метро, плотность пешеходного потока;
  • • классификация объектов по количественным признакам.

Такие задачи решаются одним из методов классификации: иерархическим кластерным анализом, методом ^-средних и т.д.

Группа 6 типовых маркетинговых задач включает задачи, позволяющие определить оптимальные свойства товара или услуги.

Примером здесь может служить определение потребительских характеристик сока (объем упаковки, вид упаковки, сок, состав сока), пуговиц

(материал, количество отверстий, цвет) и т.д. Такого рода задачи решаются с помощью совместного {conjoint) анализа, требующего специальных процедур сбора данных и их анализа.

В зависимости от уровня кадрового и программного обеспечения компании проведение маркетингового исследования может осуществляться как собственными силами, так и во взаимодействии с фирмами, специализирующимися на данных видах деятельности. Аналогичный вывод может быть сделан и для ряда других этапов процесса маркетингового исследования, например полевой работы интервьюеров. Однако во всех случаях весьма важно понимание маркетологами компании основного содержания действий, предпринимаемых при планировании и реализации конкретного маркетингового исследования.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >