Эта глава посвящена базовому анализу данных, включающему изучение распределения частот значений переменной (вариационных рядов), кросс-табуляцию (построение таблиц сопряженности) и проверку гипотез. Сначала мы рассмотрим распределение частот и объясним, как с его помощью определить количество выбросов, пропущенных и экстремальных значений данных, а также выявим центральную тенденцию в значениях изучаемых данных, их вариацию и форму кривой распределения. Затем введем понятие проверки гипотез и опишем общую процедуру проверки. Процедуры проверки гипотез делятся на проверку связей и проверку различий. Мы также рассмотрим использование кросс-табуляции для установления связи между двумя или тремя переменными. Хотя природу связи можно увидеть из таблиц, статистики позволяют определить значимость и силу связи. И наконец, мы познакомим вас с методами статистической проверки гипотез, связанных с различиями в одной или двух выборках. [c.552]
Результаты базового анализа данных ценны сами по себе и, кроме того, показывают направление для многомерного анализа. Чтобы читатель понял особенности статистических методов, мы приведем ряд примеров применения кросс-табуляции, критерия хи-и проверки гипотез. [c.553]
Пример, касающийся универсального магазина, показывает роль базового анализа данных при использовании его в сочетании с методами многомерного анализа, в то время как два других примера показывают, что этот анализ полезен и сам по себе. Использование кросс-табуляции и критерия хи-квадрат в примере, связанном с телевизионной рекламой, и парного в примере с продажей товаров по каталогу позволяют маркетологам сделать вполне конкретные выводы. [c.554]
Проверка различий может относиться к распределениям, средним, долям, медианам или рангам. Сначала мы обсудим гипотезы, относящиеся к проверке связей с точки зрения кросс-табуляции. [c.568]
Кросс-табуляция представляет собой процесс объединения распределений частот значений двух или больше переменных в одну таблицу. Она объясняет, как одна переменная, например лояльность торговой марке, связана с другой переменной, такой как пол. В таблицах сопряженности признаков показывается совместное распределение значений двух или больше переменных, ограниченным числом категорий или принимающих определенные значения. Категории одной переменной помешают в таблицу так, чтобы они размещались в ней (сопрягались) в соответствии с категориями другой или другими несколькими переменными. Таким образом, распределение частот одной переменной подразделяется на группы в зависимости от категорий других переменных. [c.569]
Таблица кросс-табуляции состоит из ячеек, которых приведены комбинации двух переменных. [c.569]
Рис. 15.7. Введение третьей переменной в кросс-табуляцию |
Данные табл. 15.3, где (номинальная переменная, не обрабатывают с помощью порядковых статистик. Все изложенные выше статистики можно соответствующими компьютерными программами для кросс-табуляции. Другие статистики для измерения тесноты связи, а именно смешанный момент корреляции и неметрическая корреляция, обсуждаются в главе 17. [c.580]
ПРАКТИКА ПРОВЕДЕНИЯ КРОСС-ТАБУЛЯЦИИ [c.580]
Исследователи часто хотят проверить различия в долях, полученных из анализа двух независимых выборок. В качестве альтернативы параметрической можно использовать процедуру кросс-табуляции, чтобы выполнить проверку с помощью критерия -м [23]. В этом случае имеем таблицу Одну переменную используем для обозначения выборки, допустим, значение 1 — для выборки 1, а значение для выборки 2. Другая переменная будет интересующей нас двоичной переменной. [c.592]
Кросс-табуляция представляет собой процедуру создания таблиц признаков, которые отражают совместное распределение значений двух или больше переменных. В проценты вычисляем по колонкам (к итоговой колонке) или по рядам (к итоговому ряду). Общее правило — вычисление процентов в направлении переменной через зависимую переменную. [c.598]
КРОСС-ТАБУЛЯЦИЯ Введение [c.815]
Терминология достаточно проста, но оформление данных кросс-табуляции не всегда так проста, как в предложенном выше примере. Рассмотрим следующие положения. [c.815]
Кросс-табуляция. Повторно закодируйте зависимую переменную купить", разбив ее на три относительно равные группы (низкая, средняя и высокая (готовность ку- [c.834]
Кросс-табуляция. Классифицируйте торговой марки" как низкое, [c.837]
Критическая просьба, 243 Кросс-табуляция, 568 [c.950]
Таблица кросс-табуляции, в которой отражена абсолютная численность соответствующей группы (Universe) распределение покупателей или потребителей по социально-демографическим признакам (Со1%) доля потребителей или покупателей в социально-демографической группе (Row%) и аффи-нити индекс (Affinity Index), демонстрирующий отклонение частоты анализируемого признака от среднего значения по базе (частное частоты признака среди всех и в социально-демографической группе, умноженное на 100 с округлением до целых значений, нормативное значение 100). [c.163]
На эти и подобные вопросы можно ответить с помощью таблицы сопряженности признаков. В то время как вариационный ряд характеризует одну переменную, построение таблиц сопряженности признаков (кросс-табуляция) ( ross-tabulation) помогает увидеть одновременно значения двух или больше переменных. [c.569]
Чтобы построить таблицу сопряженности признаков, респондентов разделили в зависимости от того, сколько времени они пользуются сетью. Пользующихся Internet пять часов и меньше отнесли к мало пользующимся, а остальных — ко много, Итог процедуры кросс-табуляции приведен в табл. 15.3. [c.569]
Можно построить сопряженности больше, чем для трех переменных, но интерпретация полученных результатов достаточно сложная. Кроме того, поскольку число ячеек многократно увеличится, проблематично оставить необходимое количество респондентов или случаев в каждой ячейке. Как правило, чтобы вычислить статистику в каждой ячейке, должно быть, по крайней мере, пять наблюдений. Таким образом, кросс-табуляция — неспособ проверки связей для ситуаций с несколькими переменными, она рас- [c.574]