Рассмотрим общий случай - таблицу сопряженности двух переменных размером г х s. Обозначим [c.203]
Расчет теоретически ожидаемых частот в ячейках таблицы сопряженности должен производиться, как мы уже указывали выше, в предположении справедливости нулевой гипотезы. Нуль-гипотеза (//0) в данном случае есть предположение о статистической независимости рассматриваемых переменных. Как известно из теории вероятностей, две случайные величины (события) являются статистически независимыми, если вероятность их совместной реализации равна произведению вероятностей реализации каждой из них по отдельности, т. е. [c.204]
Интерпретация х2 теста зачастую усложняется, когда в таблице сопряженности имеются ячейки с нулевыми значениями наблюдаемых частот. Дело в том, что если пара (xf, xj) значений переменных не наблюдалась в выборке, то это может означать, что объем выборки не столь велик, чтобы зафиксировать такую редкую комбинацию, либо что данная комбинация невозможна по каким-то объективным причинам. В последнем случае действительное число степеней свободы анализируемой системы меньше числа степеней свободы таблицы сопряженности, на основании которого произведена оценка уровня значимости у2 теста. [c.205]
Корректировка применения х теста возможна лишь в том случае, если эмпирические данные, наполняющие таблицу сопряженности, есть результаты независимой случайной выборки относительно большого объема и. Последнее требование вызвано тем, что выборочное распределение х2 аппроксимирует табличное распределение статистики х2 только при больших п. Естественно, [c.205]
Исследователь хочет получить репрезентативную выборку людей, имеющих/не имеющих автомобили, отделяя ответы мужчин и женщин. Удобным является способ составления таблиц сопряженности, т.е. совместный анализ двух признаков или свойств (табл. 4.9). [c.155]
Анализ ранговых корреляций и таблиц сопряженности [c.24]
Три основные выборочные схемы, приводящие к таблицам сопряженности. Схема I возникает в случае, когда распределения строк (xtl,. .., хи) i = 1,. .., / (столбцов) таблицы можно рассматривать как независимые выборки из поли- [c.125]
Таблица сопряженности в этом случае является обычной дву- [c.126]
При анализе таблиц сопряженности используют направленные меры связи [c.130]
Сопоставление различных подходов к выбору оптимизируемого функционала в дуальном шкалировании позволяет глубже понять заложенные в методе возможности. Поэтому в дальнейшем сформулируем несколько различных принципов приписывания численных значений и покажем, что все они ведут к одному и тому же результату. 3.2.2. Максимизация F-отношения суммы квадратов отклонений между объектами к полной сумме квадратов отклонений. Изложение начнем с гипотетического численного примера. Предположим, что 10 экспертов произвели оценку организации труда в четырех лабораториях. Эксперты могли использовать лишь три категории оценок хорошо, удовлетворительно, неудовлетворительно, и один из экспертов оценивал лишь первые три лаборатории. Пусть полученные данные представлены в виде таблицы сопряженности X, в которой Хц означает число оценок градации /, полученных i-й лабораторией (табл. 3.2). [c.132]
Матричная формулировка основного принципа оптимизации. Пусть X — (т X д)-матрица таблицы сопряженности [c.134]
Если дуальное шкалирование выполнить для таблицы сопряженности и соответствующей ей таблицы Объект — (двумерный отклик) , то численные значения, приписанные переменным после нормировки, совпадут, а К2 = (1 + т])/2. [c.141]
Распределения многомерных случайных величин, координаты которых измеряются в номинальных и порядковых шкалах, часто представляют в виде многомерных прямоугольных таблиц, называемых таблицами сопряженности. При этом в клетке, соответствующей /х — градации первой переменной,. .., ife — ft-й переменной указывается л .... — число наблюдений в выборке с этими градациями. В двумерном случае по организации сбора данных различают три выборочные схемы, приводящие к таблице сопряженности [c.141]
Для описания совместного распределения хц предложена логарифмически-линейная параметризация таблиц сопряженности, в которой предполагается, что [c.142]
Предложен ряд различных мер связи между строками и столбцами в двумерных таблицах сопряженности. Среди них выделяются информационные меры связи как легко допускающие обобщение на многомерный случай. [c.142]
Один из методов анализа двумерных таблиц сопряженности заключается в том, чтобы приписать градациям классификационных переменных численные значения так, чтобы максимизировать некоторый функционал. Оказывается, что ряд известных под различными названиями и максимизирующих различные функционалы методов таких, как метод взаимных усреднений , аддитивное или оптимальное шкалирование , метод максимизации коэффициента корреляции и др., приводит к приписыванию одних и тех же численных значений. [c.142]
Методы статистического исследования зависимостей, в особенности регрессионный анализ, анализ временных рядов, дисперсионный анализ, анализ таблиц сопряженности, планирование эксперимента, наиболее употребительны среди методов обработки данных в различных областях науки и техники. Соответственно к настоящему времени существует и продолжает разрабатываться обширное программное обеспечение, связанное с исследованием зависимостей. Ниже кратко рассмотрены программные средства — пакеты и библиотеки программ, доступные пользователям в СССР, а также наиболее интересные, на наш взгляд, для обеспечения статистического исследования зависимостей зарубежные пакеты и библиотеки. Основные сведения о пакетах и библиотеках программ приведены в табл. 15.1. [c.425]
В гл. 3 X используется для обозначения матрицы исходных данных таблицы сопряженности (т. е. ее элемент Xij — это число объектов в двумерной выборке объема л, отнесенных по первой случайной компоненте к градации i, а по второй случайной компоненте — к градации /), а в гл. 6 — для обозначения некоторого подмножества области определения исследуемой функции регрессии /(X в). [c.455]
А п т о н, Г. Анализ таблиц сопряженности. Пер. с англ. — М. Финансы и статистика, 1982. — 143 с. [c.460]
Связи между качественными показателями излагаются на основе таблиц сопряженности признаков, анализ которых в последние десятилетия является одной из главных точек роста статистической науки [50, с. 57]. [c.107]
В таблице сопряженности (табл. 4) в общем случае излагается частота совместного появления в эксперименте определенной комбинации значений факторного и результативного показателей иц характеризует число наблюдений с параметрами. V и z/j. [c.107]
Таблица 4. Таблица сопряженности [c.107]
Коэффициент ассоциации и контингенции используется для определения тесноты связи двух качественных признаков, каждый из которых состоит только из двух групп. При исследовании связи данные располагают в виде таблицы сопряженности. Она показывает связь между двумя явлениями, каждое из которых должно быть альтернативным, т.е. состоящим из двух качественно отличных друг от друга значений признака. Например а — работающие мужчины b — неработающие мужчины с — работающие женщины d — неработающие женщины. [c.126]
Методическое место дуального шкалирования. Наряду со статистическими методами, изложенными в предыдущем параграфе, в работе с таблицами сопряженности может быть использован принципиально отличный подход. Градациям переменных, измеренных в общем случае в шкалах наименований, приписываются численные значения так, чтобы достиг своего экстремума определенный функционал. Далее с новыми переменными работают как с переменными, измеренными в качественных шкалах. В целом этот подход, который мы, следуя предложенному в [232], будем называть дуальным шкалированием (dual s aling), по своему методическому содержанию ближе к анализу данных, чем к традиционным статистическим методам. В нем не формулируется математическая модель распределения исходных данных, предлагаемые статистические критерии носят, вообще говоря, эвристический характер, но зати четко и наглядно формулируется принцип приписывания численных значений. [c.131]
Из приведенных данных видно, что в рассмотренном при мере с точки зрения оценки статистической значимости связи между строками и столбцами традиционный и логлинейный подходы к таблицам сопряженности, с одной стороны, и дуальное шкалирование, с другой стороны, дают сравнительно близкие результаты. Однако в общем случае связь между этими двумя методами пока достаточно не изучена [232, с. 181]. 3.2.6. Таблицы объект—многомерный отклик . Исходные данные для дву-, трех- и более мерных таблиц сопряженности часто могут.быть представлены в форме таблицы, в которой строки соответствуют объектам (субъектам), столбцы — градациям используемых классификационных переменных и на пересечении i-й строки и столбца, соответствующего у-й градации /-и переменной, стоит 1 или 0 в зависимости от того, имеет ли место для 1-го объекта эта градация (1) или нет (0). В случае когда для ряда объектов значения одной из переменных не определены (измерены в непредусмотренной шкале, не измерены, утрачены при обработке и т. п.), либо исключают из таблицы соответствующие объекты, либо вводят для этой переменной дополнительную градацию значение не определено . Пример фрагмента таблицы, которая могла бы быть исходной для данных примера п. 3.2.2, дан в табл. 3.4, где приведена оценка организации труда в четырех лабораториях (таблица Единица наблюдения —(лаборатория, оценка, эксперт) ). В качестве единицы наблюдения (объекта) в ней взято резюме из карточки, заполняемой экспертом после обследования и оценки организации труда в лаборатории, в котором указываются номер лаборатории, оценка, номер эксперта. [c.139]
Логлинейный анализ таблиц сопряженности. Соответствующее программное обеспечение описано в [91, 23]. [c.426]
В целях сокращения трудоемкости кодирования и вероятности появления ошибок, а также удобства пользования кодировочными таблицами разрабатывают макеты коди-ровочных таблиц, сопряженные с формой исходных данных. Этой же цели служит использование трафарета при записи исходной информации на технический носитель, который при наложении на операционно-технологическую карту выделяет нужную информацию и указывает порядок ее записи. Одним из эффективных направлений снижения трудоемкости кодирования является использование автоматических кодирующих устройств — автокодировщиков, предназначенных для автоматического кодирования и перфорации исходных данных. [c.314]
Смотреть страницы где упоминается термин Таблицы сопряженности
: [c.205] [c.206] [c.267] [c.267] [c.277] [c.281] [c.48] [c.99] [c.597] [c.99] [c.125] [c.426] [c.426] [c.474] [c.33] [c.69] [c.108] [c.204]Смотреть главы в:
Прикладная статистика Исследование зависимостей -> Таблицы сопряженности