Парные выборки

Парные выборки Средние  [c.594]

Для проверки гипотез о различиях используют параметрические и непараметрические методы. Из параметрических методов для проверки гипотезы относительно среднего совокупности используют Его различные типы подходят для проверки гипотезы, в основе которой лежит одна выборка, две независимые выборки или парные выборки. Из непараметрических методов популярны критерии, включающие критерий согласия  [c.598]


Дисперсионный анализ с повторными измерениями отличается от изученных ранее методов, где принималось, что каждого респондента подвергают испытаниям при одной комбинации условий эксперимента, сказанное относится и к межгрупповому плану (сравнение разных групп объектов) [23]. Дисперсионный анализ с повторными измерениями можно рассматривать как распространение для парной выборки для случая с более, чем двумя взаимосвязанными выборками.  [c.628]

Чтобы разработать эту модель, Альтман проводил исследования, используя парные выборки успешных и неуспешных компаний, собирал соответствующие данные по каждому предприятию за пять лет до краха. Он обнаружил, что модель, выраженная через указанную выше формулу, способна предсказать неудачу не позднее чем за два года до наступления банкротства. Однако точность предсказания модели снижалась по мере удаления от периода банкротства.  [c.121]

Например, по выборке объемом 32 единицы получен парный коэффициент корреляции 0,319. Число степеней свободы для него равно 30, поскольку в расчете г участвуют две величины, значения которых закреплены - J и у. За счет этого мы теряем две степени свободы 32 - 2. Так как критическое значение для 30 степеней свободы равно (при уровне значимости 0,05) 0,3494, то полученное значение ниже критического по модулю. Соответственно, гипотеза о связи признаков надежно не доказана. Неверен вывод и об отсутствии связи - он также надежно не доказан. Из табл. 5 приложения видно, что при малой выборке надежно можно установить только тесные связи, а при большой численности совокупности, например, 102 единицы, надежно измеряются и слабые связи. Этот вывод важен для практической работы по корреляционному анализу.  [c.250]


Частный коэффициент корреляции гу.12---р> как и парный коэффициент Гу, может принимать значения от —1 до +1. Кроме того, rtj i...p, вычисленный на основе выборки объема п, имеет такое же распределение, как и Гу, вычисленный по п =п—р+2 наблюдениям. Поэтому значимость частного коэффициента корреляции Гу 2---p оценивают так же, как и обычного коэффициента корреляции г (см. 3.6), но при этом полагают п =п-р+2.  [c.129]

Пример 5.5. Для исследования зависимости между производительностью труда (Х ), возрастом (Х ) и производственным стажем (А"з) была произведена выборка из 100 рабочих одной и той же специальности. Вычисленные парные коэффициенты  [c.129]

Для полного ряда из 15 значений критерий однородности (Var < 0,33) не выполняется, следовательно, использовать полный ряд значений прибыли нельзя. Лишь исключив по четыре наибольших и наименьших значения, можно привести этот ряд к однородности. Проверка нормальности для усеченной совокупности данных (по 7 оставшимся магазинам) показывает, что все три ряда значений нормальны Правда, при этом вызывает сомнение правомочность использования статистических процедур на столь малой выборке. Однако если отвлечься от этого факта, то и в этом случае зависимость вида z = а + Ь х + Ь2у не даст аналитику значимой информации, поскольку между факторами хну наблюдается сильная взаимозависимость (мультиколлинеарность) - об этом свидетельствует высокое значение парного коэффициента корреляции (на усеченной выборке г = -0,88).  [c.104]

Парные коэффициенты корреляции, подсчитанные на выборке, состоящей из 420 проходчиков, приведены в табл. 82.  [c.147]

Парный коэффициент корреляции. Отклонение выборочного коэффициента корреляции от соответствующего парного коэффициента корреляции генеральной совокупности (как и других характеристик) зависит от величины коэффициента корреляции и объема выборки. Однако распределение выборочного коэффициента корреляции не может быть симметричным поскольку он всегда заключен в пределах от — 1 до +1. Очевидно, скошенность распределения должна увеличиваться по мере приближения коэффициента корреляции к +1 или — 1. Р Фишер [29.175 — 180) показал, что величина  [c.163]


Итак, цель задачианализ статистической связи шести параметров полупроводникового прибора. Обозначим эти параметры Xi, xz, x3, 4> хь, хв. Между собой они причинно не связаны. В соответствии с нормами технических условий из общей массы выделялись годные приборы и анализировалась как вся масса приборов, так и годные. Это позволило попытаться уловить различие во взаимосвязи параметров приборов до и после их отбраковки. Эмпирические корреляционные отношения рассчитывались только для годных приборов, поскольку разброс параметров для всей совокупности приборов был настолько велик, что подсчитывать корреляционные отношения не имело смысла. Доверительные интервалы ввиду большого объема выборки подсчитывались по формуле [37]. Сравнение парных коэффициентов корреляции с эмпирическими отношениями использовалось для проверки линейности связи между параметрами. Эмпирическому корреляционному отношению приписывается тот знак, который имеет парный коэффициент корреляции. Связь считается линейной, если корреляционное отношение попадает в доверительный интервал для парного коэффициента корреляции. Может показаться, что мы противоречим высказанному выше утверждению о том, что не существует формальных методов, позволяющих определить форму связи. Однако в данном случае мы говорим не об определении формы связи с целью, например, нахождения параметров уравнения регрессии и дальнейшей интерпретации или экстраполяции в каком-либо виде. Единственная наша забота состоит в том, чтобы парные коэффициенты корреляции (или иные оценки тесноты связи) были действительными характеристиками связи. В табл. 94 приведены в первой строке каждой клетки — парный коэф-  [c.188]

По смыслу коэффициент у аналогичен коэффициенту парной корреляции г, он изменяется в интервале от -1 до +1. При этом не требуется больших объемов выборки, расчеты можно выполнять даже при п = 3. К тому же не нужны точные количественные значения а, и Ь,, достаточно знать их ранги. Все это удобно для работы с картограммами, где используются интервальные шкалы, а объем выборки ограничен числом административных районов.  [c.225]

Как и в случае парной регрессии, истинные значения параметров PJ по выборке получить невозможно. В этом случае вместо теоретического уравнения регрессии (6.3) оценивается так называемое эмпирическое уравнение регрессии. Эмпирическое уравнение регрессии представим в виде  [c.144]

Рассмотрим теперь задачу оценки коэффициентов парной линейной регрессии более формально. Предположим, что связь между х и у линейна у = а+рх. Здесь имеется в виду связь между всеми возможными значениями величин х и у, то есть для генеральной совокупности. Наличие случайных отклонений, вызванных воздействием на переменную у множества других, неучтенных в нашем уравнении факторов и ошибок измерения, приведет к тому, что связь наблюдаемых величин х( и j/ приобретет вид yt = а. + РХ + е(. Здесь е - случайные ошибки (отклонения, возмущения). Задача состоит в следующем по имеющимся данным наблюдений х , (у) оценить значения параметров айв, обеспечивающие минимум величины Q. Если бы были известны точные значения отклонений е(, то можно было бы (в случае правильности предполагаемой линейной формулы) рассчитать значения параметров аир. Однако значения случайных отклонений в выборке неизвестны, и по наблюдениям х и у, можно получить оценки параметров аир, которые сами являются случайными величинами, поскольку соответствуют случайной выборке. Пусть а - оценка параметра а, Ь - оценка параметра р. Тогда оцененное уравнение регрессии будет иметь вид y=a+bx+et, где е - наблюдаемые значения ошибок е.  [c.296]

Значения экономических переменных определяются обычно влиянием не одного, а нескольких объясняющих факторов. В таком случае зависимость у =Дх) означает, что х - вектор, содержащий т компонентов х = (х,, х2,. .., хт). Задача оценки статистической взаимосвязи переменных у и х"= (х(, х,,. .., хга) формулируется аналогично случаю парной регрессии. Записывается функция у = Да,х)+е, где а - вектор параметров, е - случайная ошибка. Предполагается, что эта функция связывает переменную у с вектором независимых переменных х для данных генеральной совокупности. Как и в случае парной регрессии, предполагается, что ошибки е являются случайными величинами с нулевым математическим ожиданием и постоянной дисперсией е( и е статистически независимы при ij. Кроме того, для проверки статистической значимости оценок а обычно предполагается, что ошибки е( нормально распределены. Поданным наблюдений выборки размерности л требуется оценить значения параметров а, то есть провести параметризацию выбранной формулы (спецификации) зависимости.  [c.307]

Парные наблюдения берутся из двух совокупностей. Докажите, что требуемый объем выборки для единичных наблюдений, заданный (72), наибольший мри a =a2 (и парные наблюдения имеют положительную ковариацию).  [c.163]

Описывать анализ данных, связанный с параметрической проверкой гипотез для одной выборки, двух независимых выборок и парных выборок.  [c.552]

Дальнейшая классификация проводится в зависимости от количества выборок одна, две или больше. Как объяснялось в главе 14, число выборок определяют, исходя из метода дальнейшей обработки данных для анализа, а не из того, как были собраны данные. Выборки независимы в том случае, если взяты случайным образом из различных генеральных Для анализа данные, различным группам респондентов, например мужчинам и обычно обрабатывают как выборки. С другой стороны, выборки являются парными когда данные двух выборок имеют отношение к одной и той же группе респондентов.  [c.581]

В этом примере руководители маркетинговых компаний и их клиенты представляют две независимые выборки. Однако выборки не всегда независимые. В случае парных выборок следует использовать другой набор критериев.  [c.593]

Критическое значение коэффициента парной корреляции при уровне значимости оС = 0,95 равно соответственно ZKpfab = 0,95) = 0,576 м при уровне значимости Q(, = = 0,98. равно Z/f/j/o 0,98) = 0,658 для объема выборки / = 10. Это свидетельствует об отсутствии линейной зависимости между фактическим удельным расходом и выбранными факторами для нашей выборки. Анализ данных по указанным объединениям показывает, что разброс фактических удельных расходов очень велик, что и послужило причиной низких значений коэффициентов парной корреляции.  [c.51]

Необходимость применения многофакторного корреляционного анализа. Этапы многофакторного корреляционного анализа. Правила отбора факторов для корреляционной модели. Обоснование необходимого объема выборки данных для корреляционного анализа. Сбор и статистическая оценка исходной информации. Способы обоснования уравнения связи. Основные показатели связи в корреляционном анализе и их интерпретация. Сущность парных (общих), частных и множественных коэффициентов корреляции и детерминации. Оценка значимости коэффициентов корреляции. Порядок расчета уравнения множественной регрессии шаговым способом. Интерпретация его параметров. Назначение коэффициентов эластичности и стандартизированных бетта-коэф-фициентов.  [c.138]

Коэффициент корреляции как измеритель степени тесноты связи в двумерных нормальных схемах. Пусть исследуется парная зависимость между случайными переменными t] и типа С (или между г и типа D), см. В. 5. Предположим, что имеющиеся в нашем распоряжении результаты наблюдения ( , //J, (х2, /2), , ( п, Уп) представляют собой выборку из двумерной нормальной генеральной совокупности (см. [14, с. 171]) В этом случае введенный ранее (1.6) индекс корреляции просто выражается через коэффициент корреля-  [c.61]

Вернемся к общему (негауссовскому) случаю. Практика многомерного статистического анализа показала, что частные коэффициенты корреляции, определенные соотношениями (1.22) — (1.23 ), являются, как правило, удовлетворительными измерителями очищенной линейной связи между х(1) и при фиксированных значениях остальных переменных и в случае, когда распределение анализируемых показателей ( (0), x(l . .., х(р>) отличается от нормального. Определив с помощью формулы (1.22) частный коэффициент корреляции в случае любого исходного распределения признаков (х(0 х(1 . .., х(р)), включим его в общий математический инструментарий корреляционного анализа линейных моделей. При этом их можно интерпретировать как показатели тесноты очищенной связи, усредненные по всевозможным значениям фиксируемых на определенных уровнях мешающих переменных. 1.2.3. Статистические свойства выборочных частных коэффициентов корреляции (проверка на статистическую значимость их отличия от нуля, доверительные интервалы). При исследовании статистических свойств выборочного частного коэффициента корреляции порядка k (т. е. при исключении опосредованного влияния k мешающих переменных) следует воспользоваться тем (см., например, [20, теорема 4.3.4]), что он распределен точно так же, как и обычный (парный) выборочный коэффициент корреляции между теми же переменными с единственной поправкой объем выборки надо уменьшить на k единиц, т. е. полагать его равным п — , а не я. Поэтому  [c.84]

Игнорирование этого обстоятельства является причиной многих недоразумений и неудач в прикладных исследованиях, опирающихся на аппарат регрессионного анализа. Для объяснения этого обстоятельства представим себе, что при исследовании линейной парной регрессионной зависимости исходные данные (xt, /0 /=Т л фиксировались при переключающемся (в неизвестные для исследователя моменты времени) режиме типа условий эксперимента либо в режиме 1, в котором (при весьма высокой корреляции) регрессия имела монотонно возрастающий характер, либо в режиме 2, в котором (при столь же высокой корреляции) регрессия имела монотонно убывающий характер (см. рис. 13.1). Очевидно, попытки выявить связь между у и х по такой смешанной выборке не увенчаются успехом вычисления покажут, что связи нет. В то же время, если предварительно (или одновременно с решением задач регрессии) разбить имеющиеся данные на однородные (по условиям эксперимента) подвыборки и строить функции регрес-  [c.395]

Во многих маркетинговых исследованиях наблюдения для двух групп не берут из независимых выборок. В таком случае наблюдения называют парными или выборками (paired samples), поскольку два набора наблюдений относятся к одним и тем же респондентам.  [c.587]

Поскольку этот коэффициент первоначально предложил Карл Пирсон Pearson), его также называют корреляции Пирсона. Кроме того, он известен как простой коэффициент корреляции, линейный корреляции или просто коэффициент корреляции, Имея выборку, размером п наблюдений, коэффициент парной корреляции для переменных вычислить по формуле  [c.642]

Дисперсионный анализ (ANOVA) чрезвычайно полезный инструмент в практике маркетинговых исследований, поскольку именно его используют чаще всего для снижения кумулятивной ошибки. Она представляет собой кумулятивный эффект ошибки I рода (ошибка первого рода означает утверждение, что числа различаются, когда фактически они не различаются между собой) во всех парных сравнениях, Однако, прежде чем вы решите использовать дисперсионный анализ, должны убедиться, что вы имеете соответствующие данные, Дисперсионный анализ служит методом выявления различий между номинальными независимыми переменными, влияющими на значения метрической зависимой переменной. Помимо того, что вы должны иметь номинальную независимую переменную (например, торговую марку, товар) и метрическую зависимую переменную (например, рейтинги эффективности, рейтинги важности, уровни осведомленности), ваши данные должны удовлетворять следующим допущениям дисперсионного анализа значения переменных в выборке должны подчиняться закону нормального распределения и дисперсии совокупностей должны быть равны. Если окажется, что данные в значительной степени не удовлетворяют этим допущениям, то следует использовать непараметрические методы, например критерий  [c.818]

Был разработан ряд методик и моделей, в которых задействованы коэффициенты, претендующие на предсказание будущих финансовых затруднений. Ранние исследования были посвящены изучению отдельных коэффициентов для определения того, насколько они являются хорошим или плохим индикатором будущих финансовых сложностей. Первое исследование в этой области было проведено Бивером [1], который сравнил значимые коэффициенты 79 компаний, которые потерпели неудачу в бизнесе в течение последующих десяти лет, с выборкой других 79 компаний, которые продолжали успешно работать в течение этого периода (в исследовании применялось парное сравнение, когда потерпевшая неудачу компания сопоставлялась с успешной компанией аналогичного масштаба из той же отрасли). Бивер обнаружил, что определенные средние коэффициенты демонстрировали действительно заметные различия между успешными и неуспешными компаниями (см. рис. 3.4).  [c.118]

Маркетинговые исследования Издание 3 (2002) -- [ c.0 ]