О ложной корреляции (влияние третьего фактора)

О ложной корреляции (влияние третьего фактора )  [c.24]

Таким образом, высокий коэффициент корреляции между продолжительностью плавки и процентом забракованных труб полностью обусловливался влиянием третьего, не учтенного при исследовании фактора — характеристики качества сырья. Если же этот фактор был бы с самого начала учтен, то никакой значимой корреляционной связи между временем плавки и процентом забракованных труб мы бы не обнаружили. За счет подобных эффектов (одновременного влияния неучтенных факторов на исследуемые переменные) может ис кажаться и смысл истинной связи между переменными, т. е., например, подсчеты приводят к положительному значению парного коэффициента корреляции, в то время как истинная связь между ними имеет отрицательный смысл. Такую корреляцию между двумя переменными часто называют ложной . Более детально подобные ситуации — обнаружение и исключение общих причинных факторов , расчет очищенных , или частных,, коэффициентов корреляции и т. п. — исследуют методами многомерного корреляционного анализа (см. 1.2). Такого рода недоразумения с причинным толкованием статистических связей наиболее вероятны в ситуациях, когда исходными статистическими данными являются показатели работы действующего предприятия. Их обычно удается свести к минимуму при получении данных из искусственно поставленного эксперимента.  [c.65]