Некоторые компьютерные программы дают возможность воспользоваться более эффективными методами выборочного исследования, вытекающими, однако, из метода Монте-Карло. Один из них — широко распространенный метод латинского гиперкуба, с помощью которого производят статистическую обработку достоверных данных и получают такие же результаты после меньшего количества повторений, а следовательно, быстрее. Это техника выборки данных по слоям. Она эффективно использует генерирование случайных чисел программы Монте-Карло для выбора данных по конкретным слоям из суммарных кривых распределения частот. Это значительно расширяет спектр случайных значений переменных при относительно небольших усилиях. [c.173]
Для иллюстрации предположим, что проверяем гипотезу о том, что дисперсия по акции В меньше 25. Выборочная дисперсия составила 23, а число наблюдений равно 40 (следовательно, количество степеней свободы будет 40—1 = 39). Так как таблицы Х2-распределения дают значение вероятностей для левой части распределения, то для левосторонней проверки с уровнем значимости в 5% правая часть площади под кривой распределения будет составлять 95%. Критическое значение х2 для данной ситуации с 39 степенями свободы приближенно равно 26,5. Критерий проверки будет [c.245]
Полигон распределения и гистограмма есть реализация распределения выборочной совокупности при ограниченном числе наблюдений (N), а предельная кривая при N — > °° является распределением генеральной совокупности. Распределение генеральной совокупности является теоретическим распределением. Отдельные распределения изучены и поддаются точному аналитическому опи- [c.24]
Указанное свойство кривой распределения используется в методе выборочного исследования (см. главу V, 1). В этом методе кривая распределения представляет собой графическое воспроизведение той совокупности, выборкой из которой являются фактические данные. [c.83]
Поскольку всегда существует выборочная ошибка, то необходимо оценить разброс значений изучаемого параметра генеральной совокупности. Предположим исследователь выбрал уровень доверительности, равный 99%. Из свойств нормальной кривой распределения вытекает, что ему соответствует параметр Z = 2,58. Средняя для генеральной совокупности в целом вычисляется по формуле [c.39]
Числитель данной формулы характеризует разницу средних. Кроме того, необходимо учесть различие формы двух кривых распределения. Это осуществляется в знаменателе формулы. Выборочное распределение теперь рассматривается как выборочное распределение разницы между средними (процентными мерами). Если нулевая гипотеза является справедливой, то распределение разницы является нормальной кривой со средней равной нулю и средней квадра-тической ошибкой равной 1. [c.43]
Если представить, что было проведено бесконечное число выборок равного объема из одной и той же генеральной совокупности, то показатели отдельных выборок образовали бы ряд возможных значений выборочных средних величин х,, х-,, х3,. ... относительных величин / ,, р2, ръ. ... дисперсий s, s 2, s . .., и т. д. Каждая выборка имеет свою ошибку репрезентативности. Следовательно, можно построить ряды распределения выборок по величине ошибки репрезентативности для каждого показателя для средней, относительной величины и т.д. В таких распределениях улавливается тенденция к концентрации ошибок около центрального значения. Число выборок с той или иной величиной ошибки репрезентативности может быть симметрично или асимметрично относительно этого центрального значения. При бесконечно большом числе выборок получится кривая частот, которая представляет кривую выборочного распределения. Свойства таких распределений используются для получения статистических заключений, установления вероятности той или иной величины ошибки репрезентативности. [c.165]
В этой главе мы также рассмотрели распределение вероятностей. В частности, нормальное распределение, определяемое значениями средней арифметической и среднеквадратического отклонения. Непрерывное распределение вероятностей играет важную роль, оно возникает в ряде реальных ситуаций и особенно полезно при рассмотрении результатов выборочного обследования. Например, независимо от формы распределения, очерчиваемой исходной совокупностью, при взятии больших выборок и определении значений средних эти средние имеют тенденцию, что является фактом, приближаться к нормальному распределению. Знание такого распределения позволяет оценить вероятности различных переменных, например результаты оценочных тестов, критические объемы производства, поступление пациентов и длительность реализации проекта. Далее, нормальное распределение можно использовать при прогнозировании вероятностного диапазона получаемых значений, что достигается путем оценки участков под нормальной кривой. Это лежит в основе некоторых прак- [c.93]
Построив зависимость выборочного среднего от частоты, получим кривую нормального распределения (рис. 4.18). Искомая вероятность равна отношению площади под кривой выборочного распределения (заштрихованной) к площади под всей кривой. [c.159]
Можно определить, в каком интервале с вероятностью 0,95 лежит выборочное среднее Мв. Для этого на кривой влево и вправо от Л/г откладывается значение Л/г, чтобы между ними, было заключено 95% площади под кривой. Однако какой смысл в такой оценке, если для ее определения требуется экспериментально определить выборочное распределение, что практически неосуществимо Оказывается, что во многих случаях связь между параметрами и выборочным распределением носит такой характер, что распределение статистики можно построить теоретически. [c.159]
Далее строим гистограмму распределения (рис. 4.19). Обведем гистограмму плавной кривой и получим вид выборочного распределения. Теперь можно вычислить параметры распределения среднее значение дисперсию среднеквадратичное отклонение. [c.160]
Строго говоря, кривая неограниченно распространяется в обе стороны, средняя арифметическая лежит точно в центре кривой и, поскольку кривая симметрична, совпадает с модой и медианой. Свойства кривой нормального распределения имеют исключительно важное значение для оценки вероятных ошибок и в теории выборочных обследований. Кривая характеризуется параметрами о (среднее квадратическое отклонение) и х (средняя). [c.66]
Для точного описания уравнения регрессии необходимо знать условный закон распределения зависимой переменной Y при условии, что переменная X примет значение дс, т. е. Х=х. В статистической практике такую информацию получить, как правило, не удается, так как обычно исследователь располагает лишь выборкой пар значений (х/, у,) ограниченного объема п. В этом случае речь может идти об оценке (приближенном выражении, аппроксимаций) по выборке функции регрессии. Такой оценкой1 является выборочная линия (кривая) регрессии [c.52]
Выборочные данные группируют по интервалам, составляют гистограммы распределений и затем вычисляют различные статистики - количественные показатели, характеризующие пространственное распределение изучаемого явления. Наиболее употребительные показатели - среднеарифметическое, среднее взвешенное арифметическое, среднеквадратичное, дисперсия, вариация и др. Кроме того, с цомощью специальных показателей (критериев согласия) можно оценить соответствие данного конкретного распределения тому иди иному теоретическому закону распределения. Например, установить, согласуется ли эмпирическое распределение высот рельефа с кривой нормального распределения или подчиняется какой-либо иной функции. [c.222]
Площадь области под кривой выборочного распределения между любыми двумя точками можно рассчитать с помощью значений z (z value). Значение z точки — это число стандартных ошибок, на которое точка удалена от среднего. Значения z можно рассчитать следующим образом [c.447]