При больших объемах выборки статистику Fb можно определять по формуле [c.68]
Статистика продаж. В системе предусмотрена процедура сбора статистической информации по продажам. Пользователь сам определяет конфигурацию данных, по которым осуществляется выборка статистики по введенным заказам, аннулированным заказам, товарообороту. Можно также воспроизвести соответствующую информацию в графическом виде. [c.322]
Все это ведет к заключению, что чем больше выборка, тем более вероятность того, что найденные параметры системы будут представительным отражением характеристик рынка в целом. Маленькая выборка, скорее всего, будет непредставительной ее кривые вряд ли будут соответствовать долговременным, устойчивым характеристикам рынка. Любая модель, построенная с использованием маленькой выборки, может быть эффективной только по чистой случайности. Будет ли подгонка полезной или вредной , во многом зависит от отражения в ней случайных ценовых движений или реальных рыночных процессов, что, в свою очередь, зависит от представительности выборки. Статистика полезна, поскольку позволяет принять в расчет при оценке системы степень подгонки. [c.74]
Для контроля статистическим методом исследуется доля — выборка продукции в размере от 0,5 до 15 % от всего объема. Выборка зависит от соотношения между полем вариации и полем допуска. Последнее устанавливается на основе формул, известных из теории статистики. [c.94]
Выборочный контроль качества продукции основан на применении методов математической статистики для проверки соответствия качества контролируемой партии изделий установленным требованиям по выборочным характеристикам малой выборки из партии. [c.174]
Если бы она совпадала с выборочной долей, то особых трудностей для определения приемочного числа с при одноступенчатом контроле не было бы. Установив по экономическим соображениям допустимый уровень дефективности продукции, например, qb мы могли бы рассчитать приемочное число как с = qtn, где п - объем выборки из партии объемом N. Но это было бы неправильно. Из математической статистики известно, что характеристики выборочной [c.176]
Известно, что результаты прогнозирования методами математической статистики тем точнее, чем больше объем выборки, т.е. число объектов рассматриваемой совокупности (например, месторождения, УБР, объединения). Поэтому прогнозирование норм расхода отчетно-статистическим методом для скважин того или иного месторождения по выборке сравнительно малого объема приводит к результатам не— [c.79]
С точки зрения статистики использованные нами точечные оценки спроса — лишь выборка из множества возможных значений. То, насколько точно эта выборка представляет реальную действительность, — вопрос не бесспорный. Если допущения, принимаемые для облегчения анализа, будут чрезмерными, ценность результатов анализа для лица, принимающего решения, окажется ограниченной. [c.422]
В основу бюджетной статистики стали закладываться определенные научные принципы типическая пропорциональная выборка, механический отбор семей в пределах типических групп, представительность выборки семей по основным признакам их бюджета. [c.308]
Непростые отношения сложились между анализом и статистикой. Здесь даже существует мнение, что анализ является одним из разделов статистики, не более. Обосновывается это заключение тем, что большинство методов и способов экономического исследования одинаково используют обе науки. что они используют одинаковые источники информации, что аналитическое исследование является просто-напросто одной из задач статистики. С этим можно было бы согласиться, если бы не одно обстоятельство. Статистику как науку более интересует обобщение проявлений экономической жизни, поиск общих тенденций развития экономики на макроуровне. Для этого она через средние величины, выборку или каким-либо другим способом старается исключить нетипичные явления, она почти никогда не опускается до детального анализа производства на уровне подразделений предприятия, на уровне рабочего места. Это исключает из задач статистики поиск резервов, их обоснование, разработку рекомендаций по их освоению, что свидетельствует о существенных отличиях статистики и анализа хозяйственной деятельности предприятий. Вместе с тем нельзя не заметить, что эти науки в значительной степени взаимно обогащаются через обмен информации и методы исследования. [c.29]
Зарубежной статистикой доказано, что в долговременных расчетах формула Пааше занижает, а индекс Ласпейреса завышает изменение цен. Вследствие наличия отрицательной корреляции между индивидуальными индексами цен и количествами относительный вес товаров падает, если цена возрастает. Чем дальше отдаляется базисный год, тем больше, как правило, становится вариация индивидуальных цен и количеств, а также разность между индексами Ласпейреса и Пааше. Достижение неравенства /л > /п, называемого эффектом Ласпейреса, может в силу ряда причин превратиться в свою противоположность (7Л < /п) (отсутствие возможности замены товаров, ошибка выборки и др.). [c.562]
Статистик имеет дело с числовой и нечисловой информацией, с большими и малыми выборками, с вычислениями, таблицами и графиками. Имеется множество отечественных и зарубежных пакетов прикладных программ статистической обработки данных на персональных компьютерах и больших ЭВМ. Есть специальные программы, предназначенные для обучения студентов, которые содержат подробные объяснения всех процедур и тесты для проверки их усвоения. [c.4]
Каждый шаг исследования завершается интерпретацией полученных результатов какое заключение можно сделать, исходя из проведенного анализа, что говорят нам цифры - подтверждают ли они исходные предположения или открывают что-то новое Интерпретация данных ограничена исходным материалом. Если заключения основаны на данных выборки, то она должна быть репрезентативной, чтобы выводы были отнесены к совокупности в целом (см. гл. 7). Статистика позволяет выяснить все то полезное, что содержится в исходных данных, и определить, что и как можно использовать в принятии решений. [c.18]
Выборочный метод играет все большую роль в отечественной статистике, поэтому планирование выборки, методы отбора, оценки ее репрезентативности специально рассматриваются в гл. 7. [c.27]
В главе 2 отмечалось, что статистика далеко не всегда имеет дело с данными сплошного наблюдения. Из всех видов несплошного наблюдения главным является выборочное наблюдение, так как только выборочный метод имеет статистико-математическое обоснование распространения данных, полученных по выборке, на всю совокупность. [c.156]
В выводной статистике принято строго различать параметры и свойства генеральной совокупности и их оценки по данным выборки. С этой целью принята следующая система обозначений генеральные параметры обозначаются греческими буквами, выборочные показатели, которые рассматриваются как оценки генеральных параметров, обозначаются латинскими буквами. Например, [c.159]
Если отбор в соответствии с принятой схемой проводится из генеральной совокупности, предварительно разделенной на типы (слои или страты), то такая выборка называется типической (или расслоенной, или стратифицированной, или районированной). Еще одно деление выборки по видам определяется тем, что является единицей отбора единица наблюдения или серия единиц (иногда используют термин гнездо ). В последнем случае выборка называется серийной, или гнездовой. На практике часто используется сочетание типической выборки с отбором сериями. В математической статистике, обсуждая проблему отбора данных, обязательно вводят деление выборки на повторную и бесповторную. Первая соответствует схеме возвратного шара, вторая - безвозвратного (при рассмотрении процесса отбора данных на примере отбора шаров разного цвета из урны). В социально-экономической статистике нет смысла применять повторную выборку, поэтому, как правило, имеется в виду бесповторный отбор. Если выборка производится по схеме возвращенного шара, то вероятность попадания любой единицы в выборку равна 1/N, и она остается той же самой на протяжении всей процедуры отбора. Если выборка производится по схеме невозвращенного шара, то вероятность попадания единицы в выборку изменяется от /N— для первой отбираемой единицы, до —-------- - для [c.160]
Выполненная выборка формировалась как простая бесповторная механическая. Однако, наверняка статистик будет стремиться учесть структуру генеральной совокупности, поэтому более естественной была бы выборка, учитывающая выделение предприятий разных форм собственности. Тогда выборка должна быть районированной. [c.178]
Особенно часто процедура проверки статистических гипотез применяется для оценки существенности расхождений сводных характеристик отдельных совокупностей (групп) средних, относительных величин. Такого рода задачи, как правило, возникают в социальной статистике. Трудоемкость статистико-социологических исследований приводит к тому, что почти все они строятся на несплошном учете. Поэтому проблема доказательности выводов в социальной статистике стоит особенно остро. Применяя процедуру проверки статистических гипотез, следует помнить, что она может гарантировать результаты с определенной вероятностью лишь по беспристрастным выборкам, на основе объективных данных. [c.193]
Нулевая гипотеза отвергается тогда, когда по выборке получается результат, который при истинности выдвинутой нулевой гипотезы маловероятен. Границей невозможного или маловероятного обычно считают а = 0,05, т.е. 5%, или 0,01, 0,001. Если ориентироваться на правило трех сигм , то вероятность ошибки а должна быть равна 0,0027. Однако для этого уровня вероятности ошибки значения критериев редко табулируются как правило, значения критериев в статистико-математических таблицах рассчитаны для вероятностей ошибки 0,05 0,01 0,001. [c.194]
Корректировка применения х теста возможна лишь в том случае, если эмпирические данные, наполняющие таблицу сопряженности, есть результаты независимой случайной выборки относительно большого объема и. Последнее требование вызвано тем, что выборочное распределение х2 аппроксимирует табличное распределение статистики х2 только при больших п. Естественно, [c.205]
Ещ г одним примером подобной абстракции является обоснование возможности использования регрессионных моделей в экономическом и финансовом анализе. Принципы моделирования с помощью регрессионных зависимостей в теоретическом плане разработаны в рамках теории вероятностей и математической статистики в частности, там предполагается случайность выборки, независимость ее элементов, нормальность распределения и т.д. Эти условия на практике выполнены далеко не всегда. [c.62]
На практике приходится сталкиваться со специфическими задачами изучения массовых процессов, которые решаются лишь с помощью методологии выборки. К таким задачам относится исследование качества продукции, если она при этом уничтожается. На основе выборочного наблюдения изучается, например, качество электроламп, спичек, многих сплавов. Кроме того, в современных условиях развития внешнеэкономических связей России при наличии, в частности, большого числа импортируемых продуктов и непродовольственных товаров контроль их качества обеспечивается также путем выборочного исследования. При проведении выборочного обследования совокупность отобранных для обследования единиц в статистике принято называть выборочной, а совокупность единиц, из которых производится отбор, — генеральной. [c.129]
Отметим, что цели исследования многих явлений могут быть достигнуты только путем сплошного наблюдения. Поэтому способ проверки результатов сплошного наблюдения на основе коэффициентов успешно применяется в социальной и экономической статистике. До сих пор возможности выборки при уточнении данных сплошного наблюдения используются недостаточно. Однако применение выборочного обследования необходимо лишь в том случае, если данные сплошного обследования вызывают сомнение. Кроме того, необходимо иметь соответствующие денежные, материальные и трудовые ресурсы для его осуществления. [c.144]
Бюджетные обследования российской статистики основаны на репрезентативной выборке во всех национально-территориальных образованиях. Общее число домашних хозяйств, охваченных обследованиями, составляет около 50 тыс. Однако в выборку не попадают семьи работников Министерства обороны, МВД, ФСБ, [c.602]
Из этого можно сделать вывод, что решение о пространственном характере выборки в известной степени субъективно и связано с условиями используемой модели. Впрочем, то же самое можно сказать о многих предположениях, которые делаются в математической статистике и особенно ее приложениях. [c.15]
Суть проверки (тестирования) статистической гипотезы заключается в том, что используется специально составленная выборочная характеристика (статистика) 0 (х, Х2,..., х ), полученная по выборке Х, Х ,..., Х , точное или приближенное распределение которой известно. Затем по этому выборочному распределению определяется критическое значение [c.46]
При справедливости гипотезы р = 0 распределение статистики h при увеличении объема выборки стремится к нормальному с математическим ожиданием, равным нулю, и дисперсией, равной единице. Таким образом, гипотеза об отсутствии автокорреляции ошибок отвергается, если наблюдаемое значение статистики h окажется больше, чем критическое значение стандартного нормального распределения. [c.214]
Набор товаров-представителей, аналогичных и идентичных для сравниваемых стран, как одно из необходимых условий определения П. с. в., — это, по существу, сознательная организованная выборка. Строгого теоретического обоснования относительно оптимального числа товаров-представителей, используемых в статистике международных сопоставлений для определения пересчетных валютных коэффициентов, пока нет. Дискуссионной остается также методологическая концепция выбора формы построения международного индекса цен, используемого при сравнении уровней экономического развития стран как на основе свободно-экономических показателей баланса народного хозяйства. [c.162]
Заказы на товары длительного пользования и прочие товары производственные запасы. Определяется количество заказов, поступивших производителям, а также уровень товарных запасов в промышленности. Кроме того, заказы на товары длительного пользования характеризуют уровень покупательной способности населения. Объем их производства в будущем периоде определяется по результатам 7-процентной выборки промышленных предприятий на основе данных о количестве заказов на товары длительного пользования. В Российской статистике не рассчитывается. [c.298]
Пусть теперь (a, b) = (ai,..., am, bi,..., bm) - статистика, определенная на выборочном пространстве матрицы X уравнениями (4.29), (4.30), и необходимо разработать прогноз х = (х ) неизвестной выборки х, для которой задано лишь значение статистики (а, Ь) [c.128]
А. Пирс [11] считал концепцию строгой аддитивности функции потребительского эффекта недостаточной, но проведенные им пробные расчеты на основе бюджетной статистики при более жестких ограничениях на однородность выборки и связности потребительских эффектов дали тем не менее результаты, близкие к тем, что были получены при исходных предпосылках о наличии полной аддитивности функции. [c.266]
При статистическом контроле очень важен выбор подконтрольных изделий, называемый в статистике выборкой. Эта выборка, как говорят в статистике, должна быть репрезентативной, т. е. представительной. Другими словами, выборка должна быть характерной для всех выпускаемых изделий данного типоразмера. [c.154]
В результате указанного процесса выбор объектов из генеральной совокупности, соответствующий последовательности открытий, происходит с приоритетом крупных месторождений. Именно поэтому статистика открываемых месторождений, особенно на ранних стадиях освоения района, характеризуется приуроченностью основной части запасов к более крупным месторождениям. Это обстоятельство, а также представление об отсутствии математического ожидания у размеров структур (а значит, и у размера запасов месторождений) обусловили использование гиперболических законов с расходящимся математическим ожиданием (например, закона Парето). Действительно, если выборку b обрезать на любом шаге i
Оптимальное число столбцов должно зависеть не только от объема выборки, как это указано в большинстве пособий по статистике. Очевидно, что это число зависит еще и от формы распределения. Действительно, если плосковершинные распределения можно приблизить достаточно малым количеством столбцов, то для островершинных распределений с их длинными, пологими спадами это количество естественно должно быть больше. [c.81]
Служба общественного мнения, проводя опрос, использует научные методы статистику, анализ выборки и так далее. Но ей нужно и уметь брать интервью или правильно формулировать вопросы, а так же чувствовать эмоциональную реакцию их контингента. Опрос общественного мнения остается комбинацией науки и искусства. Если сотрудник службы общественного мнения начнет утверждать, что он ученый, спросите его, как же так получилось, что все наиболее известные службы, проводящие опросы общественного мнения в США, тяготеют либо к Республиканской, либо к Демократической партии. Истинная наука не партийна. [c.40]
Дальнейшее совершенствование методики определения прогрессивной суточной производительности установки возможно путем моделирования работы установки на ЭВМ с применением экономико-математических методов. В частности, таким, на наш взгляд, более совершенным методом определения прогрессивной суточной производительности является метод, описанный в работе [ 12 ]. Для устранения недостатков определения прогресбивной суточной производительности по действующей инструкции предложена методика с использованием теории порядковых статистик. Она состоит из двух этапов. На первом этапе осуществляют последовательное исключение из выборки значений, не соответствующих экстремальным. Второй этап заключается в расчете устойчивой максимальной производительности установки. В качестве такой производительности принимается наиболее вероятное ее значение, оцененное по выборке максимальных производительностей, которая подчиняется закону распределения экстремальных статистик. [c.87]
Теория малых выборок разработана английским статистиком В. Госсетом (писавшим под псевдонимом Стьюдент) в начале XX в. В 1908 г. им построено специальное распределение, которое позволяет и при малых выборках соотносить / и доверительную вероятность F(t). При п > 100 таблицы распределения Стьюдента дают те же результаты, что и таблицы интеграла вероятностей Лапласа, при 30 < п < 100 различия незначительны. Поэтому практически к малым выборкам относят выборки объемом менее 30 единиц (безусловно, большой считается выборка с объемом более 100 единиц). [c.190]
В области социальных исследований для государственной статистики главным является бюджетное обследование, которое охватывает примерно 48 тыс. домохозяйств. Оно основано на многоступенчатом отборе. Общий объем выборки распределяется по сферам занятости (для работающих) и территориям. Затем для работающих производится отбор предприятий в пределах каждой отрасли в отобранной территории. Если, например, нужно отобрать 100 рабочих, занятых в определенной отрасли, для обследования семейных бюджетов так, чтобы на каждом отобранном предприятии было не менее 20 бюджетов, включающих рабочих с разным уровнем заработной платы, то, значит, должно быть отобрано 100 20 = 5 предприятий. Отбор предприятий проводят по списку, в котором предприятия располагаются в порядке убывания средней заработной платы рабочих, указываются общее число рабочих, их суммарная заработная плата. Шаг отбора определяется делением общего числа рабочих на предприятиях данной отрасли на число отбираемых предприятий. Если всего на предприятиях данной отрасли в области занято 30525 человек, то шаг отбора равен 30 525 5 = 6105. По данным кумулятивной численности рабочих с данным шагом отбора производится отбор предприятий, которые затем проверяются на репрезентативность по показателю средней месяч- [c.218]
Главной проблемой являлось определение параметров ц и а логнормального закона распределения для каждого НГО. Исходная статистика, в этом случае — выборка из уже открытых месторождений. Использование такой статистики для определения параметров логнормальяого закона зависит от локализации открытых месторождений на площади НГО. Если совокупность месторождений локализована на небольшом участке, то выборку можно считать произведенной с эталонного участка, т. е. считать, что ее параметры ц и а близки к соответствующим параметрам для всей НГО. Если открытые месторождения разбросаны по всей площади, значит статистика явно завышает математическое ожидание, так как большие месторождения обычно открываются с приоритетом. Следовательно, в данном случае необходима поправка на возможное существование в области большого количества мелких месторождений. [c.204]
Факторный анализ используется для изучения структуры данных. Основной его посылкой является предположение о существовании таких признаков - факторов, которые невозможно наблюдать непосредственно, но можно оценить по нескольким наблюдаемым первичным признакам. Так, например, такие признаки, как объем производства и стоимость основных фондов, могут определять такой фактор, как масштаб производства. В отличие от нейронных сетей, требующих обучения, факторный анализ может работать лишь с определенным числом наблюдений. Хотя в принципе число таких наблюдений должно лишь на единицу превосходить число переменных рекомендуется использовать хотя бы втрое большее число значение. Это все равно считается меньшим, чем объем обучающей выборки для нейронной сети. Поэтому статистики указывают на преимущество факторного анализа, заключающееся в использовании меньшего числа данных и, следовательно, приводящего к более быстрой генерации модели. Кроме того, это означает, что реализация методов факторного анализа требует менее мощных вычислительных средств. Другим преимуществом факторного анализа считается то, что он является методом типа white-box, т.е. полностью открыт и понятен - пользователь может легко осознавать, почему модель дает тот или иной результат. Связь факторного анализа с моделью Хопфилда можно увидеть, вспомнив векторы минимального базиса для набора наблюдений (образов памяти - см. Главу 5). Именно эти векторы являются аналогами факторов, объединяющих различные компоненты векторов памяти - первичные признаки. [c.202]
В США, например, статистика охватывает 19000 розничных торговых фирм и 57000 домашних хозяйств в качестве представительной выборки из примерно 80% населения страны. В составе потребительской корзины 44,1% представляют товары, а 55,9% -услуги. Ввиду того что цены на продукты питания и энергоносители подвержены наибольшим изменениям (как циклическим, так и по причине различных экономических шоков), отдельно также поставляется индикатор ore PI, в котором из состава корзины исключены продукты питания и источники энергии ( PI EX FOOD ENERGY). [c.62]
Управление трудовой статистики (Bureau of Labor Statisti s, B S) ежемесячно проводит общенациональные выборочные опросы примерно 60 тыс. до-мохозяйств для определения числа занятых и числа безработных. Людям предлагают ответить на ряд вопросов, в том числе кто из членов семьи работает, кто остался без работы, кто ищет или не ищет работу и т.д. Несмотря на то что выборка проводит -ся очень тщательно и используются надежные методы опроса, полученные данные постоянно подвергаются критике. [c.164]
Стандартные модели и симуляции сценариев экстремальных событий служат многочисленными источниками ошибки, каждая из которых может иметь отрицательное воздействие на действительность предсказаний [232]. Некоторые из вероятностных переменных находятся под контролем в процессе моделирования -они обычно подразумевают балансирование между более полным описанием и реализуемостью вычислений. Другие источники ошибки находятся вне контроля, поскольку они свойственны методологии моделирования в определенных научных дисциплинах. Обе известных стратегии моделирования ограничены в этом отношении аналитические теоретические предсказания находятся вне досягаемости для большинства сложных проблем. Грубая сила числового решения уравнений (когда они известны) или сценариев, дает надежные результаты лишь в "центре распределения", то есть в режиме, далеком от крайностей, где может быть накоплена хорошая статистика. Кризисы - это чрезвычайные события, которые происходят редко, хотя и с экстраординарными последствиями. Таким образом, редкие катасторофические события полностью не имеют статистической выборки и не укладываются в рамки какой-либо модели. Даже появление "терра" суперкомпьютеров качественно не меняет этого фундаментального ограничения. [c.33]
Диаграмма Ньюмана-Пирсона (Neyman-Pearson), которая также называется диаграммой качества решений, используется для оптимизации стратегии принятия решений при помощи лишь статистики, лежащей в основе критерия. Предполагается, что набор событий или функция плотности вероятности действительны как для верных сигналов (крахов), так и для фонового шума (ложных предсказаний) В таком случае, подходящая статистика в основе критерия должна быть способна оптимально разграничивать их. Используя данную статистику (или дискриминирующую функцию), можно ввести разграничение, разделяющее область принятия гипотезы (с преобладанием верных предсказаний) от области непринятия гипотезы (с преобладанием ложных предсказаний). Диаграмма Ньюмана-Пирсона выстраивает контаминацию (ошибочно классифицированные события, то есть, расцененные как предсказания, на самом деле являющиеся ложными сигналами) против потерь (ошибочно классифицированные события, то есть, расцененные как фон или неверные сигналы), как доли общей выборки. Идеальная тестовая статистика соответствует диаграмме, где "принятие предсказания" выстраивается как функция "принятия ложных сигналов", в которой принятие близко к 1 для реальных сигналов и близко к О для ложных сигналов. Возможны несколько стратегий "либеральная" стратегия отдает предпочтение минимальным потерям (то есть высокая степень принятия сигнала, то есть почти полное отсутствие пропусков реальных событий, но много ложных предсказаний), "консервативная" стратегия отдает предпочтение минимальной контаминации (то есть высокая степень чистоты сигнала и почти полное отсутствие ложных сигналов при множестве возможных пропущенных реальных событий). [c.342]