Последовательность наблюдений типа (12.1) принято называть временным рядом. Он имеет два главных отличия от рассматриваемых наблюдений анализируемого признака, образующих случайные выборки а) образующие временной ряд наблюдения л ь х2,. .., хп, рассматриваемые как случайные величины, не являются взаимно независимыми, и, в частности, значение, которое мы получим в момент времени th (k = 1, 2,. .., я), может существенно зависеть от того, какие значения были зарегистрированы до этого момента времени б) наблюдения временного ряда (в отличие от элементов случайной выборки), вообще говоря, не образуют стационарной последовательности, т. е. закон распределения вероятностей k-ro члена временного ряда (случайной величины xh x (tk)) не остается одним и тем же при изменении его номера в частности, от tk могут зависеть основные числовые характеристики случайной переменной xk — ее среднее значение Ex (tk) и дисперсия Dx (tk) (функцию от аргумента /, описывающую зависимость Ел (/) от времени, часто называют трендом временного ряда). [c.362]
Временной ряд х ( ), х (/2),. .., х (tn) отличается от последовательности наблюдений хь х2,. .., хп , образующих случайную выборку, тем, что члены временного ряда не являются ни статистически независимыми, ни одинаково распределенными. [c.370]
Случайная выборка. Последовательность наблюдений Х, . . . , Хп называется случайной выборкой объема п, если Х , . . . , Хп получены как независимые реализации некоторой случайной величины X с распределением F(x). При этом также говорят, что Xi,...,Xn есть выборка из генеральной совокупности X (или F(x)). С теоретико-вероятностной точки зрения случайная выборка X i, . . . , Хп может рассматриваться как последовательность независимых случайных величин, имеющих одно и то же распределение F(x). [c.531]
Однако следует помнить, что генераторы случайных чисел работают на детерминированных алгоритмах и воспроизводят так называемые псевдослучайные числа , поскольку с некоторого момента последовательности этих псевдослучайных чисел начинают повторяться, т. е. они не являются независимыми. В простейших генераторах это происходит уже через несколько тысяч генераций, а в более сложных — через миллиарды генераций. Если массив случайных чисел начинает повторяться слишком быстро, то метод Монте-Карло перестает моделировать случайные, независимые сценарии, и оценка VaR начинает отражать ограниченность генератора, а не свойства портфеля. Оптимальное количество шагов в процессе зависит от объема выборки, состава портфеля и сложности составляющих его инструментов и др. [c.269]
Если выборка у, У2,..., Уь-.., уп рассматривается как одна из реализаций случайной величины Y, временной ряд у, Уг,..., Уь—> Уп рассматривается как одна из реализаций (траекторий) случайного процесса1 Y(t). Вместе с тем следует иметь в виду принципиальные отличия временного ряда у, (t= 1,2,..., п) от последовательности наблюдений у, уг,..., у , образующих случайную выборку. Во-первых, в отличие от элементов случайной выборки члены временного ряда, как правило, не являются статистически независимыми. Во-вторых, члены временного ряда не являются одинаково распределенными. [c.135]
Что, если существует серийная зависимость Более серьезным нарушением, способным сделать неправомочным вышеописанное применение проверки по критерию Стьюдента, является серийная зависимость — случай, когдаданные в выборке не являются независимыми друг от друга. Сделки совершаются в виде временного ряда. Последовательность сделок, совершенных в течение некоторого периода времени, нельзя назвать случайной выборкой — подлинно случайная выборка состояла бы, например, из 100 сделок, выбранных случайным образом из всей популяции данных — от начала рынка (например, 1983 г. для S P 500) до отдаленного будущего. Такая выборка не только была бы защищена от серийной зависимости, но и являлась бы более представительной для популяции. Однако при разработке торговых систем выборка сделок обычно производится на ограниченном временном отрезке следовательно, может наблюдаться корреляция каждой сделки с соседними, что сделает данные зависимыми. [c.80]
При правильном выборе вида тренда отклонения от него будут носить случайный характер и изменение остаточной случайной величины не связано с изменением времени. По выборке, почученной для всех временных значений на рассматриваемом интервале, проверяется гипотеза о независимости последовательности значений е, от времени или наличии тенденции в ее изменении. Для проверки этою свойства может быть использован критерий определения тенденции с помощью восходящих и нисходящих серий. [c.426]
Существует вариант метода Монте-Карло, согласно которому можно не задавать какое-либо конкретное распределение для моделирования цен, а использовать непосредственно исторические данные. Подобно методу исторического моделирования, на основе ретроспективы моделируются гипотетические цены, но их последовательность не является единственной и не ограничена глубиной периода ретроспективы, поскольку выборка производится с воз-вращением, т. е. возмущение из исторических данных выбирается случайным образом, и каждый раз в выборе участвуют все данные. Эта загрузка (bootstrap) историческими данными позволяет учесть эффект толстых хвостов и скачки цен, не строя предположений о виде распределения. Это несомненные достоинства метода, который, в отличие от метода исторического моделирования, позволяет рассмотреть не какую-либо одну траекторию цен (сценарий), а сколь угодно много, что, как правило, повышает точность оценок. Недостатками загрузки является низкая точность при малых объемах выборки и использование предположения о независимости доходностей во времени. [c.271]
Однако на практике используемые при множественном выравнивании подмножества белков содержат много подобных последовательностей (о том числе - и с полностью дублирующими участками). Например, типичное белковое семейство в базах данных - это далеко не случайная выборка последовательностей, где домеяы с долговременной традицией исследования, а также по причине сильного медицинского или экономического влияния, представлены значительно более широко, независимо от их эволюционной роли. Помимо таких "технических" аспектов, статистические корреляции между подобными последовательностями могут являться результатом их общего эволюционного происхождения или в результате накладываемых общих функциональных требований. Близко связанные последовательности в значительной степени избыточны то есть, ло существу, они обеспечивают меньшее количество информации, чем более отдаленные члены семейства. [c.312]
Смотреть страницы где упоминается термин Последовательные выборки и независимость
: [c.121] [c.68] [c.279] [c.136] [c.147] [c.253]Смотреть главы в:
Наука об управлении -> Последовательные выборки и независимость