Рассмотрим следующий пример. Торговая модель, использующая 2 скользящих средних, тестируется на выборке данных за 200 дней. Самая длинная скользящая средняя может иметь период 50 дней. Для ее вычисления используются данные за 50 дней, что приводит к потреблению 50 степеней свободы. При этом остается лишь 150 дней, которые могут генерировать сигналы. Если генерируется 5 сделок, мы имеем 2 скользящих средних, стоп-лосс, и т.д... (т.е., 5 правил продуцируют 5 сделок). Следовательно, этот тест должен быть либо отменен, либо модифицирован. Модифицировать его можно путем увеличения числа точек данных в выборке, сокращения периода длинной скользящей средней в данном тесте или исключением ограничивающих правил. [c.124]
Подраздел порядок (упорядоченность) определяет ошибки контроля, возникающие из-за неправильной последовательности выполнения вычислений или тестов, т. е. сами по себе процессы являются корректными, но выполняются в непредусмотренной последовательности. Примером может служить использование переменной до вычисления ее значения, выполнение одной подпрограммы перед другой, причем первой из подпрограмм требуются данные, получаемые во второй. [c.62]
Такие тесты проводились на различных финансовых рынках. Конкретный пример — форвардные рынки. В этом случае тест на эффективность состоит в том, чтобы проверить, дают ли форвардные цены несмещенную оценку будущих реальных цен. Если мы обозначим через FT форвардные цены (фиксированные в момент т на срок т + 1) и через ST+1 — реальные будущие цепы, то гипотеза несмещенности утверждает [c.121]
По каждому показателю, применяемому для оценки квалификации и профессиональной компетентности работника, в разрабатываемых положениях следует предусмотреть конкретные критерии, позволяющие характеризовать соответствие работника предъявляемым требованиям. Это необходимо для того, чтобы аттестационные комиссии имели возможность на основе материалов, представленных на каждого аттестуемого, и непосредственного знакомства с последним (в процессе собеседования с применением оценочных тестов, заслушивания ответов на вопросы и т.п.) дать объективную оценку его деятельности и высказать суждение о присвоении работнику того или иного разряда оплаты. В табл. 11.3 приводится пример перечня показателей, учитываемых в процессе аттестации. [c.261]
На рис. 11.3, а зависимость отражается обыкновенной линейной регрессией. На рис. 11.3, б в модели учитываются изменения, произошедшие с некоторого момента t в характере расположения точек наблюдений. На данном примере хорошо видно, каким образом можно проанализировать, имеет ли смысл разбивать выборку на части и строить для каждой из них уравнение регрессии (т. е. фактически строить сложную регрессию с фиктивными переменными) (рис.11.3, б) либо можно ограничиться общей "обыкновенной" регрессией для всех точек наблюдений (рис. 11.3, а). Для этого можно использовать тест Чоу, который упоминался в разделе 6.7.3. [c.264]
Большая часть статистики в табл. 4-2 идентична показателями табл. 4-1 из примера 1. Добавлены два дополнительных показателя — Количество тестов оптимизации и Скорректировано по оптимизации . Первый показатель — просто количество различных комбинаций параметров, т.е. число испытаний системы по выборке данных с различными параметрами. Поскольку первый параметр системы на лунном цикле, L1, принимал значения от 1 до 20 с шагом в 1, было проведено 20 тестов и соответственно получено 20 значений t-критерия. [c.81]
В примере 1 представлен тест с проверкой системы, в примере 2 — оптимизация на данных из выборки. При обсуждении результатов мы возвращаемся к естественному порядку проведения тестов, т.е. сначала оптимизация, а потом проверка. [c.83]
Тесты на достижение — проверка уровня максимально достигаемой производительности работника. Характерный пример теста на достижение — процедура сдачи экзамена на право носить краповый берет, что включает кросс по пересеченной местности, стрельбу, преодоление полосы препятствий и бой без правил с шестью инструкторами по рукопашному бою. Но и в мирной жизни возможно применение теста на достижение. Например, кандидату на должность секретаря-референта диктуется с максимальной скоростью сложный текст, а затем проверяется число опечаток, пропущенных слов, неоконченных фраз и т. п. Применение тестов надостижение особенно уместно при отборе кандидатов надолжности, связанные с частой штурмовщиной , авралами и т. д. [c.450]
Особое значение приобретает такое направление в тестировании, которое предполагает отказ от каких бы то ни было подсказок. Например, тест Шонди. Человеку показывают фотографии различных людей, и он должен выбрать того, с кем бы он согласился, к примеру, путешествовать в одном вагоне поезда. Но человеку не скажут, что в одном из экспериментов перед ним будут фотографии людей с психическими отклонениями (маньяков, параноиков, садистов и т.д.). Сделанный им выбор покажет нам его предпочтения и антипатии, даст объяснение некоторых его проблем. Тот же тест использовался для поиска глубинных мотиваций пьющих людей. Было установлено, что 85% алкоголя выпивает 22% пьющих людей. Что же ими движет Тест Шонди использовался до и после трех приемов алкоголя. Как оказалось, человек пьет до тех пор, пока не войдет в более приятную для себя психологическую роль слабый человек чаще всего стремится стать сильным, неудачник хочет почувствовать себя везучим и т.д. И затем это состояние уже не меняется. Поэтому неудивительно, что реклама активно использует отсылки, к примеру, на аристократический мир, не доступный большинству потребителей. И в этом проявляется общая закономерность поскольку сто одинаковых продуктов практически не имеют различий, потребитель делает свой выбор, опираясь на внутренние отсылки, сформулировать которые — задача рекламы. [c.574]
В простейшем случае это решение может быть случайным, т. е. эксперт назначает оценку случайно. Можно попытаться разоблачить такого псевдоэксперта, хотя это и непросто. Например, если в анкете много различных вопросов и выдвигается гипотеза, что эксперт отвечает случайно, можно проверить эту гипотезу статистическими методами. Так, если каждый вопрос предполагает два ответа, можно использовать сериальные тесты на случайность последовательности ответов. Можно составить анкету таким образом, что вопрос л = задается в нескольких различных формах. При случайных ответах вероятность совпадения равна т—п, где т — количество возможных ответов, п — количество различных форм вопроса. Если все ответы совпадают, то вероятность того, что это совпадение неслучайно, равна 1—т—"- и стремится к 1 при росте т и п. Значительно хуже обстоит дело, когда эксперт заинтересован в результатах экспертизы. Например, эксперту предлагают оценить время выполнения работы, причем известно, что выполнять работу будет он сам. Разумно предположить, что оценка времени выполнения работы будет завышена. Другой пример подчиненные оценивают деловые качества своего руководителя по 100-балльной шкале, причем по результатам экспертизы руководитель будет либо смещен, либо оставлен на прежнем месте. Если подчиненный [c.110]
Основное назначение теста — контроль и установление соответствия между значениями входных и выходных параметров испытуе-, мой системы при выполнении ею различных функций и на различных режимах управления (ручной, автоматический и т.п.). Один из примеров социального теста — утечка информации из органов управления СУ для получения сведений об ответных реакциях объектов исследования. Подобного рода тесты имеют целью, например, выяснить реакцию персонала СУ на то или иное воздействие, ее направленность и интенсивность. Другой пример натурного социально-экономического тестирования — установление опытных норм по труду, хронометраж выполняемых персоналом заданий и т.п. [c.164]
Отметим отдельно, что надо внимательно относиться к интерпретации результатов тестов на гетероскедастичность. Дело в том, что неверная спецификация функциональной формы модели может привести к тому, что тест отвергает гипотезу гомоскедастичности. Поясним это на простейшем примере. Пусть истинная модель имеет вид exp(yt) = а + /3xt + et с гомоскедастичны-ми ошибками, т.е. V(et) =
Один из разумных способов приближаться к этой проблеме состоит в том, чтобы остановиться на некотором персентиле показателя промышленной группы как эталонном тесте. Персентиль показателя определяется примерно следующим образом взятие медианы — это взятие 50-го персентиля показателя взятие самого высокого показателя в группе означает взятие 100-го персентиля показателя и т.д. Рассмотрим рассчитанный ранее лазерный пример. Там были идентифицированы четыре группы полупроводники и другие компоненты в рамках электроприборов и электроники компьютеры и периферийные устройства в рамках конторского оборудования и компьютеров. Какая из них больше подходит в качестве эталона для оценки лицензий на производство лазеров Строго говоря, имеются еще две группы, которые могут рассматриваться в этом качестве оборудование и услуги по передаче данных [c.122]
Правильно проведенное ИПП можно использовать как психометрический инструмент оценки индивидуальных компетенций. Множество исследований показало обоснованность структурированных поведенческих интервью, в которых кандидата просили описать, как он на самом деле поступал в критических рабочих или жизненных ситуациях.6 К примеру, мотивационные компетенции, закодированные в расшифровках ИПП офицеров ВМФ, имели корреляцию г = 0,60 (36% дисперсии) с критерием эффективности работы, тогда как измерение проективного теста той же самой мотивации имело корреляцию только г = 0,33 (10% дисперсии).7 Одно из объяснений этих данных состоит в следующем проективный тест измеряет операн-тные мотивы глобально (т. е. в каждой сфере жизни), а ИПП фокусируется на мотивах, появившихся в наиболее критических рабочих ситуациях (то, что психологи называют настоятельной необходимостью ) и, следовательно, лучше прогнозирует исполнение работы. [c.250]