Повторное тестирование надежности

Достоверность измерений характеризует совершенно другие аспекты, чем надежность измерений. Измерение может быть надежным, но недостоверным. Последнее характеризует точность измерений по отношению к тому, что существует в реальности. Например, респонденту задали вопрос о его годовом доходе, который составляет менее 25 000 долларов. Не желая называть интервьюеру истинную цифру, респондент указал доход более 10 000 долларов . При повторном тестировании он снова назвал данную цифру, демонстрируя высокий уровень надежности измерений. Ложь не является единственной причиной низкого уровня достоверности измерений. Можно также назвать плохую память, плохое знание респондентом действительности и т.п.  [c.157]


Надежные ценовые фигуры — неудавшееся повторное тестирование, флаги, треугольники и т. д.  [c.174]

Надежность теста определяется его качеством, и прежде всего точностью измерения. Требования к надежности устанавливаются в зависимости целей и задач тестирования. Проверка надежности осуществляется, как правило, параллельным или повторным тестированием объекта исследования. Кроме того, надежность может определяться методами корреляционного (на основе корреляции высказываний), дисперсионного и факторный анализов.  [c.166]

Надежность оценивается определением доли систематической вариации в шкале. Это осуществляется установлением связи между оценками, полученными при использовании различных методик расчета. Если связь достаточно сильна, шкала дает согласующиеся и, следовательно, достаточно надежные результаты. К методам оценки надежности относятся повторное тестирование, метод форм и внутренней согласованности.  [c.354]


С определением надежности при применении метода повторного тестирования связано несколько проблем. Во-первых, данный метод сильно зависит от промежутка времени между тестированиями. При прочих равных условиях, чем дольше интервал, тем ниже надежность. Во-вторых, первоначальное измерение может изменить рассматриваемые характеристики. Например, измерение отношений респондентов к молоку с низкой жирностью может заставить опрашиваемых задуматься о его полезности для здоровья и в результате привести к повышению оценки данного продукта. В-третьих, иногда невозможно провести повторное тестирование (например, при измерении реакции на новый продукт). В-четвертых, первое измерение может иметь эффект автоматического переноса высказанного мнения на второе и последующие измерения. В-пятых, измеряемые характеристики могут изменяться за промежуток времени между опросами. Например, благоприятная информация об объекте может улучшить отношение к объекту. Наконец, коэффициент корреляции может быть из-за автокорреляции отдельных пунктов шкалы.  [c.354]

Многомерные шкалы состоят из нескольких характеристик (пунктов), измеряемых рейтинговыми шкалами. Эти шкалы должны оцениваться с точки зрения надежности и достоверности. Надежность связана с тем, насколько устойчивы результаты при повторных исследованиях. Различные подходы к оценке надежности включают повторное тестирование, метод альтернативных форм и совместимости. Достоверность, или точность измерения, можно оценить с помощью содержательной, критериальной и конструкционной достоверности.  [c.363]

В чем различие между оценкой надежности с повторного тестирования и альтернативных форм  [c.364]

Надежность, или независимость от случая, определяют как степень стабильности, с которой отличительная черта будет измерена точно при повторном тестировании. Одним из важных аспектов осуществления достоверного тестирования является методика эмпирического определения достоверности. Как показал анализ, наиболее часто в научной и научно-методической литературе речь идет о четырех эффективных методах повторном тестировании, параллельном тестировании, раздвоении теста и консистентном анализе (см. приложение 20).  [c.141]


Компания ASI (подробнее см. в Приложении) опирается на предварительную и заключительную оценки выбора марки в контексте призовой лотереи. Исследование надежности 100 рекламных объявлений по пятнадцати категориям продукта дало корреляцию надежности повторных тестов от 0,81 до 0,88%. Компания ASI выполняет за год тестирование полутора тысяч рекламных объявлений, обеспечивая усовершенствованные и современные стандарты [23].  [c.478]

Следовательно, надежность конкретного теста рекламы зависит от желаемых откликов на эту рекламу. Кампания, которая предназначена для достижения осведомленности, возможно, не наилучшим образом будет оценена с помощью теста, который ориентирован на немедленный поведенческий отклик. Кампания, которая пытается создать имидж марки или ассоциацию с ощущением, например сердечности, может потребоваться много повторных тестов и искусный метод измерения возможно, это будет ряд вопросов, направленных на опыт использования данной продукции. Тест единственного показа с оценкой покупок по купонам может оказаться совсем непригодным. Следовательно, пригодность различных критериев, используемых для тестирования, необходимо оценивать в контексте включенных в рекламу задач.  [c.489]

Это система показа рекламы в телепередаче в домашней обстановке с использованием кабельного телевидения как демонстрационного средства, обеспечивающая оценку в процентах "относительной запоминаемости " (сопоставленной со стандартами), качество стенограммы (дословно) припомненного содержания рекламы, данные диагностики и измерения внимания и связи с маркой. Тест телевизионной рекламы вставляется фирмой ASI в стандартную телепрограмму (новую тридцатиминутную комедию ситуаций), содержащую четыре неконкурентных тестовых рекламных объявления и одно рекламное объявление, не подлежащее тестированию. Тесты проводятся, по крайней мере, в двух городах, среди двухсот респондентов в каждом городе (выбранных в соответствии с полом и возрастными квотами), произвольно отобранных из семей — зрителей кабельного телевидения в данном городе. С респондентами связываются по телефону и предлагают им предварительный просмотр новой телепрограммы, а затем повторяют опрос зрителей по телефону на следующий день после показа программы. С согласия зрителей программы им предлагается четыре примера категорий продуктов для теста на запоминаемость без подсказки. Если респондент не может правильно указать наименование рекламируемой марки/компании, он получает более конкретную подсказку для определения запоминаемости с подсказкой. Исследуются уровень и глубина запоминаемости и информации. Другие вопросы задают для получения информации о внимании, "привязанности к марке" и демографических данных о потребителях. Чтобы получить диагностические данные, возможно проведение повторного показа рекламы (реклама запускается на другом кабельном канале в то время, как проводится опрос мнений после передачи). Возможно тестирование рекламы как в черновом, так и в завершенном формате. Предполагаемый коэффициент надежности теста равен 0,87.  [c.502]

Повторное тестирование надежности. При повторном тестировании надежности (test-retest reliability) опрос респондентов проводится дважды с помощью двух идентичных шкал и при как можно более сходных условиях. Интервал между тестированиями обычно составляет от двух до четырех недель. Степень схожести результатов двух измерений определяется коэффициентом корреляции (подробности — в главе 17). Чем выше коэффициент корреляции, тем выше надежность.  [c.354]

Повторное тестирование обычно называют ретестом, а надежность, измеренную таким способом — ретестовой надежностью. В этом случае за индекс надежности принимается коэффициент корреляции между результатами двух тестирований. Метод повторного тестирования имеет как достоинства, так и недостатки. К достоинствам относятся естественность и простота определения коэффициента надежности, к недостаткам — неопределенность в выборе интервала между двумя измерениями, которая связана с тем, что повторное тестирование отличается от первичного. Испытуемые уже знакомы с содержанием тестов, помнят свои первоначальные ответы. Для хорошего теста ретестовый коэффициент надежности (устойчивости или стабильности) должен быть не ниже 0,7.  [c.79]

Все тесты должны быть валидными, т.е. соответствовать своему назначению, и надежными, обеспечивающими сходные результаты при повторном тестировании.  [c.158]

В психологии разработаны критерии проверки надежности результатов тестирования1. В частности, совпадение результатов нескольких последовательных тестирований по одному и тому же тесту свидетельствует о надежности результатов. Этот прием — повторная экспертиза — трудно использовать для оценки надежности экспертиз, так как стабильность экспертных оценок можно объяснить тем, что эксперт помнит свои оценки нестабильность оценок можно объяснить изменением ситуации. В любом случае стабильность экспертных оценок при повторной экспертизе не говорит об их истинности или ложности. Эта стабильность может свидетельствовать (и то не всегда) об устойчивости мнения эксперта.  [c.109]

Благодаря силе своего брэнда - как в функциональном, так и в социальном измерении -Mer edes получил второй шанс. Он вложил всю свою инженерную мощь в безопасность машины. Автомобиль блестяще выдержал повторное испытание. Но если бы не брэнд Mer edes, с его имиджем безопасности и надежности, автомобиль А класса просто исчез бы с рынка. Представьте себе, если бы он был выпущен менее престижным производителем или был новым брэндом. О его смерти никто бы даже не узнал. Сила брэнда не только позволила продукту оправиться, но и помогла превратить А класс в один из самых стильных автомобилей Европы. Через полтора года после катастрофы на него записывались в очередь за полгода. Mer edes превратил неудачу при тестировании из корпоративного несчастья в триумф инженерной мысли.  [c.26]

Смотреть страницы где упоминается термин Повторное тестирование надежности

: [c.354]    [c.363]    [c.953]    [c.493]    [c.493]   
Маркетинговые исследования Издание 3 (2002) -- [ c.354 ]