Красота

Метод системы тестов. Тесты в процессе разработки программного обеспечения

Тестовые методы. Определение теста. Подходы к классификации тестов. Критерии качества товаров. Достоинства и недостатки тестов. Достоинства и недостатки тестовых методов.

Стандартизированные тесты должны обладать определенными психометрическими свойствами.

1. Надежность теста точность устойчивость - согласованность результатов теста, которые получаются при повторном применении теста к тем же обследуемым через время или в результате применения эквивалентных наборов заданий. Надежность показывает, в какой степени индивидуальные различия в тестовых результатах оказываются истинными, а в какой могут быть приписаны случайным ошибкам. Показатель надежности теста должен быть достаточно высоким (0,7- 0,8). Надежность теста не обязательно предполагает его валидность.

2. Валидность теста что

Справедливо следующее неравенство: валидность ≤ надежность.

3. Репрезентативность теста определяется возможностью его использования применительно к данной категории обследуемых лиц. Тест, стандартизированный на студентах, а тем более – на специалистах, будет нерепрезентативным в отношении учащихся средней школы.

4. Достоверность теста – его защищенность от мотивационных искажений (разновидность валидности применительно к тестовым самоотчетам).

Стандартный набор данных о тесте должен включать меру надежности (характеризует тест, когда он применяется в стандартных условиях и с обследуемыми, похожими на тех, кто участвовал в выборке стандартизации), информацию о валидности и способах ее определения.

При использовании психодиагностических тестов важно соблюдать следующие требования:

● четко определять цели, задачи и область применения теста;

● использовать заданный алгоритм проведения тестирования и обработки результатов.

В качестве резюмирующего требования к тестовой методике можно отметить наличие так называемого технического паспорта психодиагностического теста. Технический паспорт является интегральным документом, в котором подробно описывается тест, указываются авторство, время и место создания, формы и способы проведения, параметры надежности, валидности, репрезентативности теста, сведения об апробации, авторские инструкции, ключи и нормы к тесту, диапазон использования и ограничения.



Зачастую тесты для психодиагностики персонала распространяются без необходимых профессиональных атрибутов, и тесты, которые разрабатывались для определенных целей и условий, применяются в совершенно неподходящих областях. В помощь заказчикам психодиагностического тестирования можно выделить внешние признаки научного (а значит, эффективного) теста, которые следовало бы учитывать при выборе тестовых методик.

В основе этой категории методов лежит соблюдение достаточно строгих и сформулированных в явной форме правил. Эти методы обеспечивают диагноз (и на его основе прогноз) лишь с вероятностной точностью, этот диагноз оказывается более надежным по отношению к группе обследуемых, чем по отношению к отдельному обследуемому. Достоинства измерительных методов (объективный характер процедуры, возможность перепроверки) обеспечиваются не автоматически, а благодаря выполнению психометрических требований.

Тест (англ. test –опыт, проба) – система стандартизированных вопросов и задач, позволяющих измерить уровень развития у обследуемых определенных психологических качеств, необходимых теоретических знаний, практических умений, навыков.

Подходы к классификации тестов. Согласно общепринятой классификации тесты можно подразделить:

● по назначению – на общедиагностические, профессиональной пригодности, специальные;

● по комплектности – на изолированные и тестовые батареи;

● по степени однородности задач – на гомогенные и гетерогенные;

● по формам процедуры обследования – на групповые и индивидуальные;

● по форме ответа – на устные и письменные;

● по наличию временных ограничений в выполнении теста – на скоростные тесты, тесты возможностей (результативности) и смешанные;

● по особенностям используемых тестовых задач – на вербальные и невербальные;

● по характеру тестового материала, предъявляемого обследуемым, - на бланковые («карандаш-бумага») и аппаратурные (в том числе компьютерные);

● по предмету диагностирования – на тесты интеллекта, тесты личности, социально-психологические тесты, тесты достижений и др.

8. Надежность и валидность тестов: основные понятия.

1. Надежность теста – это характеристика методики, отражающая точность психодиагностических измерений и устойчивость результатов теста к действию посторонних случайных факторов (временных колебаний психологического или физического состояния обследуемого лица, факторов окружения и др.);

- согласованность результатов теста, которые получаются при повторном применении теста к тем же обследуемым через время или в результате применения эквивалентных наборов заданий.

Надежность показывает, в какой степени индивидуальные различия в тестовых результатах оказываются истинными, а в какой могут быть приписаны случайным ошибкам. Показатель надежности теста должен быть достаточно высоким (0,7- 0,8).

Надежность теста не обязательно предполагает его валидность.

2. Валидность теста – это оценка пригодности теста к измерению требуемого (искомого) качества. Валидность показывает, что тест измеряет и насколько хорошо он это делает; насколько результаты, полученные по тесту, совпадают с независимо наблюдаемым поведением.

Название теста часто не может служить указанием на его валидность (обоснованность), позволяя лишь отличить тест от других (название тестов слишком широко, расплывчато для того, чтобы определить, на диагностику каких особенностей тест ориентирован). Валидность теста выявляется в лабораторных условиях системой статистических методов. Справедливо следующее неравенство: валидность ≤ надежность.

Валидность теста связана также с его репрезентативностью и достоверностью.

Психологическое тестирование - термин зарубежной психологии, обозначающий процедуру установления и измерения индивидуально-психологических отличий.

Психологическое тестирование используется в различных сферах: профориентации, профотборе, психологическом консультировании, планировании коррекционной работы и т.д.

Психологический тест - стандартизированное задание, по результатам выполнения которого судят о психофизиологических и личностных характеристиках, знаниях, умениях и навыках испытуемого.

На создание эффективного психологического теста уходит от 10 лет работы авторских коллективов. Качество теста обеспечивается многоступенчатой процедурой проверки и стандартизации его шкал.

С появлением первых тестов наиболее употребляемым термином, с помощью которого обозначается измерение индивидуально-психологических особенностей, стал термин «психологическое тестирование». Первоначально термин «психологическое тестирование» использовался широко, включая в себя любое измерение в психологической науке. По мере развития тестов, сфера психологического тестирования сузилась до измерения личностных и когнитивных особенностей.

Характеристики психологических тестов:

Стандартность - тестовая методика проходит стандартизацию, по итогам которой получаемые данные должны соответствовать закону нормального распределения или же норме социокультурного характера. В соответствии с нормами формируются диапазоны значений говорящие нам о силе выраженности исследуемого признака.

Надежность - свойство теста давать при повторном измерении близкие результаты. Надежная методика дает сходные результаты независимо от времени года или пола экспериментатора, влияния подобных фоновых факторов, должно сводится к минимуму самой методикой, что и определяет ее надежность.

Валидность - соответствие результатов теста той характеристике, для измерения которой он предназначен. Различают внутреннюю и внешнюю валидность. В случае с внешней это соответствие может быть проверенно положительной корреляцией, с объективными достижениями, результаты по тесту интеллекта, могут сопоставляться с академической успеваемостью. В случае с внутренней все сложнее, здесь речь идет о теоретической связи, о том, насколько выстроенная модель реально моделирует заявленный аспект.

Виды тестов:

Психологический тест - стандартизированное испытание, по результатам выполнения которого судят о психофизиологических и личностных свойствах (чертах, способностях, состояниях) испытуемого. Тесты, по которым судят о знаниях, умениях и навыках испытуемого, занимают промежуточное положение между психологическими, образовательными и проф. тестами.

Вербальный тест - тест, построенный на использовании языка, когда тестируемый, выполняя задание, должен не совершать действия, а описать их словами.

Стандартизованный тест - психологический тест с четко определенными неизменным списком вопросов, инструкцией, методами обработки результатов и подсчета баллов.

Тесты личности - тесты психологического тестирования, направленные на изучение характера, способностей, эмоций, потребностей и других свойств человеческой личности. Личностные тесты подразделяются на: проективные тесты, личностные опросники и тесты деятельности (ситуационные тесты).

Тест достижений - стандартизированный тест, используются также в целях профессионального отбора: конструируемый на учебном материале; предназначенный для оценки уровня овладения учебными знаниями и навыками.

Тест имитации - психологический тест, состоящий в том, что человеку предлагается выполнить задание, хотя ситуация, в которой предстоит выполнить задание, не воссоздается. Тест имитации используется в процессе отбора претендентов на работу.

Тест на профессиональную пригодность - психологический тест, направленный на выявление индивидуальных интересов и предпочтений. Такие тесты помогают определить работу наиболее предпочтительную для конкретного человека.

Тест интеллекта - тесты психологического тестирования, направленные на изучение степени развития интеллекта у человека. Задания тестов интеллекта: адресуются к словесно-логическому мышлению или направлены и на оценку развития наглядно-образного и наглядно-действенного мышления; позволяют характеризовать память, внимание, пространственную ориентировку, вербальное развитие и др.

Как и процесс разработки, процесс последующего тестирования программного обеспечения также следует определенной методологии. Под методологией в данном случае мы понимаем разнообразные комбинации принципов, идей, методов и концептов, к которым вы прибегаете во время работы над проектом.

В настоящее время существует довольно большое количество разнообразных подходов к тестированию, каждый со своими отправными точками, продолжительностью выполнения и методами, используемыми на каждом этапе. И выбор того или иного из них может быть довольно непростой задачей. В этой статье мы рассмотрим разные подходы к тестированию ПО и поговорим об их основных особенностях, чтобы помочь вам сориентироваться в существующем многообразии.

Каскадная модель (Линейная последовательная модель жизненного цикла ПО)

Каскадная модель (Waterfall Model) является одной из наиболее старых моделей, которую можно применять не только для разработки или тестирования ПО, но также практически для любого другого проекта. Его базовым принципом является последовательный порядок выполнения задач. Это значит, что мы можем переходить к следующему шагу разработки или тестирования только после того, как предыдущий был успешно завершен. Эта модель подходит для небольших проектов и применима только в том случае, если все требования точно определены. Главными достоинствами этой методологии являются экономическая эффективность, простота использования и управления документацией.

Процесс тестирования ПО начинается после завершения процесса разработки. На этой стадии все необходимые тесты переносятся с юнитов на системное тестирование для того, чтобы контролировать работу компонентов как по отдельности, так и в комплексе.

Помимо упомянутых выше достоинств, данный подход к тестированию также имеет и свои недостатки. Всегда существует вероятность обнаружения критических ошибок в процессе тестирования. Это может привести к необходимости полностью изменить один из компонентов системы или даже всю логику проекта. Но подобная задача невозможна в случае каскадной модели, поскольку возвращение на предыдущий шаг в этой методологии запрещено.

Узнайте больше о каскадной модели из предыдущей статьи .

V-Model (Модель верификации и валидации)

Как и каскадная модель, методика V-Model основана на прямой последовательности шагов. Основным отличием между этими двумя методологиями является то, что тестирование в данном случае планируется параллельно с соответствующей стадией разработки. Согласно этой методологии тестирования ПО, процесс начинается как только определены требования и становится возможным начать статическое тестирование, т.е. верификацию и обзор, что позволяет избежать возможных дефектов ПО на поздних стадиях. Соответствующий план тестирования создается для каждого уровня разработки ПО, что определяет ожидаемые результаты, а также критерии входа и выхода для данного продукта.

Схема данной модели показывает принцип разделения задач на две части. Те, которые относятся к дизайну и разработке, размещены слева. Задачи, относящиеся к тестированию ПО, размещены справа:

Основные этапы этой методологии могут изменяться, однако обычно они включают следующие:

  • Этап определения требований . Приемочное тестирование относится к этому этапу. Его основная задача состоит в оценке готовности системы к финальному использованию
  • Этап, на котором происходит высокоуровневое проектирование, или High-Level Design (HDL) . Этот этап относится к системному тестированию и включает оценку соблюдения требований к интегрированным системам
  • Фаза детального дизайна (Detailed Design) параллельна фазе интеграционного тестирования, во время которой происходит проверка взаимодействий между различными компонентами системы
  • После этапа написания кода начинается другой важный шаг — юнит-тестирование. Очень важно убедиться в том, что поведение отдельных частей и компонентов ПО корректно и соответствует требованиям

Единственным недостатком рассмотренной методологии тестирования является отсутствие готовых решений, которые можно было бы применить, чтобы избавиться от дефектов ПО, обнаруженных на этапе тестирования.

Инкрементная модель

Данная методология может быть описана, как мультикаскадная модель тестирования ПО. Рабочий процесс разделяется на некоторое количество циклов, каждый из которых также делится на модули. Каждая итерация добавляет определенный функционал к ПО. Инкремент состоит из трех циклов:

  1. дизайн и разработка
  2. тестирование
  3. реализация.

В этой модели возможна одновременная разработка разных версий продукта. Например, первая версия может проходить этап тестирования в то время, как вторая версия находится на стадии разработки. Третья версия в то же самое время может проходить этап дизайна. Этот процесс может продолжаться до самого завершения проекта.

Очевидно, что данная методология требует обнаружения максимально возможного количества ошибок в тестируемом ПО настолько быстро, насколько это возможно. Так же, как и фаза реализации, которая требует подтверждения готовности продукта к доставке к конечному пользователю. Все эти факторы существенно увеличивают весомость требований к тестированию.

В сравнении с предыдущими методологиями, инкрементная модель имеет несколько важных преимуществ. Она более гибкая, изменение требований ведет к меньшим затратам, а процесс тестирования ПО является более эффективным, поскольку гораздо проще проводить тестирование и дебаггинг за счет использования небольших итераций. Тем не менее, стоит отметить, что общая стоимость все же выше, чем в случае каскадной модели.

Спиральная модель

Спиральная модель это методология тестирования ПО, которая основана на инкрементном подходе и прототипировании. Она состоит из четырех этапов:

  1. Планирование
  2. Анализ рисков
  3. Разработка
  4. Оценка

Сразу после того, как первый цикл завершен, начинается второй. Тестирование ПО начинается еще на этапе планирования и длится до стадии оценки. Основным преимуществом спиральное модели является то, что первые результаты тестирования появляется незамедлительно после появления результатов тестов на третьем этапе каждого цикла, что помогает гарантировать корректную оценку качества. Тем не менее, важно помнить о том, что эта модель может быть довольно затратной и не подходит для маленьких проектов.

Несмотря на то, что эта модель является довольно старой, она остается полезной как для тестирования, так и для разработки. Более того, главная цель многих методологий тестирования ПО, включая спиральную модель, изменилась в последнее время. Мы используем их не только для поиска дефектов в приложениях, но также и для выяснения причин, их вызвавших. Такой подход помогает разработчикам работать более эффективно и быстро устранять ошибки.

Читайте подробнее o спиральной модели в предыдущем блог посте .

Agile

Методология гибкой (Agile) разработки и тестирование ПО может быть описана как набор подходов, ориентированных на использование интерактивной разработки, динамического формирования требований и обеспечения их осуществления как результата постоянного взаимодействия внутри самоорганизующейся рабочей группы. Большинство гибких методологий разработки ПО нацелены на минимизацию рисков посредством разработки в рамках коротких итераций. Одним из главных принципов этой гибкой стратегии является возможность быстрого реагирования на возможные изменения, нежели стремление положиться на долгосрочное планирование.

Узнайте больше об Agile (прим. — статья на английском языке) .

Экстремальное программирование (XP, Extreme Programming)

Экстремальное программирование является одним их примеров гибкой разработки ПО. Отличительной особенностью этой методологии является “парное программирование”, ситуация, когда один разработчик работает над кодом, в то время как его коллега постоянно проводит обзор написанного кода. Процесс тестирования ПО является довольно важным, поскольку начинается даже раньше, чем написана первая строка кода. Каждый модуль приложения должен иметь юнит-тест, чтобы большинство ошибок могло быть исправлено на стадии написания кода. Другим отличительным свойством является то, что тест определяет код, а не наоборот. Это значит, что определенная часть кода может быть признана завершенной только в том случае, если все тесты пройдены успешно. В противном случае, код отклоняется.

Главными достоинствами такой методологии являются постоянное тестирование и короткие релизы, что помогает обеспечить высокое качество кода.

Scrum

Scrum — Часть методологии Agile, итеративный инкрементный фреймворк, созданный для управления процессом разработки ПО. Согласно принципам Scrum, команда тестировщиков должна участвовать в следующих этапах:

  • Участие в Scrum планировании
  • Поддержка в юнит-тестировании
  • Тестирование пользовательских историй
  • Сотрудничество с заказчиком и владельцем продукта для определения критериев приемлемости
  • Предоставление автоматического тестировании

Более того, участники QA-отдела должны присутствовать на всех ежедневных собраниях, как и другие члены команды, чтобы обсудить, что было протестировано и сделано вчера, что будет протестировано сегодня, а также общий прогресс тестирования.

В то же время принципы Agile методологии в Scrum к появлению специфических особенностей:

  • Оценка усилий, необходимых для каждой пользовательской истории является обязательной
  • Тестировщик должен быть внимательным к требованиям, поскольку они могут постоянно изменяться
  • Риск регрессии возрастает вместе с частыми изменениями в коде
  • Одновременность планирования и выполнения тестов
  • Недопонимание между членами команды в случае если требования заказчика не до конца ясны

Узнайте больше о методологии Scrum из предыдущей статьи .

Заключение

В заключение важно отметить, что сегодня практика использования той или иной методологии тестирования ПО подразумевает мультиверсальный подход. Иными словами, не стоит рассчитывать на то, что какая-то одна методология окажется подходящей для всех типов проектов. Выбор одной из них зависит от большого числа аспектов, таких как тип проекта, требования заказчика, поставленные сроки, а также многих других. С точки зрения тестирования ПО, для некоторых методологий характерно приступать к тестированию на ранних этапах разработки, в то время как при работе с другими принято ожидать до тех пор, пока система не готова полностью.

Если вам нужна помощь с разработкой программного обеспечения или тестированием, выделенная команда разработчиков и QA инженеров готова к работе.

Приступая к рассказу о тестировании, мы начнем с самого главного - с определения понятия «тест». В общенаучном смысле тест (от англ. test - опыт, проба) - это кратковременное стандартизованное испытание, направленное на получение в относительно сжатый отрезок времени наиболее существенной информации о признаках данного конкретного объекта с целью установления у него наличия или степени выраженности определенного психического свойства (черты, характеристики) или качества, а также совокупности психических свойств личности или психических состояний (отношений, взаимовосприятия) групп и коллективов. Тест позволяет с заранее установленной степенью вероятности определить существующий у человека в данное время уровень знаний, относительно устойчивые личностные свойства, черты поведения, а также получить качественные и количественные оценки измеряемых характеристик.

Концепция тестирования как метода оценки и измерения качеств личности базируется на следующих общих предпосылках:
1. Внутренние (психологические) свойства личности выявляются с помощью индикаторов - показателей или внешних поведенческих характеристик (ответов на вопросы, результатов решения разного рода задач и т.п.), посредством которых проявляются структуры и свойства личности.
2. Эти индикаторы имеют такое выражение, которое может быть объектом наблюдения и измерения с помощью специальных процедур.
3. Между внешней (поведенческой) чертой и внутренним свойством личности существует однозначная причинная зависимость:
наблюдаемое действие или реакция человека порождены определенным личностным свойством и только им.
4. Измеряемые тестами черты и соответственно получаемые результаты распределены среди большой совокупности людей достаточно равномерно. Это означает, что тест должен не только оценивать конкретно взятого человека, но и быть применимым к большой совокупности людей.

Последнее требование отражается в понятии «норма теста», под которой понимается «средний уровень развития большой совокупности людей, похожих на данного испытуемого по ряду социально-демографических характеристик»3. Иными словами, норма теста - это средний уровень распределения выявляемых с его помощью характеристик в большой группе людей, на применимость в которой он претендует. В большинстве случаев норма теста определяется с помощью усреднения результатов тестирования большой выборки людей одного пола, примерно одинакового возраста и дифференциации полученных результатов по важнейшим показателям. Норма теста отражает его репрезентативность или свойство выборочной совокупности людей (группы или ряда групп, на основе анализа качеств которых был разработан тест) представлять генеральную совокупность всех лиц, обладающих подобными типологическими характеристиками. Репрезентативность позволяет классифицировать результаты тестирования и выступает показателем качественности тестовой методики.

Еще одним критерием добротности теста, тесно связанным с репрезентативностью, является его адаптированность - способность учитывать национальные (в том числе и социальные) и региональные особенности. Авторы берут нужный для построения тестов материал из исторически сложившейся культуры близкой им социальной общности. Тесты, «свободные от культуры», а значит одинаково понятные по материалу индивидам из разных социальных общностей, создать нельзя - это неустранимое свойство тестовых программ. При использовании тестов, разработанных в иной социально-культурной среде, в проверке и переоценке нуждаются нормы, валидность, надежность тестов, а также их применимость в целом. Особенно остро проблема адаптированности заявила о себе в последние годы, когда в Россию широким потоком хлынули западные тестовые методики и российские специалисты в области кадрового менеджмента бросились применять их, подчас не задумываясь о необходимости внесения определенных корректив.

В силу фактического запрета на использование тестов, существовавшего в СССР (после известного постановления ЦК ВКПб 1936 г. «О педологических извращениях в системе Наркомпроса»), российский кадровый менеджмент является дилетантом в этой области. Многих буквально очаровывает магия «фирменных» латинских букв, аббревиатур, обозначающих «классические» методики, такие, например, как MMPI (личностный опросник, разработанный в Миннесотском университете), на основании которых» предлагается получение развернутых заключений о сотрудниках фирмы или кандидатах на имеющиеся вакансии. Несомненно, вышеупомянутый тест занимает в мировой психологии лидирующую (по популярности) позицию. Однако нельзя забывать тот факт, что он был разработан специально для пациентов психиатрических клиник (!) и широко используется в практике психоанализа. При приеме нормальных здоровых людей в американские фирмы этот тест в последние годы не применяется! Лица, подвергшиеся подобному тестированию, уже выиграли по суду немало исков, а компаниям пришлось уплатить солидные штрафы за нанесение морального ущерба.

Вообще западные личностные тесты, в том числе и более подходящие для ситуации приема на работу («16 личностных факторов» Кэттелла- 16PF, Калифорнийский личностный перечень - CPI, Опросник Айзенка - EPI, Тест Майерс-Бриггс, основанный на типологии Юнга), для корректного применения в России нуждаются в серьезной доработке («культурной и психометрической адаптации»). Неадаптированное, без внесения существенных поправок использование этих и подобных им тестов в современных, российских условиях явно неправомерно, хотя бы уже потому, что в нашей стране условия труда, его оплаты, традиции трудового сознания во многом отличны от западных. Далеко не для всех тестов проведена адаптация, что уж говорить о «пиратских» версиях западных тестов. Как правило, неадаптированные версии используют дилетанты в области психометрики, которые наивно полагают, что достаточно просто перевести на русский язык тестовые задания и тест будет работать. На самом же деле работа по адаптации тестовых методик должна включать пересчет не только так называемых тестовых норм, но и ключей к тест-заданиям (пунктам).

Для того чтобы тесты соответствовали своему назначению, адекватно выявляли и достаточно точно измеряли определенные качества, они должны также соответствовать таким критериям, как объективность, валидность, надежность и научность. Объективность означает, что результаты тестирования должны быть интерсубъективны, т.е. независимы от того, кто проводит тест. Валидность (от англ. valid- действительный, пригодный) - это пригодность теста для измерения именно того качества, на оценку которого он направлен. Так, например, если тест используется для оценки уровня знаний человека в области управления персоналом, он должен измерять именно эти знания, а не, например, общую эрудицию или знания в области экономики. Существуют, по меньшей мере, три условия обоснования валидности: валидность относительно критерия (требующая демонстрации корреляции или иного статистического взаимоотношения между результатами теста и требованиями работы); валидность относительно содержания (требующая демонстрации того, что содержание теста представляет важнейшие относительно работы черты поведения); валидность относительно конструктов (требующая демонстрации того, что тест определяет именно тот конструкт или характеристику, для определения которой он предназначен, и что эта характеристика важна для успешности в работе).

Надежность отражает степень точности и постоянства, с которой измеряется качество личности, и характеризует свободу процедуры тестирования от погрешностей. Точность проявляется в уровне совпадения результатов данного теста с показателями других тестов, используемых для этой же цели, постоянство - в устойчивости, стабильности результатов при повторной оценке той же группы тестируемых. Вместе с тем специалисты отмечают существование нескольких причин, по которым индивид, вновь проходящий тест, не получает сходные оценки. К ним относятся: временные психологические или физические изменения состояния тестируемого; факторы окружения (температура комнаты, освещение, уровень шума или даже личность проводящего тест); форма теста (многие тесты имеют разную форму или версию - на бумажном носителе, в электронном виде, в устном исполнении) и т.п. Указателем надежности теста является степень, в которой сфера оценок теста не подвержена влиянию указанных факторов.

Надежность теста определяется его коэффициентом, который может колебаться от 0 до 1. Обычно говорится, что если надежность теста 0,9 и более, то результаты его превосходны, тест с надежностью 0,8-0,89 дает хорошие результаты, тест с надежностью 0,7-0,79 дает адекватные результаты, тест с надежностью менее 0,7 имеет ограниченную применимость. Допустимый уровень надежности будет отличаться в зависимости от типа теста и используемой оценки его надежности. Ниже приводятся основные типы надежности тестовых процедур:
♦ надежность типа «тест - повторный тест» указывает на возможность получения таких же результатов по тесту по прошествии времени;
♦ надежность альтернативной, или параллельной, формы: речь идет о том, что результаты теста подобны, если индивид выбирает одну или несколько его альтернативных форм;
♦ надежность типа «интероценка» указывает, что результаты теста подобны при проведении его двумя или более оценщиками;
♦ надежность типа «внутренняя непротиворечивость» указывает границы, в которых тест измеряет одно и то же.

Надежность и валидность теста взаимосвязаны. Вместе с тем между ними следует проводить различия: надежность говорит о том, насколько истинные результаты дает тест, валидность - насколько хорош тест для отдельной ситуации. Таким образом, тест может быть надежным, но не быть валидным. Он может оказаться невалидным для различных целей: например, адекватно показывать технические навыки, но быть бесполезным при определении лидерских качеств. Сходным образом валидность теста обоснована относительно специфических групп индивидов (так называемых референтных групп); вполне реальна ситуация, когда целевая группа может не входить в число последних. В целом валидность теста может быть либо равна (идеальный случай), либо меньше его надежности.

Научность - это обоснованность теста фундаментальными исследованиями, его концептуальная осмысленность. Особенно необходимо научное обоснование при обращении к батарее тестов - серии испытаний, призванных оценить комплекс качеств человека, свидетельствующий о его профессиональной пригодноста и ожидаемых трудовых успехах, - широко применяемой при отборе персонала.

Масштабность использования процедуры тестирования в управлении персоналом объясняется, на наш взгляд, целым рядом ее достоинств:
♦ объективностью оценки (итоги тестирования практически не зависят от субъективного подхода тестирующего; к тому же они могут быть оценены не только качественно, но и количественно);
♦ оперативностью оценки (сама процедура тестирования занимает сравнительно немного времени, в то же время с ее помощью можно в короткий срок собрать требующуюся информацию о большом количестве людей);
♦ простотой и доступностью тестирования (в управлении персоналом используются стандартизированные тесты, которые содержат описание процедуры их проведения и оценки результатов; после профессиональной апробации ими может пользоваться широкий круг руководителей, а также сотрудников служб персонала);
♦ пригодностью результатов тестирования для компьютерной обработки и использования статистических методов оценки;
♦ большими эвристическими оценочными возможностями;
♦ конкретностью и непосредственной практической направленностью (тесты позволяют получить сведения об определенных свойствах личности и ее поведении, а не о человеке вообще).

В то же время, как и любые другие инструменты кадрового менеджмента, метод тестирования имеет свои ограничения и тонкости, которые необходимо знать в процессе его применения:
♦ существует серьезная проблема установления однозначной причинно-следственной связи между выявляемыми вопросами (заданиями) тестов и качествами личности, определяющими ее профессиональный успех: при разработке тестов далеко не всегда удается однозначно «перевести» тестовые задания (индикаторы черт) в конкретные качества личности, а последние - в факторы трудовых достижений;
♦ результаты тестов обычно оценивают лишь актуальные, т.е. существующие в данный момент, качества; в то же время большинство характеристик личности и ее поведения подвержены изменениям, порой достаточно динамичным;
♦ квалифицированное использование тестов требует соответствующей психодиагностической и этической подготовки тестирующего;
♦ применение тестов может вызывать у испытуемых страх, искажающий результаты тестирования;
♦ публичное объявление результатов тестирования может задевать чувство собственного достоинства аутсайдеров, компрометировать их в глазах окружающих и тем самым осложнять отношения в коллективе.

Существует строго математизированная, экспериментальная наука - тестология, мало известная в нашей стране, которая позволяет вполне однозначно установить, какой тест можно считать хорошим, а какой - плохим. В развитых странах все профессиональные и психологические тесты проходят сертификацию - неависимую экспертизу. В некоторых случаях проводящие специалисты объединены в национальную психологическую ассоциацию, в других - в специализированную тестологическую ассоциацию. К сожалению, в России подобная практика находится пока в зачаточном состоянии.

Тесты могут быть полезными только при условии их грамотного применения подготовленными к этому специалистами. Избегать проблем и получать объективные результаты помогают общие правила тестирования, к которым относятся следующие:
♦ любое сложное тестирование должно проводиться при участии специалиста по психодиагностике или при последующем его участии в качестве консультанта;
♦ человека нельзя подвергать психологическому обследованию обманным путем или против его воли, недопустимы никакие формы прямого или косвенного принуждения;
♦ перед проведением тестирования испытуемого необходимо предупредить о том, что в ходе исследования он невольно может сообщить такую информацию о себе, своих мыслях и чувствах, которую не осознает сам;
♦ любой человек (за исключением случаев, оговоренных за коном) имеет право знать результаты своего тестирования; итоговые данные в доступной для понимания форме предоставляет испытуемым тот, кто проводил обследование; ознакомление с результатами тестирования должно исключать их неправильное толкование или появление у испытуемых каких-либо опасений;
♦ результаты тестирования не должны травмировать исследуемого или снижать его самооценку, поэтому их следует сообщать в ободряющей форме, по возможности сопровождая конструктивными рекомендациями;
♦ испытуемый должен быть информирован о целях тестироввания и формах использования его результатов;
♦ тестирующий должен обеспечить беспристрастный подход к процедуре и результатам исследования;
♦ информация о результатах тестирования должна предоставляться только тем, кому она предназначается; тестирующий обязан обеспечить конфиденциальность психодиагностической информации, полученной от испытуемого на основе «личного доверия» или в социометрических тестах.

Помимо вышеперечисленных правил, обеспечивающих эффективность процедуры тестирования, особые требования предъявляются и к тестирующему. Общеизвестно, что эффективность тестирования во многом зависит не только от соответствующих знаний, но и от личностных качеств проводящего его человека. Важными для профессионального тестирования качествами являются: общительность и коммуникабельность; динамичность и гибкость поведения; эмоциональная сдержанность и терпимость; профессиональный такт (основой которого являются прежде всего соблюдение профессиональной тайны и деликатность); умение держать свою линию поведения; эмпатия (т.е. готовность и способность проникнуться чувствами и переживаниями других людей и тем самым эмоционально понять их); умение привлекать других людей к активному сотрудничеству, совместному анализу и решению проблем, а также конфликтологическая грамотность. В процессе подготовки и проведения тестирования можно выделить четыре основных этапа, учет особенностей которых во многом определяет успех использования этого метода:
♦ выбор тестовых методик (ознакомление с методиками и их проверка на предмет соответствия целям исследования и удобности применения);
♦ инструктирование испытуемых (разъяснение им целей и задач тестирования, порядка выполнения тестовых заданий и поведения во время их выполнения);
♦ контроль за выполнением заданий;
♦ интерпретация результатов и подведение итогов тестирования.

Еще одним непременным условием эффективности тестирования является учет особенностей различных типов тестов. По предмету исследования можно выделить три класса тестов: а) общеличностные, с помощью которых фиксируют некоторую целостность психических свойств личности (одно из направлений современной психологии личности - дифференциальная психология - целиком опирается на использование приемов психодиагностики); б) личностные - специальные тесты, предназначенные для диагностики той или иной особой черты, характеристики, свойства субъекта (например, творческих способностей, уровня общей ответственности, самоконтроля и т.п.); в) групповые, предназначенные для диагностики групповых психических процессов - уровня сплоченности групп и коллективов, особенностей группового психологического климата, межличностного восприятия, силы нормативного «давления» группы на ее членов и др.

Общие особенности психологических тестов определяются предметом изучения и спецификой применяемой техники. С точки зрения технических приемов обычно выделяют четыре разновидности тестов: а) так называемые объективные, преимущественно аппаратурные, часто психофизиологические испытания (на пример, измерение кожно-гальванического рефлекса, служащее индикатором эмоционального состояния); б) опросные методики или субъективные тесты, как, например, общеличностные тесты Г. Айзенка и Р. Кеттела (эти тесты состоят из серии взаимоконтролирующих суждений о различных проявлениях личностных черт с предложением испытуемому фиксировать наличие или отсутствие данного свойства, черты, особенности поведения); в) тес ты «с карандашом и бумагой», например, для диагностики внимания - вычеркивание определенных букв в тексте («корректорский тест» - см. приложение 1) или вычерчивание оптимального вы хода из лабиринта (оценка некоторых свойств интеллекта) и т.д.; г) тесты, основанные на экспертной оценке поведенческих проявлений испытуемых, например активно использовавшаяся советски ми психологами методика «ГОЛ» - групповой оценки личности.

Наименование параметра Значение
Тема статьи: Метод тестов
Рубрика (тематическая категория) Психология

Сегодня широкое применение получил метод тестирования , который когда-то в отечественной науке и практике недооценивался. Теперь на вооружении психологов имеется несколько тысяч тестов.

Тест (англ. test – проба, проверка) - ϶ᴛᴏ система заданий, позволяющих измерить уровень развития качеств (свойств) личности. Тесты являются специализированными методами психодиагностического обследования. От других методов они отличаются тем, что имеют четкую процедуру сбора и обработки данных и своеобразную их последующую интерпретацию

Популярность данного метода обусловлена возможностью получения точной и качественной характеристики психологического явления, а также возможностью составить результаты исследования, что в первую очередь крайне важно для решения практических задач.

Одна из самых первых попыток разработать тесты была сделана Ф. Гальтоном (1822-1911). Тесты и статические методы, предложенные Ф. Гальтоном, в дальнейшем получили применение для решения практических вопросов жизни и послужили началом создания прикладной психологии, получившей название ʼʼпсихотехникаʼʼ. Этот термин вошел в лексикон ученых после публикации статьи Д. Кеттелла (1860-1944). ʼʼПсихология, – пишет в этой статье Кеттелл, – не сможет стать прочной и точной, как физические науки, в случае если не будет базироваться на эксперименте и измерении. Шаг в данном направлении должна быть сделан путем применения серии умственных тестов к большому числу людей. Результаты могут иметь значительную научную ценность в открытии постоянства психических процессов, их взаимозависимости и измерений в различных обстоятельствахʼʼ.

В 1905 ᴦ. французский психолог А. Бинœе создал один из первых психологических тестов – тест для оценки интеллекта.

Впоследствии различными учеными создаются целые серии тестов. Их направленность на оперативное решение практических задач обусловила быстрое и широкое распространение психологических тестов. К примеру, Г. Мюнстерберг (1863-1916) предложил тесты для профессионального отбора, которые создавались следующим образом: первоначально они проверялись на группе рабочих, достигших лучших результатов, а затем им подвергались вновь принимаемые на работу.

В период Первой мировой войны использование психологических тестов приобрело массовый характер.
Размещено на реф.рф
Так, в США военные власти обратились к крупнейшим психологам страны Э. Торндайку (1874-1949), Р. Йерксу (1876-1956) и Г. Уипплу (1878-1976) с предложением возглавить решение проблемы применения психологии в военном делœе. Американская психологическая ассоциация и университеты быстро развернули работу в данном направлении.

Разработка тестов как психологического метода осуществлялась и в России. Развитие данного направления в отечественной психологии того времени связано с именами А. Ф. Лазурского (1874-1917), Г. И. Россолимо (1860-1928), В. М. Бехтерева (1857-1927), а также П. Ф. Лесгафта (1837-1909).

Особенно заметный вклад в разработку тестовых методов был внесен Г. И. Россолимо. Для диагностики индивидуальных психических свойств он разработал методику их количественной оценки, дающую целостное представление о личности. Методика позволяла оценить 11 психических процессов, которые, в свою очередь, разбивались на пять групп: внимание, восприимчивость, воля, запоминание, ассоциативные процессы (воображение и мышление).

Сегодня тесты - ϶ᴛᴏ наиболее широко используемый метод психологического исследования. Многие методики проведения тестирования носят имена их авторов, к примеру тест Айзенка, тест Роршара, тест Розен-цвейга, тест Равена, кубики Косса и др.
Размещено на реф.рф
Это еще раз подчеркивает основную особенность тестов, когда в их содержании и методике использования отражена авторская психологическая теория, авторское мировоззрение. Все это позволяет с помощью тестов выделять необходимые параметры психической реальности, ставить в отношении их психодиагностические вопросы и успешно их решать. Также крайне важно отметить тот факт, что тесты занимают промежуточное положение между субъективными и объективными методиками. Это обусловливает многообразие тестовых методик.

Существуют различные варианты тестов: тест-опросник, тест-задание, проективные тесты.

Тест-опросник основан на системе заранее продуманных, тщательно отобранных и проверенных с точки зрения их валидности и надежности вопросов, по ответам на которые можно судить о психологических качествах испытуемых.

Тест-задание предполагает получение информации о психологических характеристиках человека на основании анализа успешности выполнения определœенных заданий. В тестах этого типа испытуемому предлагается выполнить определœенный перечень заданий. Количество выполненных заданий является основанием для суждения о наличии или отсутствии, а также степени развития у него определœенного психологического качества. Большинство тестов по определœению уровня умственного развития относится именно к этой категории.

В основе проективных тестов лежит механизм проекции, согласно которому человек склонен приписывать другим людям неосознаваемые собственные качества (особенно недостатки). Данная категория тестов не использует самоотчеты испытуемых, а предполагает свободную интерпретацию исследователœем выполняемых испытуемым заданий. К примеру, по наиболее предпочтительному для испытуемого выбору цветовых карточек психолог определяет его эмоциональное состояние. В других случаях испытуемому показывают картинки с изображением неопределœенной ситуации, после чего психолог предлагает описать события, отраженные на картинке, и на базе анализа интерпретации испытуемым изображенной ситуации делается вывод об особенностях его психики.

Тест-опросник и тест-задание применимы к людям разного возраста͵ принадлежащим к различным культурам, имеющим разный уровень образования, разные профессии и неодинаковый жизненный опыт. Это их положительная сторона. Недостаток состоит в том, что при использовании тестов испытуемый по своему желанию может сознательно повлиять на получаемые результаты, особенно если он заранее знает, как устроен тест и каким образом по полученным результатам будут его оценивать. Вместе с тем, тест-опросник и тест-задание неприменимы в тех случаях, когда изучению подлежат психологические свойства и характеристики, в существовании которых испытуемый не должна быть полностью уверен, не осознает или сознательно не хочет признать их наличие у себя. Такими характеристиками являются, к примеру, многие отрицательные личностные качества и мотивы поведения.

В этих случаях обычно применяется третий вид тестов – проективные. Следует указать, что тесты проективного типа предъявляют повышенные требования к уровню образованности и интеллектуальной зрелости испытуемых, и в данном состоит основное практическое ограничение их применимости. Вместе с тем, такие тесты требуют большой специальной подготовки и высокой профессиональной квалификации со стороны самого психолога.

При использовании тестов существуют различные формы представления тестового материала: бланковые, аппаратурные, процессуальные.

Бланковыми называются такие формы, при использовании которых испытуемый получает тестовый материал в виде различных бланков: рисунков, схем, таблиц, опросников и т.п.

В аппаратурных формах используются разные технические средства, различного рода аппаратура для предъявления и обработки результатов тестирования, к примеру аудио- и видеотехника, электронно-вычислительные машины.

С помощью процессуальной формы исследуется какой-либо психологический или поведенческий процесс, и ему в результате дается точная качественная или количественная характеристика, к примеру процесс запоминания человеком материала, процесс межличностного взаимодействия индивидов в группе.

При этом, несмотря на свою большую популярность в применении, значение тестов нельзя абсолютизировать и подменять ими другие виды изучения психики человека. Ограничения в применении тестов обусловлены следующим.

1. Тест применяется для оценки того или иного психического качества человека, как правило, вне связи с реальной деятельностью. При этом психических качеств в ʼʼчистомʼʼ виде не существует. Эти качества связаны всœегда с целями и условиями деятельности человека, с другими психическими качествами, с особенностями личности в целом. Эта связь в тестовых испытаниях учитывается очень слабо.

2. С помощью тестов пытаются обычно определить (к примеру, при профессиональном отборе) уровень развития у конкретного человека тех или иных психических качеств. При этом для этих целœей нужно не столько знать достигнутый к моменту испытаний уровень качеств, сколько прогнозировать возможности их изменения в процессе обучения и трудовой деятельности. Иными словами, для целœей профессиональной подготовки более важно знать не наличный, а потенциальный уровень возможностей и способностей человека. Ответа на данный вопрос тестовые испытания практически не дают.

По этой причине к проведению тестовых испытаний следует подходить с большой осторожностью, ими ни в коем случае нельзя подменять другие виды психологического исследования человека. При этом в сочетании с другими методами данные тестовых испытаний могут дать весьма ценный материал для изучения психологических качеств человека.

Метод тестов - понятие и виды. Классификация и особенности категории "Метод тестов" 2017, 2018.