Психологические тесты и их достоверность

Слово «тест» переводится с английского как «испытание», «проба». В широком понимании тест — любое задание с одинаковой — стереотипной — инструкцией для всех испытуемых. В этом смысле задачи наподобие «отжаться десять раз от пола» или «сложить как можно более высокий домик из кубиков», безусловно, являются тестами. Но обычно тестом называют такой метод психологической диагностики, результаты которого могут быть представлены количественно — в виде шкалы значений. Подобные тесты тоже состоят из стандартных заданий или вопросов, но их создание и стандартизация требуют серьёзной и длительной предварительной работы.

Как и всякий метод исследования, претендуюший на объективность своих результатов, тест обязан быть достоверным, а следовательно, прежде всего валидным, т. е. пригодным для измерения именно того качества, которое он по замыслу учёных предназначен оценивать. Так, тест, служащий для определения уровня интеллекта (IQ), не должен измерять эрудицию, образованность, свойства памяти или количество усвоенных знаний. Иначе говоря, испытуемые, например, с хорошей памятью (но, возможно, со средними мыслительными способностями) не должны получать более высокие баллы IQ по сравнению с теми, у кого плохая память, зато хорошие способности к абстрагированию и обобщению. Тест же уровня тревожности обязан определять именно тревожность, а не чувствительность, «нервность», педантизм, рассеянность или склонность к унынию.
Значит, надо создать такие задания для теста, на успешность выполнения которых не влияли бы никакие дополнительные факторы, особенно качества личности, психологически близкие тем, что мы хотим измерить. А это очень сложная задача. Она связана с масштабными предварительными исследованиями, громоздкими математическими процедурами подсчёта и учёта всех возможных корреляций. Кроме того, необходима многоразовая повторная проверка разных вариантов тестовых заданий и новых формулировок вопросов и т. п.

Один из законов валидности гласит: «Валидность теста есть функция от валидности каждого его задания (вопроса)». Если опросник будет «в лоб» спрашивать у человека, склонен ли он к депрессии, насколько общителен или в какой мере считает себя тревожным, то исследователи никогда не получат объективной психологической картины — даже при самых искренних намерениях испытуемого ответить честно. Во-первых, потому, что отвечающий не обязан знать, что такое тревожность или депрессия и каковы их признаки. Во-вторых, ни один человек не осознаёт полностью свои личностные качества и проблемы и не способен беспристрастно оценить их. В-третьих, испытуемый может обманывать, например желая предстать перед экспериментатором в более выгодном свете. Или же искажать результаты невольно, имея склонность отрицать любые свои проблемы, утверждать, что у него «всё окей». Поэтому для оценки достоверности ответов во всех качественных опросниках заложены дополнительные шкалы, отражающие отношение испытуемого к опросу. В подобном случае стремление солгать, не расположенность к откровениям или желание пошутить, отвечая «от балды», будут хорошо видны по результатам теста.

По всем этим причинам в психологических опросниках редко встречаются «лобовые вопросы» (в отличие от анкет). Вопросы обычно касаются не самих личностных качеств, а различных ситуаций, в которых обнаруживаются оцениваемые черты личности. Например, пытаясь определить, насколько общителен человек, ему задают такие вопросы: «Часто ли вам приходится сидеть одному, в стороне, во время вечеринки?», «Легко ли вы заговариваете с посторонним человеком?», «Любите ли вы коллективные развлечения, общее веселье?» и т.д. Чтобы правильно сформулировать вопросы, специалист должен быть уверен, что они имеют прямое отношение к общительности. Таким образом, за каждым заданием теста стоит теоретическая работа психологов по «переводу» научных представлений об оцениваемых личностных свойствах на обыденный язык ' конкретных вопросов теста.
Интересно, что для психолога, составляющего опросник, не столь важно, часто ли в действительности испытуемый, например, сидит «в сторонке» в гостях. Важнее то, какой именно ответ на данный вопрос он сам выберет.
Другое обязательное качество настоящего теста — надёжность, т.е. точность его показателей — относительная свобода от разных «погрешностей измерения». Надёжность подразумевает также относительную устойчивость (стабильность) результатов при повторном тестировании. Если выясняется уровень экстраверсии — интроверсии, то человек не должен быть по показаниям одного и того же теста вчера экстравертом, а сегодня — интровертом только потому, что вчера у него было хорошее настроение, а сегодня он поссорился с другом. Ещё одно условие надёжности — относительная равнозначность вопросов (для этого вводится так называемая балловая цена каждого задания). Процедуры обеспечения надёжности теста, как и валидности, очень масштабны. Здесь используются сложные статистические методы, требующие кропотливого математического расчёта сотен характеристик. В частности, метод факторного анализа, впервые созданный именно в психологии; с его помощью исследуются статистически связанные признаки и выявляются скрытые, неучтённые факторы.

Наконец, важна репрезентативность теста — его пригодность для разных социальных групп. Группы могут отличаться по возрасту, полу, образованию, религиозной, культурной, классовой принадлежности и т. п. Когда на Западе начали применять первые тесты интеллекта, оказалось, что афроамериканцы и другие представители цветных меньшинств дают низкие показатели. Потом выяснилось, что тесты разрабатывались на нерепрезентативных выборках: в качестве эталонных для «нормального интеллекта» были взяты особенности мышления и суждения типичного белого американца, представителя среднего класса. Не учитывались трудноосознаваемые культурные стереотипы, нормы и «шаблоны» мышления — разные у представителей разных культур и сообществ.
Подобные проблемы возникают всегда при переносе тестов на другую культурную почву. Нельзя брать готовый американский тест и сразу использовать его в России: результаты не будут достоверны. При таком переносе тест необходимо адаптировать, т. е. практически заново проделать все процедуры стандартизации, проверки на валидность, надёжность и репрезентативность (достоверность его показа-телей для представителей другой культуры). Адаптации подверглись многие западные тесты, в частности Миннесотский многофакторный личностный опросник, называемый по английской аббревиатуре MMPI. (Существует два отечественных варианта данного опросника, созданные в 70-х гг.: вариант Ф. Б. Березина с соавторами и вариант Л. Н. Собчик и её сотрудников.) Ясно, что вопрос «Любите ли вы ходить на бейсбольные матчи?» в России имеет совсем другой, чем в США, психологический смысл. Большинство людей ответят на него отрицательно, и с точки зрения американского стандарта это будет свидетельствовать об определённых качествах личности (например, о замкнутости, нелюбви к шумным сборишам или о слабой выраженности типично мужских черт у мужчины). Можно, конечно, при адаптации теста для России просто заменить бейсбол футболом. Но сначала надо проверить, не обладают ли российские любители футбола какими-то личностными качествами, существенно отличающими их от любителей бейсбола в США, и играет ли футбол для российского общества ту же самую роль, что бейсбол для Америки.

Другой вопрос: «Вы всегда переходите улицу только на зелёный свет?». Для среднего европейца утвердительный ответ типичен, а отрицательный говорит о склонности к риску, нетерпеливости, отрицании общепринятых норм и т. п. Аля жителя России утвердительный ответ на этот вопрос совершенно нетипичен. Он, скорее всего, свидетельствует либо о лживости испытуемого (желании выглядеть «хорошим»), либо о его повышенной тревожности, либо о педантизме.
Для того чтобы тестом можно было пользоваться, он должен также пройти процедуру стандартизации — среднестатистического подсчёта частоты тех или иных ответов. Это позволит составить шкалу значений, по которой уже станут оцениваться результаты отдельного человека.
В личностных тестах не бывает правильных и неправильных ответов, как не бывает правильных или неправильных личностных свойств. Исключением являются только тесты интеллекта. Этим они отличаются от более распространённых тестов достижений, выясняющих, насколько испытуемый владеет определёнными навыками, умениями, знаниями. К такому типу относятся и тесты на уровень знаний в учебных заведениях.

Данные тестов, не прошедших проверки на валидность, надёжность и репрезентативность и процедуры стандартизации, не имеют никакой научной и практической ценности. Таковы все тесты, которые публикуются в популярных журналах.