Шрифт:
Интервал:
Закладка:
В качестве контрольных выступили 72 человека в пяти группах (12, 9, 13, 19 и 19 от первой до пятой группы соответственно). Все испытуемые участвовали в этой серии испытаний в качестве наблюдателей. Стимульным материалом помимо «живых» выступлений служили видеозаписи. Содержание выступлений, порядок заполнения бланков и другие инструкции ничем не отличались от тех, которые были в экспериментальных группах за исключением того, что испытуемые не получали обратной связи после каждого выступления, а общая оценка успешности распознания искренности осуществлялась после завершения просмотра всей видеозаписи.
Испытуемые экспериментальных групп вынесли в сумме 1090 суждений, а испытуемые из контрольных групп – 720, массив первичных данных насчитывал 1810 оценок, сделанных наблюдателями в восьми группах. В каждой из групп для каждого отдельного выступления были подсчитаны показатели успешности распознания искренности, в качестве которого принята доля правильно ответивших по отношению к общему числу наблюдателей. Рассчитанные таким способом показатели варьировались в весьма широких пределах: от 0,13 до 1,00 – в экспериментальных группах (при среднем значении 0,60) и от 0,08 до 1,00 – в контрольных (при среднем 0,64). Для каждой из групп было проведено сравнение показателей успешности распознания по второй половине сессии по отношению к первой.
Во всех трех экспериментальных группах успешность распознания возросла. Из пяти контрольных групп в двух наблюдался рост эффективности, в двух – снижение и в одной не зафиксировано никаких изменений. Общие результаты следующие: в экспериментальных группах зафиксировано возрастание успешности с 0,56 до 0,63; в контрольных группах средний показатель изменился с 0,63 до 0,64. Значимость этих различий оценивалась с помощью Т-критерия Стьюдента. Ни в одном случае значимых различий зафиксировать не удалось. В этом нет ничего удивительного, так как сравнение средних значений по половинам выборки – интуитивно понятный, но весьма грубый инструмент анализа, и в случае небольших изменений он дает консервативную оценку.
Кроме того, такой подход исключает прямое сравнение данных по экспериментальным и контрольным группам. Они сравниваются косвенным образом по отношению к нулевой гипотезе об отсутствии изменений в каждой из двух совокупностей данных отдельно. Еще один способ статистической оценки изменений состоит в использовании коэффициентов корреляции. Действительно, в каждой из групп можно рассчитать корреляцию показателей успешности с порядком, в котором выступающие делали свои сообщения, и тогда знак и величина коэффициента корреляции покажут направление и величину изменений. Кроме того, это дало бы возможность расширить базу для анализа данных и включить в сферу рассмотрения данные еще по трем контрольным группам. Дело в том, что в каждой из этих контрольных групп производилась оценка семи выступлений, а делать сравнения половин, каждая из которых состоит всего лишь из трех наблюдений, представляется не очень корректной процедурой. Коэффициент корреляции, рассчитанный по семи наблюдениям, выглядит вполне осмысленным показателем. Руководствуясь этими соображениями, был произведен подсчет корреляций по трем экспериментальным и теперь уже восьми контрольным группам. В экспериментальных группах получены следующие значения: –0,07; –0,08; +0,36. В контрольных группах показатели выглядят следующим образом: –0,14; –0,28; –0,11; –0,77; –0,13; +0,02; +0,16; +0,46.
На первый взгляд получившаяся картина выглядит противоречивой и маловразумительной. В экспериментальных группах, где при анализе методом разделения пополам наблюдался устойчивый, хотя и не внушительный рост, корреляционный анализ чаще показывает снижение, чем повышение эффективности. Результаты контрольных групп выглядят ничуть не хуже результатов, полученных в экспериментальных. Удручающим представляется и разброс показателей, которые в контрольных группах варьируют от +0,46 до –0,77. Однако более тщательный анализ сложившегося положения позволяет прояснить картину. Выбор в качестве показателя, свидетельствующего об улучшении результативности, коэффициента корреляции порождает одну проблему. Суть ее в том, что конкретная величина каждого коэффициента в нашем случае оказывается весьма зависящей от того, на каком шаге мы оборвем эксперимент. Так, в одной из экспериментальных групп, где выступили с сообщениями 20 человек, величины коэффициентов корреляции варьировали в пределах от +0,36 на пятом выступающем до –0,60 на восьмом. Иначе говоря, коэффициент корреляции, являясь, с одной стороны, весьма чутким к изменениям, оказывается вместе с тем весьма неустойчивым («капризным») показателем. Поэтому имеет смысл проводить статистическую оценку, основываясь не на сравнении отдельных (в нашем случае последних) численных значений этого показателя, а принимая во внимание полную их совокупность. В связи с этим была использована следующая схема анализа. После каждого выступления, начиная с третьего в каждой группе (считать коэффициент корреляции по двум парам данных представляется в нашем случае почти бессмысленным мероприятием), эксперимент как бы завершался, а его результаты рассматривались как самостоятельная единица анализа. Таким образом, был сформирован массив из 60 коэффициентов корреляции по экспериментальным группам и другой массив из 55 коэффициентов корреляции по контрольным группам. Характеристики первого распределения оказались следующими: значение минимума равно –0,75; первый квартиль фиксируется на точке –0,17; второй квартиль или медиана равен +0,17; третий квартиль равен +0,36; а максимальное значение – +0,82. Что касается второго распределения, т. е. совокупности данных, полученных на группах, в которых наблюдатели не получали немедленной обратной связи, то его характеристики выглядят следующим образом: минимальное значение равно –0,89; первый квартиль соотносится с числом –0,69; медиана равна –0,29; и даже значение третьего квартиля попадает в диапазон отрицательных чисел и фиксируется на точке –0,13; только максимум попадает в область положительных значений, его величина равна +0,48.
Данные говорят сами за себя и поэтому ничего удивительного, что формальная проверка значимости различий дала весьма впечатляющую оценку (0,0000000025 вероятность извлечения таких двух подвыборок из общей генеральной совокупности). Несмотря на всю привлекательность вышеописанного подхода (а он помимо получения оценки изменений с помощью такого привычного для психологов и интуитивно понятного показателя, как коэффициент корреляции, дает возможность сопоставления результатов, полученных, как будет показано далее, на совершенно другом материале), подводить окончательные итоги было бы преждевременным.
Во-первых, может вызвать сомнение корректность статистической процедуры, примененной для оценки значимости различий. Каждый из сравниваемых массивов данных состоит из элементов, не являющихся, строго говоря, статистически независимыми. Насколько Т-критерий Стьюдента является робастным по отношению к нарушению положения о независимости отдельных наблюдений, положения, учитываемого при построении этого статистического показателя, остается на сегодняшний день неясным. Существует угроза валидности статистического вывода. Во-вторых, различия в условиях работы экспериментальных и контрольных групп состояли не только в наличии и отсутствии обратной связи, но и в том, что стимульным материалом в значительной части контрольных групп служили видеозаписи выступлений, в то время как в экспериментальных группах наблюдатели оценивали «живые» выступления. В-третьих, число выступлений в экспериментальных и контрольных группах было различным. Эти соображения относятся к угрозе внутренней валидности. Поэтому было принято решение провести дополнительное исследование проблемы при максимально возможном уравнивании всех сопутствующих и привходящих условий, т. е. тех факторов, которые не имеют отношения к независимой переменной, но могут повлиять на величину зависимой переменной.
При проведении дополнительного исследования было сделано все возможное для выравнивания условий (разумеется, за исключением независимой переменной) проведения процедур в экспериментальной и контрольной группах. Стимульный материал в обеих группах был полностью идентичным. Этим материалом была видеозапись выступлений 20 человек, рассказывающих о посещении одного из российских городов. С каждым из испытуемых в экспериментальной и контрольной группах работа проходила в индивидуальном порядке. Для нивелирования эффекта порядка выступления каждый наблюдатель просматривал видеозаписи не совсем в том порядке, что другие представители его группы. Первый испытуемый экспериментальной группы начинал с просмотра первого эпизода, выносил свою оценку таким же образом, что и испытуемые основного эксперимента, получал обратную связь о точности своей оценки и лишь затем переходил ко второму эпизоду и т. д. Второй испытуемый этой же группы начинал с просмотра второго эпизода, а заканчивал первым.
- Психология межкультурных различий - Владимир Кочетков - Психология
- Психологический тезаурус - Сергей Степанов - Психология
- Психологический тезаурус - Сергей Степанов - Психология
- Прикладная психолингвистика речевого общения и массовой коммуникации - Алексей Леонтьев - Психология
- Психология человека. Введение в психологию субъективности - Виктор Слободчиков - Психология
- Психология свободы: теория и практика - Елена Кузьмина - Психология
- Психология масс и анализ человеческого Я - Зигмунд Фрейд - Психология
- Информационная СК-терапия - Виктор Кандыба - Психология
- Общественное мнение - Уолтер Липпман - Психология
- Психология детского поведения. Как помочь ребенку справиться с эмоциональными проблемами - Мона Делахук - Психология