Решение задач и выполнение научно-исследовательских разработок: Отправьте запрос сейчас: irina@bodrenko.org
Математические
методы в психологии
Лекция 3
Тема лекции: «Корреляционный анализ в психологии»
1. Понятие психологического корреляционного исследования. Виды корреляционных связей.
2. Математическая обработка и интерпретация
данных корреляционного исследования.
3. Метод ранговой корреляции Спирмена.
1. ПОНЯТИЕ ПСИХОЛОГИЧЕСКОГО КОРРЕЛЯЦИОННОГО
ИССЛЕДОВАНИЯ. ВИДЫ КОРРЕЛЯЦИОННЫХ
СВЯЗЕЙ.
1.1. Понятие психологического корреляционного исследования.
КОРРЕЛЯЦИЯ (лат. correlatio - соотношение) - понятие, указывающее на статистическую связь, существующую между изучаемыми явлениями.
Наиболее распространенной схемой современного психологического эмпирического исследования является корреляционное исследование. Теория корреляционного исследования основана на представлениях о мерах корреляционной связи, ее основы были заложены К. Пирсоном в работах по математической статистике.
Корреляционным называется исследование, проводимое для подтверждения или опровержения гипотезы о статистической связи между несколькими (двумя и более) переменными. В психологии в качестве переменных могут выступать психические свойства, процессы, состояния и др.
Стратегия проведения психологического корреляционного исследования сходна с квазиэкспериментом. Отличие от квазиэксперимента лишь в том, что управляемое воздействие на объект отсутствует. План корреляционного исследования несложен. Исследователь выдвигает гипотезу о наличии статистической связи между несколькими психическими свойствами индивида или между определенными внешними уровнями и психическими состояниями. При этом предположения о причинной зависимости не обсуждаются.
В качестве примера корреляционного психологического исследования рассмотрим следующую исследовательскую задачу.
ПРИМЕР.
Предположим, что одного исследователя интересует вопрос: связаны ли между собой креативность (то есть творческая одаренность) и школьная тревожность пяти- и шестиклассников? Изучая литературу, исследователь обнаружил одну группу ученых, которые считают, что творчески мыслящий ребенок должен быть менее тревожным. Другая группа ученых считает, что эти свойства никак не связаны. Наш исследователь пока не примкнул ни к одному лагерю и собирается провести собственное небольшое экспериментальное исследование.
1-Й ЭТАП. Сначала исследователь
должен решить, как измерять творческую одаренность (креативность) детей и школьную тревожность.
Например, коэффициент интеллекта
(IQ) можно измерить тестами, для его оценки используют тест на определение
коэффициента интеллекта Стенфорда-Бине и шкалы Векслера. При IQ выше 120
корреляция между творческой и интеллектуальной деятельностью исчезает,
поскольку творческое мышление имеет свои отличительные черты и не тождественно
интеллекту. В 1960 г. Дж. Гетцельс и П. Джексон
опубликовали данные об отсутствии корреляции между коэффициентом интеллекта (IQ) и коэффициентом креативности (Cr).
Творческое мышление:
- пластично, то есть творчески мыслящие люди предлагают множество решений в тех случаях, когда обычный человек может найти одно или два;
- подвижно, то есть для творчески мыслящего человека не составляет труда перейти от одного аспекта проблемы к другому, не ограничиваясь одной точкой зрения;
- оригинально, оно порождает необычные, небанальные, непривычные решения.
Параметры творческого мышления входят в кубическую модель Дж. Гилфорда — модель дивергентного мышления, которое предполагает поиск решения по всем возможным направлениям, рассмотрение как можно большего числа вариантов, варьирование путей решения проблемы и, как итог — неожиданные оригинальные выводы и результаты.
Дж. Гилфорд разработал батарею тестов для диагностики креативности: 10 тестов на вербальную креативность, 4 — на невербальную. П. Торранс продолжил изучение креативности, он разработал серию тестов для определения коэффициента креативности, адресованных разным людям — от дошкольников до взрослых. В состав батареи П. Торранса входит 12 тестов, диагностирующих три сферы творчества: словесное, словесно-изобразительное и словесно-звуковое творческое мышление. Для диагностики уровня креативности используются разные методики. Многие исследователи считают, что следует отказаться от жестких лимитов времени, отведенных на выполнение теста. При этой методике диагностики свойство креативности обнаруживает свою полную независимость от интеллекта.
Предположим, что наш исследователь выбрал методику Торранса и тест для определения уровня креативности школьников.
Школьная тревожность – это
самое широкое понятие, включающее различные аспекты устойчивого школьного
эмоционального неблагополучия. Она выражается повышенном беспокойстве в учебных
ситуациях, в классе, в волнении и ожидании плохого отношения к себе,
отрицательной оценки со стороны учителей, одноклассников. У ребенка пониженная
самооценка и он постоянно не уверен в правильности своего поведения.
Например, тест уровня школьной тревожности Филлипса позволяет определить общий уровень школьной тревожности, а также изучить характер переживания тревожности, связанной с различными областями школьной жизни. Методика Филлипса предназначена для диагностики уровня и характера тревожности, связанной со школой у детей младшего и среднего школьного возраста.
Предположим, что для оценки тревожности наш исследователь выбрал тест уровня школьной тревожности Филлипса.
Итак, исследователь выбрал два теста для определения уровня креативности и уровня тревожности. Соответственно, имеются два признака: первый признак (X) — креативность, второй признак (Y) — школьная тревожность.
Исследованию подлежат 20 000 пяти- и шестиклассников. Но возможности исследователя ограничены только 200 учащимися.
2-Й ЭТАП. Разбираясь в статистике, исследователь планирует взять случайную выборку из 200 учащихся из совокупности объемом 20 000 учащихся так, чтобы можно было сделать статистические выводы относительно всей генеральной совокупности по данным выборочных наблюдений. Каждому из 200 учащихся будут предложены оба теста (для определения уровня креативности и уровня тревожности). Надо вычислить коэффициент корреляции между результатами этих тестов.
1.2.
Виды
корреляционных связей.
«Корреляция» в прямом переводе означает
«соотношение». Если изменение одной переменной сопровождается изменением
другой, то можно говорить о корреляции этих переменных. Наличие корреляции
двух переменных ничего не говорит о причинно-следственных зависимостях между
ними, но дает возможность выдвинуть такую гипотезу. Отсутствие же корреляции
позволяет отвергнуть гипотезу о причинно-следственной связи переменных.
Различают несколько интерпретаций наличия корреляционной связи между двумя измерениями:
1. Прямая корреляционная связь. Уровень одной переменной непосредственно соответствует уровню другой. Примером является закон Хика: скорость переработки информации пропорциональна логарифму от числа альтернатив. Другой пример: корреляция высокой личностной пластичности и склонности к смене социальных установок.
2. Корреляция, обусловленная 3-й переменной. 2 переменные (а, с) связаны одна с другой через 3-ю (в), не измеренную в ходе исследования. По правилу транзитивности, если есть R (а, b) и R (b, с), то R (а, с). Примером подобной корреляции является установленный психологами США факт связи уровня интеллекта с уровнем доходов. Скорость опознания изображения при быстром (тахистоскопическом) предъявлении и словарный запас испытуемых также положительно коррелируют. Скрытой переменной, обусловливающей эту корреляцию, является общий интеллект.
3.
Случайная корреляция, не обусловленная
никакой переменной.
4.
Корреляция, обусловленная неоднородностью
выборки. Представим себе, что выборка, которую мы будем обследовать,
состоит из двух однородных групп. Например, мы хотим выяснить, связана ли
принадлежность к определенному полу с уровнем экстраверсии. Считаем, что
«измерение» пола трудностей не вызывает, экстраверсию же измеряем с помощью
опросника Айзенка ETI-1. У нас 2 группы: мужчины-математики
и женщины-журналистки. Неудивительно, если мы получим линейную зависимость
между полом и уровнем экстраверсии—интроверсии: большинство мужчин будут
интровертами, большинство женщин — экстравертами.
Корреляционные связи различаются по своему виду (рис. 1, см. [2], гл. 5). Если повышение уровня одной переменной сопровождается повышением уровня другой, то речь идет о положительной корреляции. Возрастание громкости звука сопровождается ощущением повышения его тона. Если рост уровня одной переменной сопровождается снижением уровня другой, то мы имеем дело с отрицательной корреляцией. Чем боязливей особь, тем меньше у нее шансов занять доминирующее положение в группе. Нулевой называется корреляция при отсутствии связи переменных.
Рисунок 1. Примеры распределений испытуемых в пространстве двух признаков.
Математическую теорию линейных корреляций разработал К. Пирсон. В психологии практически нет примеров строго линейных связей (положительных или отрицательных). Большинство связей — нелинейные. Классический пример нелинейной зависимости — закон Йеркса—Додсона: возрастание мотивации первоначально повышает эффективность научения, а затем наступает снижение продуктивности (эффект «перемотивации»). Другим примером является связь между уровнем мотивации достижений и выбором задач различной трудности. Лица, мотивированные надеждой на успех, предпочитают задания среднего диапазона трудности — частота выборов на шкале трудности описывается колоколообразной кривой.
1.3.
Планирование
корреляционного исследования.
План корреляционного исследования является разновидностью квазиэкспериментального плана при отсутствии воздействия независимой переменной на зависимые. В более строгом смысле: тестируемые группы должны быть в эквивалентных неизменных условиях. При корреляционном исследовании все измеряемые переменные — зависимые. Фактором, определяющим эту зависимость, может быть одна из переменных или скрытая, неизмеряемая переменная. Корреляционное исследование разбивается на серию независимых друг от друга измерений в группе испытуемых Р.
Различают простое и сравнительное корреляционные исследования.
В первом случае группа испытуемых однородна. Во втором случае мы имеем несколько рандомизированных групп, различающихся по одному или нескольким определенным критериям. Результатом этого исследования является матрица корреляций. Обработку данных можно вести, сравнивая строки полученной матрицы корреляций или столбцы. Коррелируя между собой строки, мы сопоставляем друг с другом испытуемых; корреляции же интерпретируются как коэффициенты сходства—различия людей между собой. Коррелируя между собой столбцы, мы проверяем гипотезу о статистической связи измеряемых переменных. В этом случае их размерность не имеет никакого значения.
Такое исследование называется структурным, так как в итоге мы получаем матрицу корреляции измеренных переменных, которая выявляет структуру связей между ними.
Разумеется, Р-корреляции можно вычислять лишь в том случае, если данные приведены к одной шкальной размерности, в частности, с помощью Z-преобразования данных.
В исследовательской практике часто возникает задача выявить временны’е корреляции параметров или же обнаружить изменение структуры корреляций параметров во времени. Примером таких исследований являются лонгитюды.
План лонгитюдного исследования представляет собой серию отдельных замеров одной или нескольких переменных через определенные промежутки времени. Лонгитюдное исследование — это промежуточный вариант между квазиэкспериментом и корреляционным исследованием, так как время интерпретируется исследователем как независимая переменная, определяющая уровень зависимых (например, личностных черт).
РАССМОТРИМ ОСНОВНЫЕ ТИПЫ КОРРЕЛЯЦИОННОГО ИССЛЕДОВАНИЯ.
1. Сравнение двух групп. Этот план лишь условно можно отнести к корреляционным исследованиям. Он применяется для установления сходства или различия двух естественных или рандомизированных групп по выраженности того или иного психологического свойства или состояния. Допустим, у вас есть желание выяснить, отличаются ли мужчины и женщины по уровню экстраверсии. Для этого вы должны создать две репрезентативные выборки, уравненные по прочим значимым для экстраверсии—интроверсии параметрам (по параметрам, влияющим на уровень экстраверсии—интроверсии), и провести измерение с помощью теста EPQ. Средние результаты у 2 групп сравниваются с помощью t-критерия Стьюдента. При необходимости сравниваются дисперсии показателя экстраверсии по F-критерию Фишера.
Если исследователь задался целью сравнить две учебные группы по уровню успеваемости, он должен позаботиться о том, чтобы не произошло их «перемешивания» в ходе исследования.
2. Одномерное исследование одной группы, в разных условиях. План этого исследования аналогичен предыдущему. Но по своей сути он близок к эксперименту, так как условия, в которых находится группа, различаются. В случае корреляционного исследования мы не управляем уровнем независимой переменной, а лишь констатируем изменение поведения индивида в новых условиях. Примером может служить изменение уровня тревожности детей при переходе из детского сада в 1-й класс школы: группа одна и та же, а условия различные. Главные артефакты этого плана — кумуляция эффектов последовательности и тестирования. Кроме того, искажающее влияние на результаты может оказывать временной фактор (эффект естественного развития).
3. Корреляционное исследование попарно эквивалентных групп. Этот план используется при исследовании близнецов методом внутрипарных корреляций. Существует множество более сложных вариантов планов психогенетических исследований близнецов.
4. Многомерное корреляционное исследование проводится для проверки гипотезы о статистической связи нескольких переменных, характеризующих поведение. Оно реализуется по следующей программе. Отбирается группа, которая представляет собой либо генеральную совокупность, либо интересующую нас популяцию. Отбираются тесты, проверенные на надежность и внутреннюю валидность. Затем группа тестируется по определенной программе. Данные исследования представлены в форме матрицы размера «m x n» m — количество испытуемых, n — число тестов. Матрица «сырых» данных обрабатывается, подсчитываются коэффициенты линейной корреляции. Затем корреляции оцениваются на статистические различия.
В некоторых случаях возникает необходимость вычисления множественных корреляций, частных корреляций, корреляционных отношений или редукции размерности — уменьшения числа параметров. Для уменьшения числа измеренных параметров используются различные методы латентного анализа.
Главной причиной артефактов, возникающих при проведении
многомерного психологического тестирования, является реальное физическое
время. При анализе данных корреляционного исследования мы отвлекаемся от неодновременности
проводимых измерений. Кроме того, считается, что результат последующего
измерения не зависит от предыдущего, т. е. не существует эффекта переноса.
Перечислим основные артефакты, которые возникают в ходе применения этого плана:
1. Эффект последовательности — предшествующее выполнение одного теста может повлиять на результат выполнения другого (симметричный или асимметричный перенос).
2. Эффект научения — при выполнении серии различных тестовых испытаний у участника эксперимента может повышаться компетентность в тестировании.
3. Эффекты фоновых воздействий и «естественного» развития приводят к неконтролируемой динамике состояния испытуемого в ходе исследования.
4. Взаимодействие процедуры тестирования и состава группы проявляется при исследовании неоднородной группы: интроверты хуже сдают экзамены, чем экстраверты, «тревожные» хуже справляются со скоростными тестами интеллекта. Для контроля эффектов последовательности и переноса следует пользоваться тем же приемом, что и при планировании экспериментов, а именно — контрбалансировкой. Только вместо воздействий меняется порядок проведения тестов.
ПРИМЕР.
Психологу необходимо было выявить, как влияет вид задания на успешность выполнения сменяющих одна другую задач. Психолог предположил, что для испытуемых не безразлично, в какой последовательности им даются тесты. Были выбраны задания на креативность (из теста Торренса) и на общий интеллект (из теста Айзенка). Задачи давались испытуемым в случайном порядке. Оказалось, что если задание на креативность выполняется первым, то скорость и точность решения задачи на интеллект снижается. Обратного эффекта не наблюдалось. Полученное явление иллюстрирует классический эффект асимметричного переноса.
5. Структурное корреляционное исследование. От предшествующих вариантов эта схема отличается тем, что исследователь выявляет не отсутствие или наличие значимых корреляций, а различие в уровне значимых корреляционных зависимостей между одними и теми же показателями, измеренными у представителей различных групп.
Рассмотрим простейший пример структурного корреляционного исследования.
ПРИМЕР.
Допустим, психологу необходимо проверить гипотезу о том, влияет ли пол родителя и пол ребенка на сходство или различие их личностных черт, например уровня нейротизма по Айзенку. Для этого проводится психологическое исследование реальных групп — семей. Затем вычисляются коэффициенты корреляции уровней тревожности родителей и детей. Получаются 4 основных коэффициента корреляции: 1) мать—дочь; 2) мать—сын; 3) отец—дочь; 4) отец—сын, и два дополнительных: 5) сын—дочь; 6) мать—отец. Корреляции подвергаются Z-преобразованию и сравниваются по t-критерию Стьюдента.
6. Лонгитюдное корреляционное исследование. Лонгитюдное исследование — вариант квазиэкспериментальных исследовательских планов. Воздействующей переменной психолог, проводящий лонгитюдное исследование, считает время. Оно является аналогом плана тестирования одной группы в разных условиях. Только условия считаются константными. Результатом любого временного исследования (в том числе и лонгитюдного) является построение временного тренда измеряемых переменных, которые могут быть аналитически описаны теми или иными функциональными зависимостями.
Лонгитюдное корреляционное исследование строится по плану временных серий с тестированием группы через заданные промежутки времени. Помимо эффектов обучения, последовательности и т.д. в лонгитюдном исследовании следует учитывать эффект выбывания: не всех испытуемых, первоначально принимавших участие в эксперименте, удается обследовать через какое-то определенное время. Возможно взаимодействие эффектов выбывания и тестирования (отказ от участия в последующем обследовании) и т.д.
Структурное лонгитюдное исследование отличается от простого лонгитюда тем, что нас интересует не столько изменение центральной тенденции или разброса какой-либо переменной, сколько изменение связей между переменными. Такого рода исследования широко распространены в психогенетике.
2. МАТЕМАТИЧЕСКАЯ ОБРАБОТКА И ИНТЕРПРЕТАЦИЯ
ДАННЫХ КОРРЕЛЯЦИОННОГО ИССЛЕДОВАНИЯ.
Данные структурного корреляционного исследования представляют собой одну или несколько матриц. Первичная обработка заключается в подсчете коэффициентов статистической связи между двумя и более переменными. Выбор меры связи определяется шкалой, с помощью которой произведены измерения.
1.Стохастическая связь между качественными переменными номинативной шкалы называется сопряженностью. При исследовании степени тесноты связи между качественными номинативными (но не дихотомическими) признаками используются коэффициенты сопряженности Пирсона.
2. Если измерения произведены по дихотомической шкале, то для подсчета тесноты связи признаков применяется «коэффициент ассоциации» - коэффициент контингенции Пирсона (φ-коэффициент).
Коэффициент контингенции Пирсона (φ-коэффициент).
Дихотомическая корреляция
используется при исследовании степени тесноты между переменными X и Y, каждый из которых представлен в виде
двух альтернатив («1» – «0»). Расчетная таблица φ-коэффициента Пирсона (тетрахорическая таблица) состоит из
четырех ячеек (рис. 2):
ПЕРЕМЕННЫЕ |
X |
||
«1» |
«0» |
||
Y |
«1» |
a |
b |
«0» |
c |
d |
Рис. 2. Тетрахорическая таблица.
Частоты a, b, c, d называются
тетрахорическими показателями, их сумма равна объему выборки: N = a + b + c
+ d.
Каждая из клеток тетрахорической таблицы соответствует частоте выбора определенной альтернативы того и другого признака. Например, частота b определяет количество случаев, в которых зарегистрировано «0» по переменной X и «1» по переменной Y.
φ-коэффициент
Пирсона определяется по формуле
Проверка гипотезы о значимости связи между исследуемыми переменными осуществляется с помощью критерия χ2 .
Для этого эмпирическое значение
χ2 = φ 2 · N, где N – объем выборки,
сравнивается с критическим χα 2 (1) для числа степеней свободы df = 1:
χα 2 = 3,841 (для α = 0,05); χα2 = 6,635 (для α = 0,01).
Если выполняется условие χ2 ≤ χ2 (для α = 0,05) (1), то нулевая гипотеза H0: φ = 0, не отвергается.
При χ2 > χ 2 (для α = 0,01) нулевая гипотеза H0: φ = 0, отвергается, и связь считается значимой.
ПРИМЕР.
Изучается общественное мнение по очень важному поводу. Распределение ответов респондентов, мужчин и женщин, приведено в таблице (рис. 3). Требуется определить наличие связи между полом и определенным мнением.
Переменные |
X - «Мнение» |
||
«положительное» |
«отрицательное» |
||
Y – «Пол» |
мужчины |
59 |
41 |
женщины |
36 |
64 |
Рис. 3. Тетрахорическая таблица.
РЕШЕНИЕ.
При корреляционном анализе
дихотомических переменных используем коэффициент контингенции Пирсона
(φ-коэффициент).
Нулевой гипотезой H0 является предположение об отсутствии связи между рассматриваемыми переменными. Для ее проверки определяем значение φ-коэффициента Пирсона и критическое значение «хи-квадрат»:
φ = – 0, 23
N = 200
χ 2э = (-0,23) 2 · 200 = 10,580 > 6,635.
Вследствие того, что эмпирическое значение попало в критическую область: χ2э > χ2 (для α = 0,01) , нулевая гипотеза φ = 0 отвергается, связь между полом и определенным мнением можно считать значимой (α < 0,01).
3. Данные представлены в порядковой шкале. Мерой связи, которая соответствует шкале порядка, является коэффициент ранговой корреляции Кендалла. Коэффициент корреляции «тау» Кендалла имеет те же свойства, что и коэффициент Спирмена (изменяется от –1 до +1, для независимых случайных величин равен нулю), однако он считается более информативным. Он основан на подсчете несовпадений в порядке следования ранжировок Х и Y. (Например, есть ряд испытуемых: сначала мы выстраиваем этот ряд в порядке убывания массы тела, а затем — в порядке убывания роста). Для каждой пары подсчитывается число совпадений и инверсий: совпадение, если их порядок по Х и Y одинаков; инверсия, если порядок различен. Разница числа «совпадений» и числа «инверсий», деленная на N(N–1)/2, (N – число ранжируемых признаков, черт) дает коэффициент «тау». Число совпадений обозначим через P, число инверсий – через Q. Эмпирическое значение коэффициента ранговой корреляции «тау» вычисляется по формуле:
Часто для обработки данных, полученных с помощью шкалы порядка, используют коэффициент rS ранговой корреляции Спирмена, его рекомендуют применять в том случае, если одно измерение произведено по шкале порядков, а другое — по шкале интервалов.
4. Данные получены по шкале интервалов, или отношений. В этом случае применяется стандартный коэффициент линейной корреляции Пирсона или коэффициент ранговой корреляции Спирмена.
Коэффициент линейной корреляции Пирсона используется для оценки тесноты (силы) связи между двумя переменными в случаях, если: 1) рассматриваемая связь линейная; 2) обе переменные измерены в сильных шкалах (шкале отношений или интервальной шкале).
5. Бисериальная корреляция является методом корреляционного анализа между двумя переменными, одна из которых измерена в дихотомической шкале. Подобные задачи часто встречаются в психодиагностике.
В том случае, если одна переменная является
дихотомической, а другая — интервальной, то используется так
называемый точечный бисериальный коэффициент корреляции
Пирсона.
Если первая переменная измерена в дихотомической шкале, вторая переменная измерена в порядковой шкале, то решение задач данного класса осуществляется с помощью рангово-бисериального коэффициента корреляции.
6. Если исследователь полагает, что связи между переменными нелинейны, он вычисляет корреляционное отношение, характеризующее величину нелинейной статистической зависимости двух переменных.
7. Коэффициент конкордации (согласованности) Кендалла используется в случае, когда
совокупность объектов характеризуется несколькими последовательностями рангов, исследователю необходимо установить статистическую связь между этими последовательностями. Такие задачи возникают, например, при анализе экспертных оценок: несколько экспертов ранжируют одних и тех же испытуемых по определенному качеству, а психологу для проведения углубленного анализа ситуации и принятия обоснованного решения требуется определить степень согласованности мнений группы экспертов.
Значения коэффициента конкордации W, в отличие от коэффициента корреляции, заключены в интервале 0 ≤ W ≤ 1 . Коэффициент конкордации равен единице при полном совпадении всех ранговых последовательностей. Если мнения экспертов (ранговые последовательности) полностью противоположны, коэффициент конкордации равен нулю (коэффициент корреляции в этом случае будет равен –1).
Корреляционное исследование завершается выводом о статистической значимости установленных (или неустановленных) зависимостей между переменными. Однако исследователи не ограничиваются такой констатацией. Одна из главных задач, которые возникают перед психологами, — выяснить, не обусловлены ли связи между отдельными параметрами (психологическими свойствами) скрытыми факторами? Для этой цели применяется аппарат редукции числа переменных: методы многомерного анализа данных, которые изучаются психологами в курсе «Математические методы в психологии».
3. МЕТОД РАНГОВОЙ КОРРЕЛЯЦИИ СПИРМЕНА.
В психологии часто возникает потребность анализа связи между переменными, которые не могут быть измерены в интервальной шкале или в шкале отношений, но тем не менее поддаются упорядочению и могут быть проранжированы по степени убывания или возрастания признака.
Для определения тесноты связи между признаками, измеренными в порядковых шкалах, применяются методы ранговой корреляции.
К ним относятся коэффициенты ранговой корреляции Спирмена и Кендалла (используются для определения тесноты связи между двумя переменными) и коэффициент конкордации (устанавливает статистическую связь между несколькими признаками).
Использование коэффициента линейной корреляции Пирсона в случае, когда о законе распределения и о типе измерительной шкалы отсутствует сколько-нибудь надежная информация, может привести к существенным ошибкам.
Методы ранговой корреляции могут быть использованы для определения тесноты связи не только между количественными переменными, но и между качественными признаками при условии, что их значения можно упорядочить и проранжировать. Эти методы также могут быть использованы применительно к признакам, измеренным в интервальных шкалах и реляционных шкалах, однако их эффективность в этом случае всегда будет ниже.
Метод ранговой корреляции Спирмена, является непараметрическим методом, он является универсальным и работает с данными, измеренными в любых шкалах, и прост в применении. Уникальность метода ранговой корреляции состоит в том, что он позволяет сопоставлять не индивидуальные показатели, а индивидуальные иерархии, или профили, что недоступно ни одному из других статистических методов, включая метод линейной корреляции. Коэффициент ранговой корреляции рекомендуется применять в тех случаях, когда нам необходимо проверить, согласованно ли изменяются разные признаки у одного и того же испытуемого и насколько совпадают индивидуальные ранговые показатели у двух отдельных испытуемых или у испытуемого и группы.
Метод ранговой корреляции Спирмена позволяет определить тесноту (силу) и направление корреляционной связи между двумя признаками или двумя профилями (иерархиями) признаков.
Для подсчета коэффициента ранговой корреляции Спирмена необходимо иметь два ряда значений, которые могут быть проранжированы.
Такими рядами значений могут быть:
1) два признака A, B, измеренные в одной и той же группе испытуемых;
2) две индивидуальные иерархии признаков A, B, выявленные у двух испытуемых по одному и тому же набору признаков;
3) две групповые иерархии признаков A,B;
4) индивидуальная A и групповая B иерархии признаков.
Вначале показатели ранжируются отдельно по каждому из признаков A, B. Каждая из двух совокупностей располагается в виде вариационного ряда с присвоением каждому члену ряда соответствующего порядкового номера (ранга), выраженного положительным числом. Одинаковым значениям ряда присваивают среднее ранговое число. Сравниваемые признаки можно ранжировать в любом направлении как в сторону ухудшения качества (ранг 1 получает самый большой, быстрый, умный и т. д. испытуемый), так и наоборот. Главное, чтобы обе переменные были проранжированы одинаковым способом. Как правило, меньшему значению признака начисляется меньший ранг.
ПРИМЕР 1.
У группы 16 студентов-психологов были измерены уровень соперничества по тесту К. Томаса (признак A) и уровень самооценки депрессии по методике У. Цунга (признак B). Полученные результаты занесены в таблицу (рис. 4):
№ |
1. |
2. |
3. |
4. |
5. |
6. |
7. |
8. |
9. |
10. |
11. |
12. |
13. |
14. |
15. |
16. |
A |
7 |
7 |
3 |
2 |
3 |
5 |
2 |
5 |
2 |
4 |
4 |
8 |
5 |
4 |
5 |
11 |
B |
39 |
35 |
36 |
29 |
39 |
30 |
35 |
37 |
25 |
36 |
28 |
35 |
37 |
29 |
36 |
35 |
Рис. 4. Таблица значений признаков A, B группы испытуемых.
Требуется проранжировать индивидуальные значения испытуемых по обоим признакам A, B.
РЕШЕНИЕ.
1. Проранжируем показатели для признака A.
Наименьшее значение 2 признака A встречается у 3-х испытуемых, каждому из них приписываем средний ранг: (1+2+3)/3 = 2.
Значение 3 встречается у 2-х испытуемых, каждому из них приписываем средний ранг:
(4+5)/2= 4,5.
Значение 4 встречается у 3-х испытуемых, каждому из них приписываем средний ранг:
(6+7+8)/3 = 7.
Значение 5 встречается у 4-х испытуемых, каждому из них приписываем средний ранг:
(9+10+11+12)/4 = 10,5.
Значение 7 встречается у 2-х испытуемых, каждому из них приписываем средний ранг:
(13+14)/2 = 13,5.
Значение 8 встречается у 1-го испытуемого, приписываем ему ранг 15.
Значение 11 встречается у 1-го испытуемого, приписываем ему ранг 16.
Получим проранжированный ряд значений Xi признака A.
2. Проранжируем показатели для признака B.
Наименьшее значение 25 признака B встречается у 1-го испытуемого, приписываем ему ранг 1.
Значение 28 встречается у 1-го испытуемого, приписываем ему ранг 2.
Значение 29 встречается у 2-х испытуемых, каждому из них приписываем средний ранг:
(3+4)/2=3,5.
Значение 30 встречается у 1-го испытуемого, приписываем ему ранг 5.
Значение 35 встречается у 4-х испытуемых, приписываем каждому из них средний ранг:
(6+7+8+9)/4=7,5.
Значение 36 встречается у 3-х испытуемых, приписываем каждому из них средний ранг:
(10+11+12)/3=11.
Значение 37 встречается у 2-х испытуемых, приписываем каждому из них средний ранг:
(13+14)/2=13,5.
Значение 39 встречается у 2-х испытуемых, приписываем каждому из них средний ранг:
(15+16)/2=15,5.
Получим
проранжированный ряд значений Yi признака B.
Ранговые оценки признаков A, B занесем в следующую таблицу (рис. 5).
i |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
Xi |
13,5 |
13,5 |
4,5 |
2 |
4,5 |
10,5 |
2 |
10,5 |
2 |
7 |
7 |
15 |
10,5 |
7 |
10,5 |
16 |
Yi |
15,5 |
7,5 |
11 |
3,5 |
15,5 |
5 |
7,5 |
13,5 |
1 |
11 |
2 |
7,5 |
13,5 |
3,5 |
11 |
7,5 |
Рис. 5. Таблица ранговых оценок признаков A, B группы испытуемых.
Для проверки правильности проведенного нами ранжирования для признаков A и B необходимо, соответственно, применить формулы:
В данном примере N = 16, получим N(N+1)/2 = 136.
Для ряда рангов Xi имеем:
13,5 +13,5+4,5+2+4,5+10,5+2+10,5+2+7+7+15+10,5+7+10,5+16 = 136.
Для ряда рангов Yi имеем:
15,5+7,5+11+3,5+15,5+5+7,5+13,5+1+11+2+7,5+13,5+3,5+11+7,5 = 136.
1. В первом случае (два признака) ранжируются индивидуальные значения по первому признаку, полученные разными испытуемыми, а затем индивидуальные значения по второму признаку. Если два признака связаны положительно, то испытуемые, имеющие низкие ранги по одному из них, будут иметь низкие ранги и по другому, а испытуемые, имеющие высокие ранги по одному из признаков, будут иметь по другому признаку также высокие ранги.
2. Во втором случае (два индивидуальных профиля), ранжируются индивидуальные значения, полученные каждым из 2-х испытуемым по определенному (одинаковому для них обоих) набору признаков. Первый ранг получит признак с самым низким значением; второй ранг – признак с более высоким значением и т.д. Очевидно, что все признаки должны быть измерены в одних и тех же единицах, иначе ранжирование невозможно. Например, невозможно проранжировать показатели по личностному опроснику Кеттелла (16PF), если они выражены в "сырых" баллах, поскольку по разным факторам диапазоны значений различны: от 0 до 13, от 0 до 20 и от 0 до 26. Мы не можем сказать, какой из факторов будет занимать первое место по выраженности, пока не приведем все значения к единой шкале (чаще всего это шкала стенов). Если индивидуальные иерархии двух испытуемых связаны положительно, то признаки, имеющие низкие ранги у одного из них, будут иметь низкие ранги и у другого, и наоборот. Например, если у одного испытуемого фактор E (доминантность) имеет самый низкий ранг, то и у другого испытуемого он должен иметь низкий ранг, если у одного испытуемого фактор C (эмоциональная устойчивость) имеет высший ранг, то и другой испытуемый должен иметь по этому фактору высокий ранг и т.д.
3. В третьем случае (два групповых профиля), ранжируются среднегрупповые значения, полученные в 2-х группах испытуемых по определенному, одинаковому для двух групп, набору признаков. В дальнейшем линия рассуждений такая же, как и в предыдущих двух случаях.
4. В четвертом случае (индивидуальный и групповой профили), ранжируются отдельно индивидуальные значения испытуемого и среднегрупповые значения по тому же набору признаков, которые получены, как правило, при исключении этого отдельного испытуемого. Он не участвует в среднегрупповом профиле, с которым будет сопоставляться его индивидуальный профиль. Ранговая корреляция позволит проверить, насколько согласованы индивидуальный и групповой профили.
Вычисление коэффициента ранговой корреляции Спирмена.
Коэффициент ранговой корреляции Спирмена находится по формуле
где di – разность рангов для каждой i–пары из N наблюдений.
Коэффициент rS ранговой корреляции Спирмена изменяется от –1 до +1. Для подсчета коэффициента ранговой корреляции Спирмена rs необходимо определить разности di = xi - yi между рангами, полученными по обоим признакам. Затем эти значения di подставляем в формулу (1). Чем меньше разности между рангами, тем больше будет rs, тем ближе он будет к (+1). Если корреляция отсутствует, то все ранги будут перемешаны и между ними не будет никакого соответствия. Формула (1) составлена так, что в этом случае rs окажется близким к 0. В случае отрицательной корреляции низким рангам испытуемых по одному признаку будут соответствовать высокие ранги по другому признаку, и наоборот. Чем больше несовпадение между рангами испытуемых по двум переменным, тем ближе rs к (– 1).
Если в вариационных рядах для Xi и Yi встречаются члены ряда с одинаковыми ранговыми числами, то в формулу для коэффициента корреляции Спирмена необходимо внести поправки TX и TY на одинаковые ранги:
Где TX и TY вычисляются по формулам:
В формуле (3) m – количество групп в ранговом ряду X с одинаковыми ранговыми числами; Соответственно, a1, a2, …, am (aj > 1) – это объемы каждой группы с одинаковыми рангами в первом ранговом ряду X.
В формуле (4) p – количество групп в ранговом ряду Y с одинаковыми ранговыми числами. Соответственно, b1, b2, …, bp (bk > 1) – это объемы каждой группы с одинаковыми рангами во втором ранговом ряду Y.
ПРИМЕР 1 (продолжение).
Вычислим коэффициент rS для примера 1.
Вычислим разности di=Xi-Yi ранговых оценок признаков A (уровень соперничества) и B (самооценка уровня депрессии) для примера 1 (рис. 5). Полученные значения di и di2 занесем в следующую таблицу (рис. 6).
i |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
xi |
13,5 |
13,5 |
4,5 |
2 |
4,5 |
10,5 |
2 |
10,5 |
2 |
7 |
7 |
15 |
10,5 |
7 |
10,5 |
16 |
yi |
15,5 |
7,5 |
11 |
3,5 |
15,5 |
5 |
7,5 |
13,5 |
1 |
11 |
2 |
7,5 |
13,5 |
3,5 |
11 |
7,5 |
di |
-2 |
6 |
6,5 |
-1,5 |
-11 |
5,5 |
-5,5 |
-3 |
1 |
-4 |
5 |
7,5 |
-3 |
3,5 |
-0,5 |
8,5 |
di2 |
4 |
36 |
42,25 |
2,25 |
121 |
30,25 |
30,25 |
9 |
1 |
16 |
25 |
56,25 |
9 |
12,25 |
0,25 |
72,25 |
Рис. 3. Таблица для расчета коэффициента ранговой корреляции Спирмена.
Получим:
Так как в обоих сопоставляемых ранговых рядах присутствуют группы одинаковых рангов, то перед подсчетом коэффициента ранговой корреляции необходимо внести поправки на одинаковые ранги TX и TY.
Для вычисления TX и TY воспользуемся формулами (3) и (4).
В ранговом ряду Xi имеем:
a1 = 3, a2 = 2, a3 = 3, a4 = 4, a5 = 2.
По формуле (3) находим:
TX = ((33 – 3) + (23 – 2) + (33 – 3) + (43 – 4) + (23 – 2))/12 = (24 + 6 + 24 + 60 + 6)/12 = 120/12=10.
В ранговом ряду Yi имеем:
b1 = 2, b2= 4, b3 = 3, b4= 2, b5 = 2.
По формуле (4) находим:
TY = ((23 – 2) + (43 – 4) + (33 – 3) + (23 – 2) + (23 – 2))/12 = (6 + 60 + 24 + 6 + 6)/12 = 8,5.
Расчет коэффициента ранговой корреляции Спирмена проведем по формуле (2). Мы имеем:
Таким образом, в данном примере коэффициент ранговой корреляции Спирмена rS = 0,29.
Во всех четырех случаях значимость полученного коэффициента корреляции определяется по количеству ранжированных значений N. В первом случае это количество будет совпадать с объемом выборки N. Во втором случае количеством наблюдений будет количество признаков, составляющих иерархию. В третьем и четвертом случае N – это также количество сопоставляемых признаков, а не количество испытуемых в группах. Подробные пояснения даны в примерах.
Если
абсолютная величина rs достигает критического значения или превышает
его, то корреляция достоверна.
СТАТИСТИЧЕСКИЕ ГИПОТЕЗЫ.
Возможны два варианта статистических гипотез. Первый относится к случаю 1, второй – к трем остальным случаям.
ПЕРВЫЙ ВАРИАНТ СТАТИСТИЧЕСКИХ ГИПОТЕЗ.
Нулевая гипотеза H0:
Корреляция между переменными A и B не отличается от нуля.
Альтернативная
гипотеза H1:
Корреляция между переменными A и B достоверно отличается от нуля.
ВТОРОЙ ВАРИАНТ СТАТИСТИЧЕСКИХ ГИПОТЕЗ.
Нулевая гипотеза H0:
Корреляция между иерархиями A и B не отличается от нуля.
Альтернативная
гипотеза H1:
Корреляция между иерархиями A и B достоверно отличается от нуля.
Последовательность расчета коэффициента ранговой корреляции Спирмена rs.
1. Определить, какие два признака или две иерархии признаков будут участвовать в сопоставлении как переменные A и B.
2. Проранжировать значения переменной A, присваивая ранг 1 наименьшему значению признака, в соответствии с правилами ранжирования. Занести ранги Xi в столбец таблицы по порядку номеров испытуемых или признаков.
3. Проранжировать значения переменной B, в соответствии с теми же правилами. Занести ранги Yi во второй столбец таблицы по порядку номеров испытуемых или признаков.
4. Подсчитать разности di между рангами Xi и Yi по каждой строке таблицы и занести в третий столбец таблицы.
5. Возвести каждую разность di в квадрат: di2 . Эти значения занести в четвертый столбец таблицы.
6. Подсчитать сумму квадратов ∑di2 .
7. При наличии одинаковых рангов рассчитать поправки TX и TY по формулам (3) и (4).
8. Рассчитать коэффициент ранговой корреляции rs:
а) при отсутствии одинаковых рангов по формуле (1);
б) при наличии одинаковых рангов по формуле (2).
9. Определить по статистической таблице (см., напр., Ермолаев О.Ю. Математическая статистика для психологов: с. 325, табл. 21) критические значения коэффициента rs ранговой корреляции Спирмена для данного N.
10. Если |rs| превышает критическое значение rкр для выбранного уровня статистической значимости α (или, по крайней мере, равен ему), то корреляция достоверно отличается от 0.
Нулевая гипотеза H0 (корреляция ρ = 0) не отвергается, если эмпирическое значение |rS| попадает в «зону незначимости»:
|rS| ≤ rкр1 (α = 0, 05).
Нулевая гипотеза Н0 отвергается и принимается альтернативная гипотеза H1 (корреляция ρ значимо отличается от нуля), если эмпирическое значение |rS| попадает в «зону значимости»:
|rS| > rкр2 (α = 0, 01).
ПРИМЕР 1 (продолжение).
По статистической таблице для N = 16 находим критические значения для уровней значимости α = 0, 05 и α = 0, 01.
rкр1 = 0,50 (α = 0, 05); rкр2 = 0,64 (α = 0, 01).
Эмпирическое значение коэффициента корреляции рангов Спирмена удовлетворяет неравенству:
rS =
0,29 < 0,50 = rкр1.
Корреляция между признаками A (уровень соперничества) и B (уровень депрессии) в данной группе испытуемых не отличается от нуля.
ВЫВОД.
Корреляционная связь между признаками A, B отсутствует, принимается гипотеза H0.
ПРИМЕР 2.
Нахождение количественного выражения уровня самооценки по Будасси.
Тест Будасси С.А. на самооценку позволяет провести исследование самооценки личности, измеряемое количественно. В основе данной методики лежит способ ранжирования. Психодиагностика самосознания, самоотношения, самооценки направлена на изучение и оценку представления о себе. «Я-концепция», которая есть сумма «Я-реального» и «Я-идеального», важный фактор формирования, выбора того или иного типа поведения человека. Которое во многом определяет направление его деятельности, поступки, совершаемые во всех сферах жизни, при контактах с людьми. Анализ «Я-образа» позволяет выделить в нем два аспекта: знания о себе и самоотношение. В ходе жизни человек познает себя и накапливает о себе знания, эти знания составляют значительную часть его представлений о себе - его «Я-концепцию». Однако знания о себе самом, естественно, ему небезразличны: то, что в них раскрывается, оказывается объектом его эмоций, оценок, становится причиной его перманентного самоотношения. Не все реально постигаемое в себе самом и не все в самоотношении ясно осознанно. Некоторые аспекты «Я-образа» оказываются ускользающими от сознания, неосознанными, бессознательными. Данный тест позволяет их выявить.
Тест на самооценку личности «Я-реальное», «Я-идеальное» по методике Будасси исследования «Я-концепции» заключается в следующем (Энциклопедия психодиагностики [Электронный ресурс] режим доступа http://psylab.info).
Испытуемому предлагается список из 50 слов (лист первичных качеств), обозначающих свойства личности, и которые теоретически могут быть приписаны личности. Из предложенного списка качеств личности ему необходимо выбрать 20 качеств, в наибольшей степени характеризующих эталонную личность (назовем ее «мой идеал») в представлении испытуемого. Естественно, что в этом ряду могут найти место и негативные качества. Из 20 отобранных свойств личности испытуемому необходимо построить эталонный ряд X в протоколе исследования, где на первых позициях располагаются наиболее важные, с его точки зрения, положительные свойства личности, а последними - наименее желательные, отрицательные (20-й ранг - наиболее привлекательное качество, 19-й - менее и т. д. вплоть до 1 ранга). Необходимо следить, чтобы ни одна оценка-ранг не повторялась дважды. Затем из отобранных испытуемым ранее 20-ти свойств личности, ему предлагают построить субъективный ряд Y, в котором испытуемый должен расположить данные свойства по мере убывания их выраженности у него лично (20-й ранг - качество, присущее испытуемому в наибольшей степени, 19-й - качество, характерное для него несколько меньше, чем первое, и т. д.). Результаты заносят в протокол исследования (рис. 7).
Качества |
«Я–идеальное» Xi |
«Я–реальное» Yi |
di = Xi — Yi |
di2 |
Аккуратность |
14 |
19 |
-5 |
25 |
Беспечность |
1 |
6 |
-5 |
25 |
Вспыльчивость |
3 |
1 |
2 |
4 |
Жизнерадостность |
20 |
12 |
8 |
64 |
Заботливость |
18 |
20 |
-2 |
4 |
Застенчивость |
9 |
16 |
-7 |
49 |
Искренность |
12 |
4 |
8 |
64 |
Капризность |
2 |
8 |
-6 |
36 |
Легковерие |
8 |
17 |
-9 |
81 |
Медлительность |
5 |
13 |
-8 |
64 |
Мнительность |
6 |
18 |
-12 |
144 |
Настойчивость |
7 |
11 |
-4 |
16 |
Нежность |
17 |
9 |
8 |
64 |
Непринужденность |
16 |
5 |
11 |
121 |
Обаяние |
13 |
14 |
-1 |
1 |
Осторожность |
4 |
2 |
2 |
4 |
Отзывчивость |
19 |
15 |
4 |
16 |
Принципиальность |
10 |
7 |
3 |
9 |
Решительность |
11 |
10 |
1 |
1 |
Упорство |
15 |
3 |
12 |
144 |
Рис. 7. Протокол исследования по методике Будасси.
В столбце Xi испытуемый проранжировал 20 качеств по степени желательности (ранг 20 присуждается самому желаемому качеству). Затем в следующем столбце Yi испытуемый проранжировал эти же качества по степени выраженности у него в данный момент (ранг 20 получает самое характéрное качество).
Цель обработки результатов - определение связи между ранговыми оценками качеств личности, входящими в представления «Я-идеальное» и «Я-реальное».
Мера связи устанавливается с помощью коэффициента ранговой корреляции Спирмена. На основе расчета коэффициента ранговой корреляции Спирмена делается вывод об уровне самооценки испытуемого. Требуется рассчитать коэффициент корреляции Спирмена между выраженностью качеств у обследуемого испытуемого в данный момент и его идеальным представлением.
РЕШЕНИЕ.
Составляем расчетную таблицу (рис. 7), в которую заносим две ранговые последовательности (желаемую Xi и реальную Yi), разности рангов di и di2.
Для вычисления коэффициента корреляции рангов Спирмена применяем формулу (1).
Для значения N = 20 по статистической таблице находим критические значения для уровней значимости α = 0, 05 и α = 0, 01.
rкр1 = 0,45 (α = 0, 05); rкр2 = 0,57 (α = 0, 01).
Вычисленное эмпирическое значение коэффициента корреляции рангов Спирмена удовлетворяет неравенству:
rS =
0,3 < 0,45 = rкр1.
Таким образом, значение коэффициента ранговой корреляции попало в «зону незначимости», что не позволяет отвергнуть гипотезу H0. Корреляция не отличается от нуля, что свидетельствует об отсутствии корреляционной связи между выраженностью качеств у испытуемого в данный момент и его идеальным представлением.
ВЫВОД.
Корреляционная связь между ранговыми оценками качеств личности «Я-идеальное» и «Я-реальное» отсутствует, принимается гипотеза H0.
СПИСОК РЕКОМЕНДУЕМОЙ ЛИТЕРАТУРЫ
[1] Гласс Дж., Стенли Дж.
Статистические методы в педагогике и психологии. Пер. С англ. М.: 1976.
[2] Дружинин В. Н.
Экспериментальная психология — СПб: Издательство «Питер», 2000.
— 320 с.: ил. — (Серия «Учебник нового века»).
[3] Ермолаев О. Ю. Математическая статистика для психологов. Учебник. - 2-е изд., испр.
М.: МПСИ: Флинта, 2003. - 336 с. - (Библиотека психолога).
[4] Титкова Л.С. Математические методы в психологии. Учебно-методическое пособие. – Изд-во Дальневосточного университета: Владивосток, 2002. – 142 с.
[5] Харченко М.А. КОРРЕЛЯЦИОННЫЙ АНАЛИЗ. Учебное пособие для вузов. Издательско-полиграфический центр Воронежского гос. ун-та . Воронеж, 2008.