Математические методы в психологии. Корреляционный анализ в психологии. Понятие психологического корреляционного исследования. Виды корреляционных связей. Математическая обработка и интерпретация данных корреляционного исследования. Метод ранговой корреляции Спирмена. Коэффициент ранговой корреляции Кендалла

Решение задач и выполнение научно-исследовательских разработок: Отправьте запрос сейчас: irina@bodrenko.org    
математика, IT, информатика, программирование, статистика, биостатистика, экономика, психология
Пришлите по e-mail: irina@bodrenko.org описание вашего задания, срок выполнения, стоимость





Математические методы в психологии

 

Лекция 3

Тема лекции: «Корреляционный анализ в психологии»

w1.jpg

1.  Понятие психологического корреляционного исследования. Виды корреляционных связей.

2. Математическая обработка и интерпретация данных корреляционного исследования.

3. Метод ранговой корреляции Спирмена.

w2.jpg

1.  ПОНЯТИЕ ПСИХОЛОГИЧЕСКОГО КОРРЕЛЯЦИОННОГО ИССЛЕДОВАНИЯ.     ВИДЫ КОРРЕЛЯЦИОННЫХ СВЯЗЕЙ.

 

1.1.        Понятие психологического корреляционного исследования.

 

КОРРЕЛЯЦИЯ (лат. correlatio - соотношение) - понятие, указывающее на статистическую связь, существующую между изучаемыми явлениями.

 

Наиболее распростра­ненной схемой современного психологического эмпирического исследования является кор­реляционное исследование. Теория корреляционного исследования основана на представлениях о мерах корреляционной связи, ее основы были заложены К. Пирсоном в работах по математической статистике.  

 

Корреляционным называется исследование, проводимое для подтверждения или опровержения гипотезы о статистической связи между несколькими (двумя и более) переменными. В психологии в качестве переменных могут выступать психи­ческие свойства, процессы, состояния и др.

 

Стратегия проведения психологического корреляционного исследования сходна с квазиэкспери­ментом. Отличие от квазиэксперимента лишь в том, что управляемое воздействие на объект отсутствует. План корреляционного исследования несложен. Исследова­тель выдвигает гипотезу о наличии статистической связи между несколькими пси­хическими свойствами индивида или между определенными внешними уровнями и психическими состояниями. При этом предположения о причинной зависимости не обсуждаются.

 

В качестве примера корреляционного психологического исследования рассмотрим следующую исследовательскую задачу.

 

ПРИМЕР.

Предположим, что одного исследователя интересует вопрос: связаны ли между собой креативность (то есть творческая одаренность) и школьная тревожность пяти- и шестиклассников? Изучая литературу, исследователь обнаружил одну группу ученых, которые считают, что творчески мыслящий ребенок должен быть менее тревожным. Другая группа ученых считает, что эти свойства никак не связаны. Наш исследователь пока не примкнул ни к одному лагерю и собирается провести собственное небольшое экспериментальное исследование.

 

1-Й ЭТАП. Сначала исследователь должен решить, как измерять творческую одаренность (креативность) детей  и школьную тревожность.

 

Например, коэффициент интеллекта (IQ) можно измерить тестами, для его оценки используют тест на определение коэффициента интеллекта Стенфорда-Бине и шкалы Векслера. При IQ выше 120 корреляция между творческой и интеллектуальной деятельностью исчезает, поскольку творческое мышление имеет свои отличительные черты и не тождественно интеллекту. В 1960 г. Дж. Гетцельс и П. Джексон  опубликовали данные об отсутствии корреляции между  коэффициентом интеллекта (IQ)  и коэффициентом креативности (Cr).

 

Творческое мышление:

- пластично, то есть творчески мыслящие люди предлагают множество решений в тех случаях, когда обычный человек может найти одно или два;

- подвижно, то есть для творчески мыслящего человека не составляет труда перейти от одного аспекта проблемы к другому, не ограничиваясь одной точкой зрения;

- оригинально, оно порождает необычные, небанальные, непривычные решения.

 

Параметры творческого мышления входят в кубическую модель Дж. Гилфорда — модель дивергентного мышления, которое предполагает поиск решения по всем возможным направлениям, рассмотрение как можно большего числа вариантов, варьирование путей решения проблемы и, как итог — неожиданные оригинальные выводы и результаты.

 

Дж. Гилфорд разработал батарею тестов для диагностики креативности: 10 тестов на вербальную креативность, 4 — на невербальную. П. Торранс продолжил изучение креативности, он разработал серию тестов для определения   коэффициента креативности, адресованных разным людям — от дошкольников до взрослых.  В состав батареи П. Торранса   входит 12 тестов, диагностирующих три сферы творчества: словесное, словесно-изобразительное и словесно-звуковое творческое мышление.  Для диагностики уровня креативности используются разные методики.  Многие исследователи считают, что следует отказаться от жестких лимитов времени, отведенных на выполнение теста. При этой методике диагностики свойство креативности обнаруживает свою полную независимость от интеллекта.

   

Предположим, что наш исследователь выбрал методику Торранса и тест для определения уровня креативности школьников. 

 

Школьная тревожность – это самое широкое понятие, включающее различные аспекты устойчивого школьного эмоционального неблагополучия. Она выражается повышенном беспокойстве в учебных ситуациях, в классе, в волнении и ожидании плохого отношения к себе, отрицательной оценки со стороны учителей, одноклассников. У ребенка пониженная самооценка и он постоянно не уверен в правильности своего поведения.

 

Например, тест уровня школьной тревожности Филлипса позволяет определить общий уровень школьной тревожности, а также изучить характер переживания тревожности, связанной с различными областями школьной жизни. Методика Филлипса предназначена для диагностики уровня и характера тревожности, связанной со школой у детей младшего и среднего школьного возраста.

 

Предположим, что для оценки тревожности наш исследователь выбрал тест уровня школьной тревожности Филлипса.

 

Итак, исследователь выбрал два теста для  определения уровня креативности и уровня тревожности. Соответственно, имеются два признака: первый признак (X) — креативность, второй признак  (Y) — школьная тревожность.

 

Исследованию подлежат 20 000  пяти- и шестиклассников.  Но возможности исследователя ограничены только 200 учащимися.

 

2-Й ЭТАП. Разбираясь в статистике, исследователь планирует взять случайную выборку из 200 учащихся из совокупности объемом 20 000 учащихся так, чтобы можно было сделать статистические выводы относительно всей генеральной совокупности по данным выборочных наблюдений. Каждому из 200 учащихся будут предложены оба теста (для определения уровня креативности и уровня тревожности). Надо вычислить коэффициент корреляции между  результатами этих тестов.

 

1.2.            Виды корреляционных связей.

 

«Корреляция» в прямом переводе означает «соотношение». Если изменение од­ной переменной сопровождается изменением другой, то можно говорить о корреля­ции этих переменных. Наличие корреляции двух переменных ничего не говорит о причинно-следственных зависимостях между ними, но дает возможность выдвинуть такую гипотезу. Отсутствие же корреляции позволяет отвергнуть гипотезу о при­чинно-следственной связи переменных.

 

Различают несколько интерпретаций нали­чия корреляционной связи между двумя измерениями:

 

1.                      Прямая корреляционная связь. Уровень одной переменной непосредственно соответствует уровню другой. Примером является закон Хика: скорость переработ­ки информации пропорциональна логарифму от числа альтернатив. Другой пример: корреляция высокой личностной пластичности и склонности к смене социальных установок.

2.                       Корреляция, обусловленная 3-й переменной. 2 переменные (а, с) связаны одна с другой через 3-ю (в), не измеренную в ходе исследования. По правилу транзитив­ности, если есть R (а, b) и R (b, с), то R (а, с). Примером подобной корреляции явля­ется установленный психологами США факт связи уровня интеллекта с уровнем доходов. Скорость опозна­ния изображения при быстром (тахистоскопическом) предъявлении и словарный запас испытуемых также положительно коррелируют. Скрытой переменной, обу­словливающей эту корреляцию, является общий интеллект.

3.                      Случайная корреляция, не обусловленная никакой переменной.

4.                      Корреляция, обусловленная неоднородностью выборки. Представим себе, что выборка, которую мы будем обследовать, состоит из двух однородных групп. Напри­мер, мы хотим выяснить, связана ли принадлежность к определенному полу с уров­нем экстраверсии. Считаем, что «измерение» пола трудностей не вызывает, экстра­версию же измеряем с помощью опросника Айзенка ETI-1. У нас 2 группы: мужчи­ны-математики и женщины-журналистки. Неудивительно, если мы получим линейную зависимость между полом и уровнем экстраверсии—интроверсии: боль­шинство мужчин будут интровертами, большинство женщин — экстравертами.

 

Корреляционные связи различаются по своему виду (рис. 1, см. [2], гл. 5). Если повышение уровня од­ной переменной сопровождается повышением уровня другой, то речь идет о поло­жительной корреляции. Возрастание громкости звука сопровождается ощущением по­вышения его тона. Если рост уровня одной переменной сопровождается снижением уровня другой, то мы имеем дело с отрицательной корреляцией. Чем боязливей особь, тем меньше у нее шансов занять доминирующее положение в группе. Нулевой называется корреляция при отсутствии связи переменных.

 

w3.jpg

 

w4.jpg

 

w5.jpg

 

w6.jpg

 

w7.jpg

 

w8.jpg

 

w9.jpg

 

w10.jpg

Рисунок 1. Примеры распределений испытуемых в пространстве двух признаков.

Математическую теорию линейных корреляций разработал К. Пирсон. В психологии практически нет примеров строго линейных связей (положитель­ных или отрицательных). Большинство связей — нелинейные. Классический при­мер нелинейной зависимости — закон Йеркса—Додсона: возрастание мотивации первоначально повышает эффективность научения, а затем наступает снижение продуктивности (эффект «перемотивации»). Другим примером является связь меж­ду уровнем мотивации достижений и выбором задач различной трудности. Лица, мо­тивированные надеждой на успех, предпочитают задания среднего диапазона труд­ности — частота выборов на шкале трудности описывается колоколообразной кривой.

 

1.3.            Планирование корреляционного исследования.

 

План корреляционного исследования является разновидностью ква­зиэкспериментального плана при отсутствии воздействия независимой переменной на зависимые. В более строгом смысле: тестируемые группы должны быть в эквива­лентных неизменных условиях. При корреляционном исследовании все измеряемые переменные — зависимые. Фактором, определяющим эту зависимость, может быть одна из переменных или скрытая, неизмеряемая переменная. Корреляционное исследование разбивается на серию независимых друг от друга измерений в группе испытуемых Р.

Различают простое и сравнительное корреляци­онные исследования.

В первом случае группа испытуемых однородна.  Во втором случае мы имеем несколько рандомизированных групп, различающихся по одному или нескольким определенным критериям.  Результатом этого исследования является матрица корреляций. Обработку данных можно вести, срав­нивая строки полученной матрицы корреляций или столбцы. Коррелируя между собой строки, мы сопоставляем друг с другом испытуемых; корреляции же интерпретируются как ко­эффициенты сходства—различия людей между собой.  Коррелируя между собой столбцы, мы проверяем гипотезу о статистической свя­зи измеряемых переменных. В этом случае их размерность не имеет никакого значе­ния.

Такое исследование называется структурным, так как в итоге мы получаем мат­рицу корреляции измеренных переменных, которая выявляет структуру связей меж­ду ними.

Разумеется, Р-корреляции можно вычислять лишь в том случае, если данные приведены к одной шкальной раз­мерности, в частности, с помощью Z-преобразования данных.

В исследовательской практике часто возникает задача выявить временны’е кор­реляции параметров или же обнаружить изменение структуры корреляций парамет­ров во времени. Примером таких исследований являются лонгитюды.

План лонгитюдного исследования представляет собой серию отдельных замеров одной или нескольких переменных через определенные промежутки времени. Лонгитюдное исследование — это промежуточный вариант между квазиэкспериментом и корреляционным исследованием, так как время интерпретируется исследовате­лем как независимая переменная, определяющая уровень зависимых (например, личностных черт).

 

РАССМОТРИМ ОСНОВНЫЕ ТИПЫ КОРРЕЛЯЦИОННОГО ИССЛЕДОВАНИЯ.

 

1. Сравнение двух групп. Этот план лишь условно можно отнести к корреляци­онным исследованиям. Он применяется для установления сходства или различия двух естественных или рандомизированных групп по выраженности того или иного психологического свойства или состояния. Допустим, у вас есть желание выяснить, отличаются ли мужчины и женщины по уровню экстраверсии. Для этого вы должны создать две репрезентативные выборки, уравненные по прочим значимым для экст­раверсии—интроверсии параметрам (по параметрам, влияющим на уровень экстра­версии—интроверсии), и провести измерение с помощью теста EPQ. Средние ре­зультаты у 2 групп сравниваются с помощью t-критерия Стьюдента. При необходи­мости сравниваются дисперсии показателя экстраверсии по F-критерию Фишера.

Если исследователь задался целью сравнить две учебные группы по уровню ус­певаемости, он должен позаботиться о том, чтобы не произошло их «перемешива­ния» в ходе исследования.

2. Одномерное исследование одной группы, в разных условиях. План этого ис­следования аналогичен предыдущему. Но по своей сути он близок к эксперименту, так как условия, в которых находится группа, различаются. В случае корреляцион­ного исследования мы не управляем уровнем независимой переменной, а лишь кон­статируем изменение поведения индивида в новых условиях. Примером может слу­жить изменение уровня тревожности детей при переходе из детского сада в 1-й класс школы: группа одна и та же, а условия различные. Главные артефакты этого плана — кумуляция эффектов последовательности и тестирования. Кроме того, искажающее влияние на результаты может оказывать временной фактор (эффект естественного развития).

3. Корреляционное исследование попарно эквивалентных групп. Этот план ис­пользуется при исследовании близнецов методом внутрипарных корреляций. Существует множество более слож­ных вариантов планов психогенетических исследований близнецов.

4. Многомерное корреляционное исследова­ние проводится для проверки гипотезы о статистической связи нескольких переменных, ха­рактеризующих поведение. Оно реализуется по следующей программе. Отбирается группа, которая пред­ставляет собой либо генеральную совокупность, либо интересующую нас популя­цию. Отбираются тесты, проверенные на надежность и внутреннюю валидность. Затем группа тестируется по определенной программе. Данные исследования представлены в форме матрицы размера «m x n»  m количе­ство испытуемых, n число тестов. Матрица «сырых» данных обрабатывается, подсчиты­ваются коэффициенты линейной корреляции. Затем корреляции оцениваются на статистические различия.

 

В некоторых случаях возникает необходимость вычисле­ния множественных корреляций, частных корреляций, корреляционных отношений или редукции размерности — уменьшения числа параметров. Для уменьшения числа измеренных параметров используются различные мето­ды латентного анализа.

 

Главной причиной артефактов, возникающих при прове­дении многомерного психологического тестирования, является реальное физиче­ское время. При анализе данных корреляционного исследования мы отвлекаемся от неодновременности проводимых измерений. Кроме того, считается, что результат последующего измерения не зависит от предыдущего, т. е. не существует эффекта переноса.

Перечислим основные артефакты, которые возникают в ходе применения этого плана:

1. Эффект последовательности — предшествующее выполнение одного теста мо­жет повлиять на результат выполнения другого (симметричный или асимметрич­ный перенос).

2. Эффект научения — при выполнении серии различных тестовых испытаний у участника эксперимента может повышаться компетентность в тестировании.

3. Эффекты фоновых воздействий и «естественного» развития приводят к неконт­ролируемой динамике состояния испытуемого в ходе исследования.

4. Взаимодействие процедуры тестирования и состава группы проявляется при ис­следовании неоднородной группы: интроверты хуже сдают экзамены, чем экст­раверты, «тревожные» хуже справляются со скоростными тестами интеллекта. Для контроля эффектов последовательности и переноса следует пользоваться тем же приемом, что и при планировании экспериментов, а именно — контрбалан­сировкой. Только вместо воздействий меняется порядок проведения тестов.

 

ПРИМЕР.

Психологу необходимо было выявить, как влияет вид задания на успешность выполнения сменяющих одна другую задач. Психолог предположил, что для испытуемых не безразлично, в какой последовательности им даются тесты. Были выбраны задания на креативность (из теста Торренса) и на общий интеллект (из теста Айзенка). Задачи давались испытуемым в случайном порядке. Оказалось, что если задание на креативность выполняется первым, то скорость и точность реше­ния задачи на интеллект снижается. Обратного эффекта не наблюдалось.  Полученное явление иллюстрирует классический эффект асимметричного переноса.

 

5. Структурное корреляционное исследование. От предшествующих вариан­тов эта схема отличается тем, что исследователь выявляет не отсутствие или нали­чие значимых корреляций, а различие в уровне значимых корреляционных зависи­мостей между одними и теми же показателями, измеренными у представителей раз­личных групп.

Рассмотрим простейший пример структурного корреляционного исследования.

 

ПРИМЕР.

Допустим, психологу необходимо проверить гипотезу о том, влияет ли пол родителя и пол ребенка на сходство или различие их личност­ных черт, например уровня нейротизма по Айзенку. Для этого проводится психологическое  исследование реальных групп — семей. Затем вычисляются коэффициенты корре­ляции уровней тревожности родителей и детей. Получаются 4 основных коэффици­ента корреляции: 1) мать—дочь; 2) мать—сын; 3) отец—дочь; 4) отец—сын, и два дополнительных: 5) сын—дочь; 6) мать—отец.  Корреляции подвергаются Z-преобразованию и сравниваются по t-критерию Стьюдента.

 

6. Лонгитюдное корреляционное исследование. Лонгитюдное исследование — вариант квазиэкспериментальных исследовательских планов. Воздействующей пе­ременной психолог, проводящий лонгитюдное исследование, считает время. Оно яв­ляется аналогом плана тестирования одной группы в разных условиях. Только усло­вия считаются константными. Результатом любого временного исследования (в том числе и лонгитюдного) является построение временного тренда измеряемых пере­менных, которые могут быть аналитически описаны теми или иными функциональ­ными зависимостями.

Лонгитюдное корреляционное исследование строится по плану временных се­рий с тестированием группы через заданные промежутки времени. Помимо эффектов обучения, последовательности и т.д. в лонгитюдном исследовании следует учи­тывать эффект выбывания: не всех испытуемых, первоначально принимавших учас­тие в эксперименте, удается обследовать через какое-то определенное время. Воз­можно взаимодействие эффектов выбывания и тестирования (отказ от участия в последующем обследовании) и т.д.

Структурное лонгитюдное исследование отличается от простого лонгитюда тем, что нас интересует не столько изменение центральной тенденции или разброса ка­кой-либо переменной, сколько изменение связей между переменными. Такого рода исследования широко распространены в психогенетике.

 

2.       МАТЕМАТИЧЕСКАЯ ОБРАБОТКА И ИНТЕРПРЕТАЦИЯ ДАННЫХ КОРРЕЛЯЦИОННОГО ИССЛЕДОВАНИЯ.

 

Дан­ные структурного корреляционного исследования представляют собой одну или не­сколько матриц. Первичная обработка заключается в под­счете коэффициентов статистической связи между двумя и более переменными. Выбор меры связи определяется шкалой, с помощью которой произведены изме­рения.

 

1.Стохастическая связь между качественными переменными номинативной шкалы называется сопряженностью. При исследовании степени тесноты связи между качественными номинативными (но не дихотомическими) признаками используются коэффициенты сопряженности Пирсона.    

 

2. Если измерения произведены по дихотомической шкале, то для подсчета тес­ноты связи признаков применяется «коэффициент ассоциации» - коэффициент контингенции Пирсона (φ-коэффициент).

 

Коэффициент контингенции Пирсона (φ-коэффициент).

Дихотомическая корреляция используется при исследовании степени тесноты между переменными X и Y, каждый из которых представлен в виде двух альтернатив («1» – «0»). Расчетная таблица φ-коэффициента Пирсона (тетрахорическая таблица) состоит из четырех ячеек (рис. 2):

ПЕРЕМЕННЫЕ

X

«1»

«0»

Y

«1»

a

b

«0»

c

d

 

w11.jpg

 

Рис. 2. Тетрахорическая таблица.

 

Частоты a, b, c, d называются тетрахорическими показателями, их сумма равна объему выборки: N = a + b + c + d.

Каждая из клеток тетрахорической таблицы соответствует частоте выбора определенной альтернативы того и другого признака.  Например, частота b определяет количество случаев, в которых зарегистрировано «0» по переменной X и «1» по переменной Y.

 

φ-коэффициент Пирсона определяется по формуле

 

 

w12.jpg

Проверка гипотезы о значимости связи между исследуемыми переменными осуществляется с помощью критерия χ2 .

Для этого эмпирическое значение

 

χ2 = φ 2 · N,  где N – объем выборки,  

 

сравнивается с критическим χα 2 (1) для числа степеней свободы df = 1:

 

χα 2 = 3,841 (для α = 0,05); χα2 = 6,635  (для α = 0,01).

w13.jpg

Если выполняется условие χ2 ≤ χ2 (для α = 0,05)  (1), то нулевая гипотеза H0: φ = 0, не отвергается.

 

При χ2 > χ 2 (для α = 0,01)  нулевая гипотеза H0:  φ = 0, отвергается, и связь считается значимой.

ПРИМЕР.

 

Изучается общественное мнение по очень важному поводу. Распределение ответов респондентов, мужчин и женщин, приведено в таблице (рис. 3). Требуется определить наличие связи между полом и определенным мнением.

 

Переменные

X - «Мнение»

«положительное»

«отрицательное»

Y – «Пол»

мужчины

59

41

женщины

36

64

 

w14.jpg

Рис. 3. Тетрахорическая таблица.

РЕШЕНИЕ.

 

При корреляционном анализе дихотомических переменных используем коэффициент контингенции Пирсона (φ-коэффициент).

 

Нулевой гипотезой H0 является предположение об отсутствии связи между рассматриваемыми переменными.  Для ее проверки определяем значение φ-коэффициента Пирсона и критическое значение «хи-квадрат»:

φ =   – 0, 23

 

N = 200

 

χ 2э = (-0,23) 2 · 200 = 10,580 > 6,635.

Вследствие того, что эмпирическое значение попало в критическую область: χ2э > χ2 (для α = 0,01) , нулевая гипотеза φ = 0 отвергается, связь между полом и определенным мнением можно считать значимой (α < 0,01).

 

w15.jpg

 

3. Данные представлены в порядковой шкале. Мерой связи, которая соответству­ет шкале порядка, является коэффициент ранговой корреляции Кендалла. Коэффициент корреляции «тау» Кендалла имеет те же свойства, что и коэффициент Спирмена (изменяется от –1 до +1, для независимых случайных величин равен нулю), однако он считается более информативным. Он основан на подсчете несов­падений в порядке следования ранжировок Х и Y.  (Например, есть ряд испытуемых: сначала мы выстраиваем этот ряд в порядке убывания массы тела, а затем — в порядке убыва­ния роста). Для каждой пары подсчитывается число совпадений и инверсий: совпа­дение, если их порядок по Х и Y одинаков; инверсия, если порядок различен. Разни­ца числа «совпадений» и числа «инверсий», деленная на N(N–1)/2, (N – число ранжируемых признаков, черт) дает коэффи­циент «тау». Число совпадений обозначим через P, число инверсий – через Q. Эмпирическое значение коэффициента ранговой корреляции «тау» вычисляется по формуле:

 

 

w16.jpg

 

 Часто для обработки данных, полученных с помощью шкалы порядка, использу­ют коэффициент rS ранговой корреляции Спирмена, его рекомендуют применять в том случае, если одно измерение произведено по шкале порядков, а другое — по шкале интер­валов.

 

4. Данные получены по шкале интервалов, или отношений. В этом случае приме­няется стандартный коэффициент линейной корреляции Пирсона или коэффициент ранговой корреляции Спирмена.

 

Коэффициент линейной корреляции Пирсона используется для оценки тесноты (силы) связи между двумя переменными в случаях, если: 1) рассматриваемая связь линейная; 2) обе переменные измерены в сильных шкалах (шкале отношений или интервальной шкале).

 

5. Бисериальная  корреляция является методом корреляционного анализа между двумя переменными, одна из которых измерена в дихотомической шкале. Подобные задачи часто встречаются в психодиагностике.

 

В том случае, если одна переменная является дихотомиче­ской, а другая — интервальной, то используется так называемый точечный бисериальный коэф­фициент корреляции Пирсона.  

 

Если первая переменная измерена в дихотомической шкале, вторая переменная измерена в порядковой шкале, то решение задач данного класса осуществляется с помощью рангово-бисериального коэффициента корреляции.

6. Если исследователь полагает, что связи между переменными нелиней­ны, он вычисляет корреляционное отношение, характеризующее величину нелиней­ной статистической зависимости двух переменных.

 

7. Коэффициент конкордации (согласованности) Кендалла используется в случае, когда

совокупность объектов характеризуется несколькими последовательностями рангов, исследователю необходимо установить статистическую связь между этими последовательностями. Такие задачи возникают, например, при анализе экспертных оценок: несколько экспертов ранжируют одних  и тех же испытуемых по определенному качеству, а психологу для проведения углубленного анализа ситуации и принятия обоснованного решения требуется определить степень согласованности мнений группы экспертов.

 

Значения коэффициента конкордации W, в отличие от коэффициента корреляции, заключены в интервале 0 ≤ W ≤ 1 . Коэффициент конкордации равен единице при полном совпадении всех ранговых последовательностей. Если мнения экспертов (ранговые последовательности) полностью противоположны, коэффициент конкордации равен нулю (коэффициент корреляции в этом случае будет равен –1).

 

Корреляционное исследование завершается выводом о статистической значимо­сти установленных (или неустановленных) зависимостей между переменными. Од­нако исследователи не ограничиваются такой констатацией. Одна из главных задач, которые возникают перед психологами, — выяснить, не обусловлены ли связи меж­ду отдельными параметрами (психологическими свойствами) скрытыми факторами? Для этой цели применяется аппарат редукции числа переменных: методы многомер­ного анализа данных, которые изучаются психологами в курсе «Математические методы в психологии».

 

3. МЕТОД РАНГОВОЙ КОРРЕЛЯЦИИ СПИРМЕНА.

 

В психологии часто возникает потребность анализа связи между переменными, которые не могут быть измерены в интервальной шкале или в шкале отношений, но тем не менее поддаются упорядочению и могут быть проранжированы по степени убывания или возрастания признака.

Для определения тесноты связи между признаками, измеренными в порядковых шкалах, применяются методы ранговой корреляции.

К ним относятся коэффициенты ранговой корреляции Спирмена и Кендалла (используются для определения тесноты связи между двумя переменными) и коэффициент конкордации (устанавливает статистическую связь между несколькими признаками).

 

Использование коэффициента линейной корреляции Пирсона в случае, когда о законе распределения и о типе измерительной шкалы отсутствует сколько-нибудь надежная информация, может привести к существенным ошибкам.

 

Методы ранговой корреляции могут быть использованы для определения тесноты связи не только между количественными переменными, но и между качественными признаками при условии, что их значения можно упорядочить и проранжировать. Эти методы также могут быть использованы  применительно к признакам, измеренным в интервальных шкалах и  реляционных шкалах, однако их эффективность в этом случае всегда будет ниже.

 

Метод ранговой корреляции Спирмена, является непараметрическим методом, он является универсальным и работает с данными,  измеренными в любых шкалах, и прост в применении. Уникальность метода ранговой корреляции состоит в том, что он позволяет сопоставлять не индивидуальные показатели, а индивидуальные иерархии, или профили, что недоступно ни одному из других статистических методов, включая метод линейной корреляции. Коэффициент ранговой корреляции рекомендуется применять в тех случаях, когда нам необходимо проверить, согласованно ли изменяются разные признаки у одного и того же испытуемого и насколько совпадают индивидуальные ранговые показатели у двух отдельных испытуемых или у испытуемого и группы.

 

Метод ранговой корреляции Спирмена позволяет определить тесноту (силу) и направление корреляционной связи между двумя признаками или двумя профилями (иерархиями) признаков.

Для подсчета коэффициента ранговой корреляции Спирмена необходимо иметь два ряда значений, которые могут быть проранжированы.

 

Такими рядами значений могут быть:

1) два признака A, B, измеренные в одной и той же группе испытуемых;

2) две индивидуальные иерархии признаков A, B, выявленные у двух испытуемых по одному и тому же набору признаков;

3) две групповые иерархии признаков A,B;

4) индивидуальная A и групповая B иерархии признаков.

Вначале показатели ранжируются отдельно по каждому из признаков A, B. Каждая из двух совокупностей располагается в виде вариационного ряда с присвоением каждому члену ряда соответствующего порядкового номера (ранга), выраженного положительным числом. Одинаковым значениям ряда присваивают среднее ранговое число. Сравниваемые признаки можно ранжировать в любом направлении как в сторону ухудшения качества (ранг 1 получает самый большой, быстрый, умный и т. д. испытуемый), так и наоборот.  Главное, чтобы обе переменные были проранжированы одинаковым способом. Как правило, меньшему значению признака начисляется меньший ранг.

 

ПРИМЕР 1.

 

У группы 16 студентов-психологов были измерены уровень соперничества по тесту К. Томаса (признак A)  и уровень самооценки депрессии по методике У. Цунга (признак B). Полученные результаты занесены в таблицу (рис. 4):

 

1.

2.

3.

4.

5.

6.

7.

8.

9.

10.

11.

12.

13.

14.

15.

16.

A

7

7

3

2

3

5

2

5

2

4

4

8

5

4

5

11

B

39

35

36

29

39

30

35

37

25

36

28

35

37

29

36

35

 

w17.jpg

Рис. 4. Таблица значений признаков A, B группы испытуемых.

 

Требуется проранжировать индивидуальные значения испытуемых по обоим признакам A, B.

 

РЕШЕНИЕ.

1.      Проранжируем показатели для признака A.

Наименьшее значение 2 признака A встречается у 3-х испытуемых, каждому из них приписываем средний ранг: (1+2+3)/3 = 2.

Значение 3 встречается у 2-х испытуемых, каждому из них приписываем средний ранг:

(4+5)/2= 4,5.

Значение 4 встречается у 3-х испытуемых, каждому из них приписываем средний ранг:

(6+7+8)/3 = 7.

Значение  5 встречается у 4-х испытуемых, каждому из них приписываем средний ранг:

(9+10+11+12)/4 = 10,5.

Значение 7 встречается у 2-х испытуемых, каждому из них приписываем средний ранг:

(13+14)/2 = 13,5.

Значение 8 встречается у 1-го испытуемого, приписываем ему ранг 15.

Значение 11 встречается у 1-го испытуемого, приписываем ему ранг 16.

Получим проранжированный ряд значений Xi признака A.

 

w18.jpg

 

2. Проранжируем показатели для признака B.

Наименьшее значение 25 признака B встречается у 1-го испытуемого, приписываем ему ранг 1.

Значение 28 встречается у 1-го испытуемого, приписываем ему ранг 2.

Значение 29 встречается у 2-х испытуемых, каждому из них приписываем средний ранг:

(3+4)/2=3,5.

Значение 30 встречается у 1-го испытуемого, приписываем ему ранг 5.

Значение 35 встречается у 4-х испытуемых, приписываем каждому из них средний ранг:

(6+7+8+9)/4=7,5.

Значение 36 встречается у 3-х испытуемых, приписываем каждому из них средний ранг:

(10+11+12)/3=11.

Значение 37 встречается у 2-х испытуемых, приписываем каждому из них средний ранг:

(13+14)/2=13,5.

Значение 39 встречается у 2-х испытуемых, приписываем каждому из них средний ранг:

(15+16)/2=15,5.

 

Получим проранжированный ряд значений Yi признака B.

 

w19.jpg

 

Ранговые оценки признаков A, B занесем в следующую таблицу (рис. 5).

 

i

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

Xi

13,5

13,5

4,5

2

4,5

10,5

2

10,5

2

7

7

15

10,5

7

10,5

16

Yi

15,5

7,5

11

3,5

15,5

5

7,5

13,5

1

11

2

7,5

13,5

3,5

11

7,5

 

w20.jpg

Рис. 5. Таблица ранговых оценок признаков A, B  группы испытуемых.

 

Для проверки правильности проведенного нами ранжирования для признаков A и B необходимо, соответственно, применить формулы:

 

 

В данном примере N = 16,  получим N(N+1)/2 = 136.

Для ряда рангов Xi имеем:

 

13,5 +13,5+4,5+2+4,5+10,5+2+10,5+2+7+7+15+10,5+7+10,5+16 = 136.

 

Для ряда рангов Yi имеем:

 

15,5+7,5+11+3,5+15,5+5+7,5+13,5+1+11+2+7,5+13,5+3,5+11+7,5 = 136.

 

1. В первом случае (два признака) ранжируются индивидуальные значения по первому признаку, полученные разными испытуемыми, а затем индивидуальные значения по второму признаку. Если два признака связаны положительно, то испытуемые, имеющие низкие ранги по одному из них, будут иметь низкие ранги и по другому, а испытуемые, имеющие высокие ранги по одному из признаков, будут иметь по другому признаку также высокие ранги.

 

2.  Во втором случае (два индивидуальных профиля), ранжируются индивидуальные  значения, полученные каждым из 2-х испытуемым по определенному (одинаковому для них обоих) набору признаков. Первый ранг получит признак с самым низким значением; второй ранг – признак с более высоким значением и т.д. Очевидно, что все признаки должны быть измерены в одних и тех же единицах, иначе ранжирование невозможно. Например, невозможно проранжировать показатели по личностному опроснику Кеттелла (16PF), если они выражены в "сырых" баллах, поскольку по разным факторам диапазоны значений различны: от 0 до 13, от 0 до 20 и от 0 до 26. Мы не можем сказать, какой из факторов будет занимать первое место по выраженности, пока не приведем все значения к единой шкале (чаще всего это шкала стенов). Если индивидуальные иерархии двух испытуемых связаны положительно, то признаки, имеющие низкие ранги у одного из них, будут иметь низкие ранги и у другого, и наоборот. Например, если у одного испытуемого фактор E (доминантность) имеет самый низкий ранг, то и у другого испытуемого он должен иметь низкий ранг, если у одного испытуемого фактор C (эмоциональная устойчивость) имеет высший ранг, то и другой испытуемый должен иметь по этому фактору высокий ранг и т.д.

 

3. В третьем случае (два групповых профиля), ранжируются среднегрупповые значения, полученные в 2-х группах испытуемых по определенному, одинаковому для двух групп, набору признаков. В дальнейшем линия рассуждений такая же, как и в предыдущих двух случаях.

4. В четвертом случае (индивидуальный и групповой профили), ранжируются отдельно индивидуальные значения испытуемого и среднегрупповые значения по тому же набору признаков, которые получены, как правило, при исключении этого отдельного испытуемого.  Он не участвует в среднегрупповом профиле, с которым будет сопоставляться его индивидуальный профиль. Ранговая корреляция позволит проверить, насколько согласованы индивидуальный и групповой профили.

 

 

Вычисление коэффициента ранговой корреляции Спирмена.

 

Коэффициент ранговой корреляции Спирмена находится по формуле

 

 

где di – разность рангов для каждой i–пары из N наблюдений.

 

w21.jpg

 

Коэффициент rS  ранговой корреляции Спирмена  изменяется от –1 до +1.  Для подсчета коэффициента ранговой корреляции Спирмена rs необходимо определить разности di = xi - yi между рангами, полученными по обоим признакам.  Затем эти значения  di подставляем в формулу (1).  Чем меньше разности между рангами, тем больше будет rs, тем ближе он будет к (+1). Если корреляция отсутствует, то все ранги будут перемешаны и между ними не будет никакого соответствия. Формула (1) составлена так, что в этом случае rs окажется близким к 0. В случае отрицательной корреляции низким рангам испытуемых по одному признаку будут соответствовать высокие ранги по другому признаку, и наоборот. Чем больше несовпадение между рангами испытуемых по двум переменным, тем ближе rs к (– 1).

Если в вариационных рядах для Xi и Yi встречаются члены ряда с одинаковыми ранговыми числами, то в формулу для коэффициента корреляции Спирмена необходимо внести поправки TX и TY на одинаковые ранги:

 

 

w22.jpg

 

Где TX  и  TY  вычисляются по формулам:

 

 

w23.jpg

 

В формуле (3) m – количество групп в ранговом ряду X с одинаковыми ранговыми числами; Соответственно, a1, a2, …, am  (aj > 1) – это объемы  каждой группы с одинаковыми рангами  в первом ранговом ряду X.

 

В формуле (4) p – количество групп в ранговом ряду Y с одинаковыми ранговыми числами. Соответственно,  b1, b2, …, bp (bk > 1) – это объемы  каждой группы  с одинаковыми рангами во втором ранговом ряду Y.

 

ПРИМЕР 1 (продолжение).

 

Вычислим коэффициент rS для примера 1.

 

Вычислим разности di=Xi-Yi ранговых оценок признаков A (уровень соперничества) и B (самооценка уровня депрессии) для примера 1 (рис. 5). Полученные значения di и di2 занесем в следующую таблицу (рис. 6).    

 

i

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

xi

13,5

13,5

4,5

2

4,5

10,5

2

10,5

2

7

7

15

10,5

7

10,5

16

yi

15,5

7,5

11

3,5

15,5

5

7,5

13,5

1

11

2

7,5

13,5

3,5

11

7,5

di 

-2

6

6,5

-1,5

-11

5,5

-5,5

-3

1

-4

5

7,5

-3

3,5

-0,5

8,5

di2

4

36

42,25

2,25

121

30,25

30,25

9

1

16

25

56,25

9

12,25

0,25

72,25

 

w24.jpg

Рис. 3. Таблица для расчета коэффициента ранговой корреляции Спирмена.

Получим:

 

Так как в обоих сопоставляемых ранговых рядах присутствуют группы одинаковых рангов, то перед подсчетом коэффициента ранговой корреляции необходимо внести поправки на одинаковые ранги TX  и TY.

 

Для вычисления TX и TY воспользуемся формулами (3) и (4).

 

В ранговом ряду Xi имеем:

a1 = 3,   a2 = 2, a3 = 3, a4 = 4, a5 = 2.

По формуле (3) находим:

 

TX = ((33 – 3) + (23 – 2) + (33 – 3) + (43 – 4) + (23 – 2))/12 = (24 + 6 + 24 + 60 + 6)/12 = 120/12=10.

 

В ранговом ряду Yi имеем:

b1 = 2, b2= 4, b3 = 3, b4= 2, b5 = 2.

По формуле (4) находим:

 

TY = ((23 – 2) + (43 – 4) + (33 – 3) + (23 – 2) + (23 – 2))/12 = (6 + 60 + 24 + 6 + 6)/12 = 8,5.

 

Расчет коэффициента ранговой корреляции Спирмена проведем по формуле (2). Мы имеем:

 

 

Таким образом, в данном примере коэффициент ранговой корреляции Спирмена rS = 0,29.

 

w25.jpg

 

Во всех четырех случаях значимость полученного коэффициента корреляции определяется по количеству ранжированных значений N. В первом случае это количество будет совпадать с объемом выборки N. Во втором случае количеством наблюдений будет количество признаков, составляющих иерархию. В третьем и четвертом случае N – это также количество сопоставляемых признаков, а не количество испытуемых в группах. Подробные пояснения даны в примерах.

 

Если абсолютная величина rs достигает критического значения или превышает его, то корреляция достоверна.

 

СТАТИСТИЧЕСКИЕ ГИПОТЕЗЫ.

Возможны два варианта статистических гипотез. Первый относится к случаю 1, второй – к трем остальным случаям.

ПЕРВЫЙ ВАРИАНТ СТАТИСТИЧЕСКИХ ГИПОТЕЗ.

Нулевая гипотеза H0:

 

Корреляция между переменными A и B не отличается от нуля.

Альтернативная гипотеза H1:

 

Корреляция между переменными A и B достоверно отличается от нуля.

w26.jpg

 

ВТОРОЙ ВАРИАНТ СТАТИСТИЧЕСКИХ ГИПОТЕЗ.

Нулевая гипотеза H0:

 

Корреляция между иерархиями A и B не отличается от нуля.

Альтернативная гипотеза H1:

 

Корреляция между иерархиями A и B достоверно отличается от нуля.

w27.jpg

 

Последовательность расчета  коэффициента ранговой корреляции Спирмена rs.

1. Определить, какие два признака или две иерархии признаков будут участвовать в сопоставлении как переменные A и B.

2. Проранжировать значения переменной A, присваивая ранг 1 наименьшему значению признака, в соответствии с правилами ранжирования. Занести ранги Xi в столбец таблицы по порядку номеров испытуемых или признаков.

3. Проранжировать значения переменной B, в соответствии с теми же правилами. Занести ранги Yi во второй столбец таблицы по порядку номеров испытуемых или признаков.

4. Подсчитать разности di между рангами Xi и Yi по каждой строке таблицы и занести в третий столбец  таблицы.

5. Возвести каждую разность di в квадрат: di2 . Эти значения занести в четвертый столбец таблицы.

6. Подсчитать сумму квадратов di2 .

7. При наличии одинаковых рангов рассчитать поправки TX и TY по формулам (3) и (4).

8. Рассчитать коэффициент ранговой корреляции rs:

а) при отсутствии одинаковых рангов по формуле (1);

б) при наличии одинаковых рангов по формуле (2).

 

9. Определить по статистической таблице (см., напр., Ермолаев О.Ю. Математическая статистика для психологов: с. 325, табл. 21)  критические значения коэффициента rs ранговой корреляции Спирмена для данного N.  

 

10. Если |rs| превышает критическое значение rкр для выбранного уровня статистической значимости α (или, по крайней мере, равен ему), то корреляция достоверно отличается от 0.

 

w28.jpg

 

Нулевая гипотеза H0 (корреляция ρ  = 0) не отвергается, если эмпирическое значение |rS| попадает в «зону незначимости»:

|rS| rкр1 (α = 0, 05).

 

w29.jpg

 

Нулевая гипотеза Н0 отвергается и принимается альтернативная гипотеза H1 (корреляция  ρ значимо отличается от нуля),  если эмпирическое значение |rS| попадает в «зону значимости»:

 

|rS| > rкр2 (α = 0, 01).

ПРИМЕР 1 (продолжение).

По статистической таблице для N = 16 находим критические значения для уровней значимости α = 0, 05 и α = 0, 01.

rкр1 = 0,50 (α = 0, 05); rкр2  = 0,64 (α = 0, 01).

 

Эмпирическое значение коэффициента корреляции рангов Спирмена удовлетворяет неравенству:

rS = 0,29 < 0,50 = rкр1.

 

Корреляция между признаками A (уровень соперничества) и B (уровень депрессии) в данной группе испытуемых не отличается от нуля.

 

w30.jpg

 

ВЫВОД.

Корреляционная связь между признаками A, B отсутствует, принимается гипотеза H0.

 

w31.jpg

 

ПРИМЕР 2.

Нахождение количественного выражения уровня самооценки по Будасси. 

Тест Будасси С.А. на самооценку позволяет провести исследование самооценки личности, измеряемое количественно. В основе данной методики лежит способ ранжирования. Психодиагностика самосознания, самоотношения, самооценки направлена  на  изучение и оценку представления о  себе.  «Я-концепция», которая есть сумма «Я-реального» и «Я-идеального», важный фактор формирования, выбора того или иного типа поведения человека.  Которое во многом определяет  направление его деятельности, поступки, совершаемые во всех сферах жизни, при контактах с людьми. Анализ «Я-образа» позволяет выделить в нем два аспекта: знания о себе и самоотношение. В ходе жизни человек познает себя и накапливает о себе знания, эти знания составляют значительную часть его представлений о себе - его «Я-концепцию». Однако знания о себе самом, естественно, ему небезразличны: то, что в них раскрывается, оказывается объектом его эмоций, оценок, становится причиной его перманентного самоотношения. Не все реально постигаемое в себе самом и не все в самоотношении ясно осознанно. Некоторые аспекты «Я-образа» оказываются  ускользающими  от сознания, неосознанными, бессознательными. Данный тест позволяет их выявить.

 

Тест на самооценку личности «Я-реальное», «Я-идеальное» по методике Будасси исследования «Я-концепции» заключается в следующем (Энциклопедия психодиагностики [Электронный ресурс] режим доступа http://psylab.info).

Испытуемому предлагается список из 50 слов (лист первичных качеств), обозначающих свойства личности, и которые теоретически могут быть приписаны личности. Из предложенного списка качеств личности ему необходимо выбрать 20 качеств, в наибольшей степени характеризующих эталонную личность (назовем ее «мой идеал») в представлении испытуемого.  Естественно, что в этом ряду могут найти место и негативные качества.  Из 20 отобранных свойств личности испытуемому необходимо построить эталонный ряд X  в протоколе исследования, где на первых позициях располагаются наиболее важные, с его  точки зрения, положительные свойства личности, а последними - наименее желательные, отрицательные (20-й ранг - наиболее привлекательное качество, 19-й - менее и т. д. вплоть до 1 ранга).  Необходимо следить, чтобы ни одна оценка-ранг не повторялась дважды. Затем из отобранных испытуемым ранее 20-ти  свойств личности, ему предлагают построить  субъективный ряд Y, в котором испытуемый должен расположить данные свойства по мере убывания их выраженности у него лично (20-й ранг - качество, присущее испытуемому в наибольшей степени, 19-й - качество, характерное для него несколько меньше, чем первое, и т. д.). Результаты заносят в протокол исследования (рис. 7).

 

Качества

«Я–идеальное» Xi

«Я–реальное» Yi

di = Xi — Yi

di2

Аккуратность

14

19

-5

25

Беспечность

1

6      

-5

25

Вспыльчивость

3

1

2

4

Жизнерадостность

20

12

8

64

Заботливость

18 

20

-2

4

Застенчивость

9

16

-7

49

Искренность

12

4

8

64

Капризность

2

8

-6

36

Легковерие

8 

17

-9

81

Медлительность

5

13

-8

64

Мнительность

6

18

-12

144

Настойчивость

7

11

-4

16

Нежность

17

9

8

64

Непринужденность

16

5

11

121

Обаяние

13

14

-1

1

Осторожность  

4

2

2

4

Отзывчивость

19

15

4

16

Принципиальность

10

7

3

9

Решительность

11

10

1

1

Упорство

15

3

12

144

 

w32.jpg

Рис. 7. Протокол исследования по методике Будасси.

 

В столбце Xi испытуемый проранжировал  20 качеств по степени желательности (ранг 20 присуждается самому желаемому качеству). Затем в следующем столбце Yi испытуемый проранжировал  эти же качества по степени выраженности у него в данный момент (ранг 20 получает самое характéрное качество).

 

Цель обработки результатов - определение связи между ранговыми оценками качеств личности, входящими в представления «Я-идеальное» и «Я-реальное».

 

w33.jpg

 

Мера связи устанавливается с помощью коэффициента ранговой корреляции Спирмена. На основе расчета коэффициента ранговой корреляции Спирмена делается вывод об уровне самооценки испытуемого. Требуется рассчитать коэффициент корреляции Спирмена между выраженностью качеств у обследуемого испытуемого в данный момент и его идеальным представлением.

 

РЕШЕНИЕ.

Составляем расчетную таблицу (рис. 7), в которую заносим две ранговые последовательности (желаемую Xi и реальную Yi), разности рангов di и di2.

 

 

w34.jpg

 

Для вычисления коэффициента корреляции рангов Спирмена применяем формулу (1).

 

 

Для значения N = 20  по статистической таблице находим критические значения для уровней значимости α = 0, 05 и α = 0, 01.

rкр1 = 0,45 (α = 0, 05); rкр2  = 0,57 (α = 0, 01).

 

Вычисленное эмпирическое значение коэффициента корреляции рангов Спирмена удовлетворяет неравенству:

rS = 0,3 < 0,45 = rкр1.

 

w35.jpg

 

Таким образом, значение коэффициента ранговой корреляции попало в «зону незначимости», что  не позволяет отвергнуть гипотезу H0. Корреляция не отличается от нуля, что свидетельствует об отсутствии корреляционной связи между выраженностью качеств у испытуемого в данный момент и его идеальным представлением.

 

w36.jpg

 

ВЫВОД.

Корреляционная связь между ранговыми оценками качеств личности «Я-идеальное» и «Я-реальное» отсутствует, принимается гипотеза H0.

 

w37.jpg

 

СПИСОК РЕКОМЕНДУЕМОЙ ЛИТЕРАТУРЫ

 

[1] Гласс Дж., Стенли Дж.  Статистические методы в педагогике и психологии.  Пер. С англ. М.: 1976.

 

[2] Дружинин В. Н. Экспериментальная психология — СПб: Издательство «Питер», 2000.

320 с.: ил. — (Серия «Учебник нового века»).

 

[3] Ермолаев О. Ю. Математическая статистика для психологов. Учебник. - 2-е изд., испр.

М.: МПСИ: Флинта, 2003. - 336 с. - (Библиотека психолога).

w38.jpg

[4] Титкова Л.С. Математические методы в психологии. Учебно-методическое пособие. – Изд-во Дальневосточного университета: Владивосток, 2002. – 142 с.

 

[5] Харченко М.А. КОРРЕЛЯЦИОННЫЙ АНАЛИЗ. Учебное пособие для вузов. Издательско-полиграфический центр Воронежского гос. ун-та . Воронеж, 2008.

w39.jpg