Метод корреляции. Корреляционный анализ спирмена

Методы корреляции

Все явления общественной жизни взаимосвязаны и взаимообусловлены. Задача статистики состоит в том, чтобы выявить и измерить связи и зависимости между изучаемыми явлениями.

Взаимосвязанные признаки подразделяются на факторные (под их воздействием изменяются другие, зависящие от них признаки) и результативные.

Связи по степени тесноты могут быть функциональными (при которых определенному значению факторного признака соответствует строго определенное значение результативного признака; для выявления такой связи достаточно одного наблюдения), статистическими (когда одному и тому же значению факторного признака могут соответствовать несколько значений результативного признака; эти связи проявляются в массе случаев и при этом в среднем). Функциональные связи иначе называются полными, а статистические - неполными или корреляционными.

Корреляционная зависимость проявляется только в средних величинах и выражает числовое отношение между ними в виде тенденции к возрастанию или убыванию одной переменной величины при возрастании или убывании другой.

Корреляционная связь является свободной, неполной и неточной связью.

Поскольку корреляционная связь является статистической, первым условием возможности ее изучения является общее условие всякого статистического исследования: наличие данных по достаточно большой совокупности явлений. По отдельным явлениям можно получить совершенно превратное представление о связи признаков, ибо в каждом отдельном явлении значения признаков кроме закономерной составляющей имеют случайное отклонение (вариацию).

Вторым условием закономерного проявления корреляционной связи служит условие, обеспечивающее надежное выражение закономерности в средней величине. Кроме уже указанного большого числа единиц совокупности для этого необходима достаточная качественная однородность совокупности. Нарушение этого условия может извратить параметры корреляции.

Прямые и обратные связи. В зависимости от направления действия, функциональные и стахостические связи могут быть прямые и обратные. При прямой связи направление изменения результативного признака совпадает с направлением изменения признака-фактора, то есть с увеличением факторного признака увеличивается и результативный, и, наоборот, с уменьшением факторного признака уменьшается и результативный признак. В противном случае между рассматриваемыми величинами существуют обратные связи. Например, чем выше квалификация рабочего (разряд), тем выше уровень производительности труда - прямая связь. А чем выше производительность труда, тем ниже себестоимость единицы продукции - обратная связь.

Прямолинейные и криволинейные связи. По аналитическому выражению (форме) связи могут быть прямолинейными и криволинейными. При прямолинейной связи с возрастанием значения факторного признака происходит непрерывное возрастание (или убывание) значений результативного признака. Математически такая связь представляется уравнением прямой, а графически - прямой линией. Отсюда ее более короткое название - линейная связь. При криволинейных связях с возрастанием значения факторного признака возрастание (или убывание) результативного признака происходит неравномерно, или же направление его изменения меняется на обратное. Геометрически такие связи представляются кривыми линиями (гиперболой, параболой и т.д.).

Однофакторные и многофакторные связи. По количеству факторов, действующих на результативный признак, связи различаются: однофакторные (один фактор) и многофакторные (два и более факторов). Однофакторные (простые) связи обычно называются парными (т.к. рассматривается пара признаков). Например, корреляционная связь между прибылью и производительностью труда. В случае многофакторной (множественной) связи имеют в виду, что все факторы действуют комплексно, то есть одновременно и во взаимосвязи. Например, корреляционная связь между производительностью труда и уровнем организации труда, автоматизации производства, квалификации рабочих, производственным стажем, простоями и другими факторными признаками. С помощью множественной корреляции можно охватить весь комплекс факторных признаков и объективно отразить существующие множественные связи.

Для изучения, измерения и количественного выражения взаимосвязей между явлениями статистикой применяются различные методы, такие как: метод сопоставления параллельных рядов, балансовый, графический, методы аналитических группировок, дисперсионного и корреляционного анализа

Метод параллельных рядов заключается в том, что полученные в результате сводки и обработки материалы располагают в виде параллельных рядов и сопоставляют их между собой для установления характера и тесноты связи.

Балансовый метод состоит в том, что данные взаимосвязанных показателей изображаются в виде таблицы и располагаются таким образом, чтобы итоги между отдельными ее частями были равны, т.е. чтобы баланс. Балансовый метод используется для характеристики взаимосвязи между производством и распределением продуктов, денежными доходами и расходами населения и т.д. почти все внутренние и внешние хозяйственные связи выражаются в виде балансов.

Метод аналитических группировок. Сущность метода аналитических группировок состоит в том, что единицы статистической совокупности группируются, как правило, по факторному признаку и для каждой группы рассчитывается средняя или относительная величина по результативному признаку. Затем изменения средних или относительных значений результативного признака сопоставления с изменениями факторного признака для выявления характера связи между ними.

Корреляционно-регрессионный анализ. Корреляционная связь - связь, проявляющаяся при достаточно большом числе наблюдений в виде определенной зависимости между средним значением результативного признака и признаками-факторами.

Изучение корреляционных связей сводится в основном к решению следующих задач:

  • - выявление наличия (или отсутствия) корреляционной связи между изучаемыми признаками. Эта задача может быть решена на основе параллельного сопоставления (сравнения) значенийх иу уn единиц совокупности; с помощью группировок; построения и анализа специальных корреляционных таблиц; а также построения диаграмм рассеяния;
  • - измерение тесноты связи между двумя (и более) признаками с помощью специальных коэффициентов. Эта часть исследования называется корреляционный анализ;
  • - определение уравнения регрессии - математической модели, в которой среднее значение результативного признакау рассматривается как функция одной или нескольких переменных - факторных признаков. Эта часть исследования называется регрессионный анализ.

Задача корреляционного анализа - измерение тесноты связи между варьируемыми признаками и оценка факторов, оказывающих наибольшее влияние.

Задача регрессионного анализа - выбор типа модели (формы связи), устанавливающих степени влияния независимых переменных.

Связь признаков проявляется в их согласованной вариации, при этом одни признаки выступают как факторные, а другие - как результативные. Причинно-следственная связь факторных и результативных признаков характеризуется по степени:

  • - тесноты;
  • - направлению;
  • - аналитическому выражению.

Регрессионный анализ. Для оценки параметров уравнений регрессии наиболее часто используется метод наименьших квадратов (МНК), суть которого заключается в следующем требовании: искомые теоретические значения результативного признака должны быть такими, при которых бы обеспечивалась минимальная сумма квадратов их отклонений от эмпирических (фактических) значений, т.е.

При изучении связей показателей применяются различного вида уравнения прямолинейной и криволинейной связи. Так, при анализе прямолинейной зависимости применяется уравнение:

При криволинейной зависимости применяется ряд математических функций:

полулогарифмическая

показательная

степенная

параболическая

гиперболическая

Наиболее часто используемая форма связи между коррелируемыми признаками - линейная, при парной корреляции выражается уравнением,где а 0 - среднее значение в точкеx =0, поэтому экономической интерпретации коэффициента нет; а 1 - коэффициент регрессии, показывает, на сколько изменяется в среднем значение результативного признака при увеличении факторного на единицу собственного измерения.

Система нормальных уравнений МНК для линейной парной регрессии имеет следующий вид:

Отсюда можно выразить коэффициенты регрессии:

Для практического использования регрессионных моделей необходима проверка их адекватности. При численности объектов анализа до 30 единиц возникает необходимость проверить, насколько вычисленные параметры характерны для отображаемого комплекса условий, не являются ли полученные значения параметров результатом действия случайных причин. Значимость коэффициентов регрессии применительно к совокупностиn <30определяется с помощью t-критерия Стьюдента. При этом вычисляются фактические значения t-критерия:

для параметра а0: ,

для параметра а 1: .

среднее квадратическое отклонение результативного признака от выровненных значений.

среднее квадратическое отклонение факторного признака от общей средней.

Полученные по формуламфактические значения и сравниваются с критическим, который получают по таблице Стьюдента с учетом принятого уровня значимости и числа степеней свободы н =n-k- 1, где n - число наблюдений, k - число факторов, включенных в уравнение регрессии). Рассчитанные параметры а 0 и а 1 уравнения регрессии признаются типичными, если t фактическое больше t критического.

Корреляционный анализ позволяет установить тесноту связи между факторами и решить следующие задачи:

  • - ответить на вопрос: существует ли связь?
  • - выявить изменение связи в различных ситуациях реальных данных;
  • - определить наиболее значимые факторы в результативном признаке;

Различают:

  • - парную корреляцию - это зависимость между результативным и факторным признаком;
  • - частную корреляцию - это зависимость между результативным и одним факторным признаком при фиксированном значении других факторных признаков;

Множественную - многофакторное влияние в статической модели.

К простейшим показателям тесной связи относятся:

  • - линейный коэффициент корреляции К.Пирсона;
  • - коэффициент детерминации;
  • - коэффициенты корреляции знаков - для оценки тесноты связи качественных признаков (непараметрические методы), Г. Фехнера, К. Спирмэна, М. Кэндэла.

Теснота связи при линейной зависимости измеряется с помощью линейного коэффициента корреляции, который рассчитывается по одной из формул:

Корреляционный анализ выполняет оценку адекватности регрессионной модели, но путем установления тесноты связи.

Оценка линейного коэффициента корреляции

Значимость линейного коэффициента корреляции проверяется на основе t-критерия Стьюдента. Для этого определяется фактическое значение критерия:

Вычисленное по формулезначение сравнивается с критическим, который получают по таблице Стьюдента с учетом принятого уровня значимости и числа степеней свободы н.

Коэффициент корреляции считается статистически значимым, если t расч превышает (t расч >).

Универсальным показателем тесноты связи является теоретическое корреляционное отношение:

где - общая дисперсия эмпирических значений y , характеризует вариацию результативного признака за счет всех факторов, включая х ;

Факторная дисперсия теоретических значений результативного признака, отражает влияние фактора х на вариацию у ;

Остаточная дисперсия эмпирических значений результативного признака, отражает влияние на вариацию у всех остальных факторов кроме х .

По правилу сложения дисперсий:

Оценка связи на основе теоретического корреляционного отношения (шкала Чеддока)

Для линейной зависимости теоретическое корреляционное отношение тождественно линейному коэффициенту корреляции, т.е. з = |r| .

Множественный коэффициент корреляции в случае зависимости результативного признака от двух факторов вычисляется по формуле:

где - парные коэффициенты корреляции между признаками.

Множественный коэффициент корреляции изменяется в пределах от 0 до 1 и по определению положителен: .

Значимость коэффициента множественной детерминации, а соответственно и адекватность всей модели и правильность выбора формы связи можно проверить с помощью критерия Фишера:

где R 2 - коэффициент множественной детерминации (R 2);

k - число факторных признаков, включенных в уравнение регрессии.

Связь считается существенной, еслиF расч > F табл - табличного значения F- критерия для заданного уровня значимостиби числе степеней свободы

н 1 = k , н 2 = n - k - 1.

Частные коэффициенты корреляции характеризуют степень тесноты связи результативного признака и фактора, при элиминировании его взаимосвязи с остальными факторами, включенными в анализ. В случае зависимости у от двух факторных признаков частные коэффициенты корреляции рассчитываются:

где r - парные коэффициенты корреляции между указанными в индексе переменными.

В первом случае исключено влияние факторного признака х 2 , во втором - х 1.

Для оценки сравнительной силы влияния факторов, по каждому фактору рассчитывают частные коэффициенты эластичности:

где - среднее значение соответствующего факторного признака;

Среднее значение результативного признака;

Коэффициент регрессии приi -м факторном признаке.

Данный коэффициент показывает, на сколько процентов следует ожидать изменения результативного показателя при изменении фактора на 1% и неизменном значении других факторов.

Частный коэффициент детерминации показывает, на сколько процентов вариация результативного признака объясняется вариацией i -го признака, входящего в множественное уравнение регрессии, рассчитывается по формуле:

где - парный коэффициент корреляции между результативным и i -м факторным признаком;

Соответствующий стандартизованный коэффициент уравнения множественной регрессии:

СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ

«Теория статистики», учебник под ред. Р.А. Шмойловой,

М.: Финансы и статистика, 2007. - 510 с.

«Практикум по теории статистики»., под ред. Р.А. Шмойловой,

М.: Финансы и статистика, 2004. - 456 с.

«Общая теория статистики» И.И. Елисеева, М.М. Юзбашев,

М.: Финансы и статистика, 2002. - 480 с.

«Теория статистики» В.М. Гусаров, М.: ЮНИТИ, 2001. - 247 с.

Корреляция - Это степень, в которой события или личные характеристики человека зависят друг от друга. Корреляционный метод - процедура в исследовании, использующаяся, чтобы определить взаимосвязь между переменными. Данный метод может, например, ответить на вопрос: «существует ли корреляция между количеством стресса, с которым сталкиваются люди и степенью испытываемой ими депрессии?» То есть, по мере того, как люди продолжают переживать стресс, насколько увеличивается вероятность того, что они впадут в депрессию?

Корреляция - Степень зависимости друг от друга событий или характеристик.

Корреляционный метод - Процедура исследований, которая используется для определения того, насколько события или характеристики зависят друг от друга.

Чтобы ответить на этот вопрос, исследователи подсчитывают баллы жизненного стресса (например, количество угрожающих событий, переживаемых человеком в определенный период времени) и баллы депрессии (например, баллы в опросниках по депрессии). Как правило, исследователи обнаруживают, что эти переменные увеличиваются или уменьшаются вместе (Stader & Hokanson, 1998; Paykel & Cooper, 1992). To есть чем больше количество баллов стресса в жизни определенного человека, тем выше его или ее сумма баллов по депрессии. Корреляции такого рода имеют позитивную направленность и их называют позитивной корреляцией.

Корреляция может иметь и негативную, а не позитивную направленность. При негативной корреляции, когда значение одной переменной возрастает, значение другой уменьшается. Исследователи обнаружили, например, негативную корреляцию между депрессией и уровнем активности. Чем больше депрессия человека, тем меньше его занятость.

Существует еще и третья взаимосвязь в корреляционном исследовании. Две переменные могут быть не взаимосвязаны, то есть между ними не существует последовательной взаимосвязи. Когда число одной переменной возрастает, показатели другой переменной иногда возрастают, иногда уменьшаются. Исследования обнаружили, например, что депрессия и интеллект не зависят друг от друга.

Кроме знания направленности корреляции исследователям нужно знать ее величину или силу. То есть насколько близко эти две переменные соотносятся между собой. Действительно ли одна переменная всегда зависит от другой или их взаимосвязь менее определенна? Когда обнаруживается тесная взаимосвязь двух переменных у многих испытуемых, то говорят, что корреляция - высокая или устойчивая.

Направленность и величина корреляции часто имеет численное значение и выражается в статистическом понятии - Коэффициенте корреляции ( R ). Коэффициент корреляции может варьироваться от +1.00, показывающего полную позитивную корреляцию между двумя переменными, и до -1.00 - этот коэффициент указывает на полную негативную корреляцию. Знак коэффициента (+ или -) обозначает направленность корреляции; число представляет ее величину. Чем ближе коэффициент к 0, тем слабее корреляция и меньше ее величина. Так корреляции +0.75 и -0.75 имеют одинаковые величины, а корреляция +.25 слабее и той и другой корреляции.

Коэффициент корреляции ( R ) - Статистический термин, указывающий направленность и величину корреляции, колеблющийся от -1.00 до +1.00.

Поведение людей меняется, и многие человеческие реакции можно оценивать лишь приблизительно. Поэтому в психологических исследованиях корреляции не достигают величины полной позитивной или полной негативной корреляции. В одном исследовании стресса и депрессии, проводившемся с 68 взрослыми, корреляция между двумя переменными составила +0.53 (Miller et al., 1976). Несмотря на то, что эту корреляцию едва ли можно назвать абсолютной, ее величина в психологическом исследовании считается большой.

Для социально-экономических явлений характерно, что наряду с существенными факторами, формирующими уровень результативного признака, на него оказывают воздействие многие другие неучтенные и случайные факторы. Это свидетельствует о том, что взаимосвязи явлений, которые изучает статистика, носят корреляционный характер и аналитически выражаются функцией вида:

y ср. x == f (x).

Корреляция – это статистическая зависимость между случайными величинами, не имеющими строго функционального характера, при которой изменений одной из случайных величин приводит к изменению математического ожидания другой.

В статистике принято различать следующие варианты зависимостей :

1. Парная корреляция – связь между двумя признаками (результативным и факторным или двумя факторными).

2. Частная корреляция – зависимость между результативным и одним факторным признаками при фиксированном значении других факторных признаков.

3. Множественная корреляция – зависимость результативного и двух или более факторных признаков, включенных в исследование.

Корреляционный анализ имеет своей задачей количественное определение тесноты связи между двумя признаками (при парной связи) и между результативным и множеством факторных признаков (при многофакторной связи).

Теснота связи количественно выражается величиной коэффициентов корреляции. Коэффициенты корреляции, представляя количественную характеристику тесноты связи между признаками, дают возможность определять “полезность” факторных признаков при построении уравнений множественной регрессии. Величина коэффициента корреляции служит также оценкой соответствия уравнения регрессии выявленным причинно-следственным связям.

Первоначально исследования корреляции проводились в биологии, а позднее распространились и на другие области, в том числе и на социально-экономическую. Одновременно с корреляцией начала использоваться и регрессия. Корреляция и регрессия тесно связаны между собой: корреляция оценивает силу (теснота) статистической связи, регрессия исследует ее форму . Та и другая служат для установления соотношения между явлениями, для определения наличия и отсутствия связи.

Корреляционно-регрессионный анализ как общее понятие включает в себя измерение тесноты, направления связи(корреляционный анализ) и установление аналитического выражения (формы) связи (регрессионный анализ).

Регрессионный анализ заключается в определении аналитического выражения связи, в котором изменение одной величины (называемой зависимой или результативным признаком) обусловлено влиянием одной или нескольких независимых величин (факторов), а множество всех прочих факторов, также оказывающих влияние на зависимую величину, принимается за постоянные и средние значения. Регрессия может быть однофакторной (парной) и многофакторной (множественной) .

По форме зависимости различают:

1) линейную регрессию, которая выражается уравнениями прямой (линейной функцией) вида: Yср. x = а 0 + а 1 х

2) нелинейную регрессию, которая выражается уравнениями вида:

Парабола: Yср. x = а 0 + а 1 х + а 2 х 2

Гипербола: Yср. x = а 0 + а 1 / х и др.

По направлению связи различают:

1) прямую регрессию (положительную), возникающую при условии, если с увеличением или уменьшением независимой величины значения зависимой также соответственно увеличиваются или уменьшаются;

2) обратную (отрицательную) регрессию, проявляющуюся при условии, что с увеличением или уменьшением независимой величины зависимая соответственно уменьшается или увеличивается.

Положительную и отрицательную регрессии легче понять, если использовать их графическое изображение (см. рисунки ниже).

а) Прямая (положительная) регрессия.

б) Обратная (отрицательная) регрессия.

Рисунок 10 – Прямая и обратная регрессия

Для простой (парной) регрессии в условиях, когда достаточно полно установлены причинно-следственные связи, приобретает практический смысл только последнее положение; при множественности причинных связей невозможно четко разграничить одни причинные явления от других.

Итак, все явления и процессы, характеризующие социально-экономическое развитие и составляющие единую систему национальных счетов, тесно взаимосвязаны и взаимозависимы между собой. В статистике показатели, характеризующие эти явления, могут быть связаны либо корреляционной зависимостью , либо быть независимыми . Корреляционная зависимость является частным случаем стохастической зависимости, при которой изменение значений факторных признаков (х 1 , х 2 , х 3 ….х k) влечет за собой изменение среднего значения результативного признака. Корреляционная зависимость исследуется с помощью методов корреляционного и регрессионного анализов. Корреляционный анализ изучает взаимосвязи показателей и позволяет решить задачи: оценка тесноты связи между показателями с помощью парных, частных и множественных коэффициентов корреляции; оценка уровня регрессии. Целью регрессионного анализа является оценка функциональной зависимости условного среднего значения результативного признака (Y) от факторных (х 1 , х 2 , х 3 ….х k). Уравнение регрессии, или статистическая модель связи социально-экономических явлений, выражаемая функцией: Yср. x = f (х 1 , х 2 , х 3 ….х k), является достаточно адекватной реальному

моделируемому явлению или процессу в случае соблюдения следующих требований их построения:

1. Совокупность исследуемых исходных данных должна быть однородной и математически описываться непрерывными функциями.

2. Возможность описания моделируемого явления одним или несколькими уравнениями причинно-следственной связи.

3. Все факторные признаки должны иметь количественное (цифровое) выражение.

4. Наличие достаточно большого объема исследуемой выборочной совокупности.

5. Причинно-следственные связи между явлениями и процессами следует описывать линейной или приводимой к линейной формой зависимости.

6. Отсутствие количественных ограничений на параметры модели связи.

Постоянство территориальной и временной структуры изучаемой совокупности

Корреляционный метод.

Чтобы преодолеть ограничения метода клинических случаев, исследователи личности часто используют альтернативную стратегию, известную как корреляционный метод .Этот метод стремится установить взаимосвязи между событиями (переменными) и внутри них. Переменная - любая величина, которая может быть измерена и чье количественное выражение может варьировать в переделах того или иного континуума. Например, тревожность - переменная, потому что ее можно измерить (с помощью шкалы самооценки тревоги) и потому что люди различаются по степени выраженности у них тревожности. Сходным образом точность выполнения задания, требующего определенного навыка, тоже является переменной, которую можно измерить. Корреляционное исследование можно провести, просто измерив уровень тревожности у некоторого числа людей, а также уровень точности действий каждого из них при выполнении группой сложного задания. Если опубликованные результаты подтвердятся в другом исследовании, то можно будет считать, что субъекты с более низкими показателями тревожности имеют более высокие показатели точности выполнения задания. Поскольку на точность выполнения задания, вероятно, влияют и другие факторы (например, прежний опыт его выполнения, мотивация, интеллект), связь между точностью действий и тревожностью не будет безупречной, но она будет заслуживать внимания.

Переменными в корреляционном исследовании могут быть данные тестирования, демографические характеристики (такие как возраст, порядок рождения и социально-экономический статус), результаты измерения черт характера по методу самооценки, мотивы, ценности и установки, физиологические реакции (такие как частота сердечных сокращений, артериальное давление и кожно-гальваническая реакция), а также стили поведения. При использовании корреляционного метода психологи хотят получить ответы на такие специфические вопросы, как: влияет ли высшее образование на профессиональный успех в будущем? имеет ли отношение стресс к коронарной болезни сердца? есть ли взаимосвязь между самооценкой и одиночеством? есть ли связь между порядковым номером рождения и мотивацией достижения? Корреляционный метод не только позволяет ответить «да» или «нет» на эти вопросы, но также дать количественную оценку соответствия значений одной переменной значениям другой переменной. Для решения этой задачи психологи вычисляют статистический индекс, называемый коэффициентом корреляции (известен также как коэффициент линейной корреляции по Пирсону). Коэффициент корреляции (обозначается маленькой буквой r )показывает нам две вещи: 1) степень зависимости двух переменных и 2) направление этой зависимости (прямая или обратная зависимость).

Численное значение коэффициента корреляции варьирует от -1 (полностью отрицательная, или обратная зависимость) через 0 (отсутствие связи) до +1 (полностью положительная, или прямая зависимость). Коэффициент, близкий по значению к нулю, означает, что две измеряемые переменные не связаны сколько-нибудь заметным образом. То есть большие или малые значения переменной X не имеют значимой связи с большими или малыми значениями переменной Y . В качестве примера приведем связь между двумя переменными: массой тела и интеллектом. В целом, полные люди не являются значимо более интеллектуальными или значимо менее интеллектуальными, чем более худощавые люди. И, наоборот, коэффициент корреляции +1 или -1 говорит о полном, однозначном соответствии между двумя переменными. Корреляции, близкие к полным, почти никогда не встречаются в исследовании личности, и это заставляет предположить, что хотя многие психологические переменные и связаны друг с другом, степень связи между ними не является столь уж сильной. Значение коэффициента корреляции в пределах между ±0,30 и ±0,60 является общераспространенным в исследовании личности и представляет практическую и теоретическую ценность для научного прогнозирования. К значениям коэффициента корреляции между 0 и ±0,30 следует относиться с осторожностью - их ценность для научных предсказаний минимальна. На рис. 2-2 представлены графики распределения значений двух переменных при двух различных значениях коэффициента корреляции. По горизонтали расположены значения одной переменной, а по вертикали - другой. Каждая точка означает баллы, полученные одним испытуемым по двум переменным.

Рис. 2-2. Каждая из диаграмм иллюстрирует различную степень зависимости значений двух переменных. Каждая точка па диаграмме представляет собой показатели испытуемого по двум переменным: a - полная положительная корреляция (r = +1); b - полная отрицательная корреляция (r = -1); с - умеренная положительная корреляция (r = +0,71); d - корреляция отсутствует (r = 0).

Положительная корреляция означает, что большие значения одной переменной имеют тенденцию быть связанными с большими значениями другой переменной или малые значения одной переменной - с малыми значениями другой переменной. Другими словами, две переменные увеличиваются или уменьшаются вместе. Например, существует положительная корреляция между ростом и массой тела людей. В целом, у более высоких людей есть тенденция иметь большую массу тела, чем у более низких. Другой пример положительной корреляции - связь между количеством сцен насилия, которые видят дети в телевизионных передачах и их тенденцией вести себя агрессивно. В среднем, чем чаще дети наблюдают насилие по телевизору, тем чаще они демонстрируют агрессивное поведение. Отрицательная корреляция означает, что высокие значения одной переменной связаны с низкими значениями другой переменной и наоборот.

Примером отрицательной корреляции может служить связь между частотой отсутствия студентов в аудитории и успешностью сдачи ими экзаменов. В целом, студенты, имевшие большее количество пропущенных занятий, проявляют тенденцию к получению более низких оценок на экзаменах. Студенты, имевшие меньшее количество пропусков, получали более высокие экзаменационные баллы. Другой пример - отрицательная корреляция между робостью и напористым поведением. Лица, получившие высокие баллы по показателю робости, имели склонность к нерешительному поведению, в то время как лица с низкими показателями робости проявляли себя решительными и напористыми. Чем ближе значение коэффициента корреляции к +1 или к -1, тем сильнее связь между двумя изучаемыми переменными. Так, коэффициент корреляции +0,80 отражает наличие более сильной зависимости между двумя переменными, чем коэффициент корреляции +0,30. Сходным образом, коэффициент корреляции -0,65 отражает более сильную взаимосвязь переменных, чем коэффициент корреляции -0,25. Надо иметь в виду, что величина корреляции зависит только от числового значения коэффициента, в то время как знак «+» или «-», стоящий перед коэффициентом, просто обозначает положительная это корреляция или отрицательная. Так, значение r = +0,70 отражает наличие такой же сильной зависимости, как и значение r = -0,70. Но первый пример указывает на положительную зависимость, а второй - на отрицательную. Далее, коэффициент корреляции -0,55 указывает на более сильную зависимость, чем коэффициент корреляции +0,35. Понимание этих аспектов корреляционной статистики поможет вам оценивать результаты исследований такого рода.

Чтобы преодолеть ограничения метода клинических случаев, исследователи личности часто используют альтернативную стратегию, известную как корреляционный метод . Этот метод стремится установить взаимосвязи между событиями (переменными) и внутри них. Переменная - любая величина, которая может быть измерена и чье количественное выражение может варьировать в переделах того или иного континуума. Например, тревожность - переменная, потому что ее можно измерить (с помощью шкалы самооценки тревоги) и потому что люди различаются по степени выраженности у них тревожности. Сходным образом точность выполнения задания, требующего определенного навыка, тоже является переменной, которую можно измерить. Корреляционное исследование можно провести, просто измерив уровень тревожности у некоторого числа людей, а также уровень точности действий каждого из них при выполнении группой сложного задания. Если опубликованные результаты подтвердятся в другом исследовании, то можно будет считать, что субъекты с более низкими показателями тревожности имеют более высокие показатели точности выполнения задания. Поскольку на точность выполнения задания, вероятно, влияют и другие факторы (например, прежний опыт его выполнения, мотивация, интеллект), связь между точностью действий и тревожностью не будет безупречной, но она будет заслуживать внимания.

Переменными в корреляционном исследовании могут быть данные тестирования, демографические характеристики (такие как возраст, порядок рождения и социально-экономический статус), результаты измерения черт характера по методу самооценки, мотивы, ценности и установки, физиологические реакции (такие как частота сердечных сокращений, артериальное давление и кожно-гальваническая реакция), а также стили поведения. При использовании корреляционного метода психологи хотят получить ответы на такие специфические вопросы, как: влияет ли высшее образование на профессиональный успех в будущем? имеет ли отношение стресс к коронарной болезни сердца? есть ли взаимосвязь между самооценкой и одиночеством? есть ли связь между порядковым номером рождения и мотивацией достижения? Корреляционный метод не только позволяет ответить "да" или "нет" на эти вопросы, но также дать количественную оценку соответствия значений одной переменной значениям другой переменной. Для решения этой задачи психологи вычисляют статистический индекс, называемый коэффициентом корреляции (известен также как коэффициент линейной корреляции по Пирсону). Коэффициент корреляции (обозначается маленькой буквой r ) показывает нам две вещи: 1) степень зависимости двух переменных и 2) направление этой зависимости (прямая или обратная зависимость).

Численное значение коэффициента корреляции варьирует от -1 (полностью отрицательная, или обратная зависимость) через 0 (отсутствие связи) до +1 (полностью положительная, или прямая зависимость). Коэффициент, близкий по значению к нулю, означает, что две измеряемые переменные не связаны сколько-нибудь заметным образом. То есть большие или малые значения переменной X не имеют значимой связи с большими или малыми значениями переменной Y . В качестве примера приведем связь между двумя переменными: массой тела и интеллектом. В целом, полные люди не являются значимо более интеллектуальными или значимо менее интеллектуальными, чем более худощавые люди. И, наоборот, коэффициент корреляции +1 или -1 говорит о полном, однозначном соответствии между двумя переменными. Корреляции, близкие к полным, почти никогда не встречаются в исследовании личности, и это заставляет предположить, что хотя многие переменные и связаны друг с другом, степень связи между ними не является столь уж сильной. Значение коэффициента корреляции в пределах между ±0,30 и ±0,60 является общераспространенным в исследовании личности и представляет практическую и теоретическую ценность для научного прогнозирования. К значениям коэффициента корреляции между 0 и ±0,30 следует относиться с осторожностью - их ценность для научных предсказаний минимальна. На рис. 2-2 представлены графики распределения значений двух переменных при двух различных значениях коэффициента корреляции. По горизонтали расположены значения одной переменной, а по вертикали - другой. Каждая точка означает баллы, полученные одним испытуемым по двум переменным.

Рис. 2-2. Каждая из диаграмм иллюстрирует различную степень зависимости значений двух переменных. Каждая точка па диаграмме представляет собой показатели испытуемого по двум переменным: a - полная положительная корреляция (r = +1); b - полная отрицательная корреляция (r = -1); с - умеренная положительная корреляция (r = +0,71); d - корреляция отсутствует (r = 0).

Положительная корреляция означает, что большие значения одной переменной имеют тенденцию быть связанными с большими значениями другой переменной или малые значения одной переменной - с малыми значениями другой переменной. Другими словами, две переменные увеличиваются или уменьшаются вместе. Например, существует положительная корреляция между ростом и массой тела людей. В целом, у более высоких людей есть тенденция иметь большую массу тела, чем у более низких. Другой пример положительной корреляции - связь между количеством сцен насилия, которые видят дети в телевизионных передачах и их тенденцией вести себя агрессивно. В среднем, чем чаще дети наблюдают насилие по телевизору, тем чаще они демонстрируют агрессивное поведение. Отрицательная корреляция означает, что высокие значения одной переменной связаны с низкими значениями другой переменной и наоборот.

Примером отрицательной корреляции может служить связь между частотой отсутствия студентов в аудитории и успешностью сдачи ими экзаменов. В целом, студенты, имевшие большее количество пропущенных занятий, проявляют тенденцию к получению более низких оценок на экзаменах. Студенты, имевшие меньшее количество пропусков, получали более высокие экзаменационные баллы. Другой пример - отрицательная корреляция между робостью и напористым поведением. Лица, получившие высокие баллы по показателю робости, имели склонность к нерешительному поведению, в то время как лица с низкими показателями робости проявляли себя решительными и напористыми. Чем ближе значение коэффициента корреляции к +1 или к -1, тем сильнее связь между двумя изучаемыми переменными. Так, коэффициент корреляции +0,80 отражает наличие более сильной зависимости между двумя переменными, чем коэффициент корреляции +0,30. Сходным образом, коэффициент корреляции -0,65 отражает более сильную взаимосвязь переменных, чем коэффициент корреляции -0,25. Надо иметь в виду, что величина корреляции зависит только от числового значения коэффициента, в то время как знак "+" или "-", стоящий перед коэффициентом, просто обозначает положительная это корреляция или отрицательная. Так, значение r = +0,70 отражает наличие такой же сильной зависимости, как и значение r = -0,70. Но первый пример указывает на положительную зависимость, а второй - на отрицательную. Далее, коэффициент корреляции -0,55 указывает на более сильную зависимость, чем коэффициент корреляции +0,35. Понимание этих аспектов корреляционной статистики поможет вам оценивать результаты исследований такого рода.

Оценка корреляционного метода.

Корреляционный метод обладает некоторыми уникальными преимуществами. Наиболее важным является то, что он позволяет исследователям изучать большой набор переменных, которые недоступны проверке с помощью экспериментальных исследований. Например, когда речь идет об установлении связи между сексуальным насилием, перенесенным в детстве, и эмоциональными проблемами в более поздние годы жизни, корреляционный анализ может стать единственным этически приемлемым способом исследования. Аналогично, чтобы изучить, как демократический и авторитарный стили родительского воспитания соотносятся с ценностными ориентациями человека, стоит выбрать этот метод, поскольку этические соображения не дают возможности экспериментально контролировать стиль родительского воспитания.

Второе преимущество корреляционного метода состоит в том, что он дает возможность изучать многие аспекты личности в естественных условиях реальной жизни. Например, если мы хотим оценить влияние развода родителей на адаптацию и поведение детей в школе, мы должны систематически отслеживать социальные и академические успехи детей из распавшихся семей в течение определенного периода времени. Проведение подобного естественного наблюдения потребует времени и усилий, но позволит дать вполне реалистичную оценку сложного поведения. По этой причине корреляционный метод является предпочтительной исследовательской стратегией для персонологов, заинтересованных в изучении индивидуальных различий и феноменов, поддающихся экспериментальному контролю. Третье преимущество корреляционного метода заключается в том, что иногда с его помощью становится возможным предсказать некое событие, зная другое. Например, в исследовании получена умеренно высокая положительная корреляция между оценками по SAT 4 у старшеклассников и их же оценками, полученными позднее в колледже (Hargadon, 1981). Поэтому, зная баллы студентов по SAT, приемная комиссия в колледже может достаточно точно предсказать их последующую успеваемость. Подобные предсказания никогда не бывают совершенными, но часто оказываются полезными для решения вопроса о приеме в учебное заведение. Тем не менее, все исследователи личности признают два серьезных недостатка этой стратегии. Во-первых, применение корреляционного метода не позволяет исследователям выделять причинно-следственные отношения. Суть проблемы состоит в том, что корреляционное исследование не может дать окончательное заключение о том, что две переменные причинно связаны . Например, во многих корреляционных исследованиях подтверждается связь между просмотром телевизионных программ с эпизодами насилия и агрессивным поведением у части детей и взрослых зрителей (Freedman, 1988; Huston, Wright, 1982). Какой вывод можно сделать из этих работ? Одно из возможных заключений таково: просмотр в течение длительного времени сцен насилия по телевидению ведет к возрастанию у зрителя агрессивных побуждений. Но возможен и противоположный вывод: агрессивные по складу своего характера субъекты или те, кто совершали агрессивные действия, предпочитают смотреть телевизионные программы со сценами насилия. К сожалению, корреляционный метод не позволяет установить, какое из этих двух объяснений верно. В то же время, корреляционные исследования, в которых устанавливается сильная корреляционная зависимость между значениями двух переменных, поднимает вопрос о возможности наличия причинно обусловленной связи между этими переменными. Что касается, например, связи между просмотром сцен насилия по телевидению и агрессией, то экспериментальное исследование, проведенное вслед за полученными результатами корреляционного анализа, привело ученых к заключению, что экспозиция программ, содержащих сцены насилия, может быть причиной агрессивного поведения (Eron, 1987).

4 Scholastic Attitude Test - программа для оценки способностей к обучению. См. Анастази А. Психологическое тестирование / Под ред. К. М. Гуревича, В. И. Лубовского. М., 1982. - Кн. 2. - С. 48. (Прим. науч. ред.)

Второй недостаток корреляционного метода - возможная путаница, вызванная действием третьей переменной. Для иллюстрации рассмотрим зависимость между употреблением наркотиков подростками и их родителями. Означает ли наличие корреляционной зависимости, что подростки, видя, как родители принимают наркотики, сами начинают употреблять их в еще большем количестве? Или это значит, что беспокойство при виде того, как их дети-подростки принимают наркотики, заставляет самих родителей прибегать к наркотикам, чтобы тем самым уменьшить свою тревогу? Или какой-то третий фактор сходным образом толкает подростков и взрослых к употреблению наркотиков? Может быть, подростки и их родители принимают наркотики, чтобы смириться с угнетающей нищетой, в которой они живут? То есть истинной причиной, обусловливающей наркоманию, может быть социально-экономический статус семей (например, бедность). Вероятность того, что третья переменная, которая не измеряется и о которой, может быть, даже и не подозревают, в действительности оказывает причинное влияние на обе измеряемые переменные, нельзя исключать при интерпретации результатов, полученных с помощью корреляционного метода.

Хотя корреляционный метод не предполагает установления причинно-следственной связи, из этого не следует, что причинно-следственные отношения в определенных случаях не могут быть четко установлены. Последнее особенно верно в отношении лонгитюдных корреляционных исследований - где, например, интересующие нас переменные, измеренные в одно время, коррелируют с другими переменными, о которых известно, что они появляются вслед за первыми. Рассмотрим, например, хорошо известную положительную корреляцию между курением сигарет и раком легких. Несмотря на возможность того, что какая-то третья неизвестная переменная (например, генетическая предрасположенность) может служить причиной и курения, и рака легких, мало кто сомневается, что весьма вероятная причина рака - курение, так как по времени курение предшествует заболеванию раком легких. Подобная стратегия (измерение двух переменных, разделенное определенным промежутком времени) дает возможность исследователям устанавливать причинно-следственные отношения в случаях, когда невозможно провести эксперимент. Например, на основе клинических наблюдений исследователи в течение долгого времени подозревали, что хронический стресс способствует развитию многих физиологических и проблем. Недавние работы по измерению силы стресса (с использованием шкал самооценки) позволили проверить эти предположения с применением корреляционного метода. В области физиологических расстройств, например, накопленные данные свидетельствуют о следующем: стресс значимо связан с возникновением и развитием сердечно-сосудистых заболеваний, диабета, рака и различных типов инфекционных заболеваний (Elliott, Eisdorfer, 1982; Friedman, Booth-Kelley, 1987; Jemmott, Locke, 1984; Smith, Anderson, 1986; Williams, Deffenbacher, 1983). Корреляционный анализ также показал, что стресс может способствовать формированию зависимости от наркотиков (Newcomb, Harlow, 1986), сексуальных расстройств (Malatesta, Adams, 1984), а также возникновению многочисленных психических нарушений (Neufeld, Mothersill, 1980). Тем не менее, критики корреляционного подхода справедливо замечают, что могут существовать и другие факторы, искусственно усиливающие предположительную связь между стрессом и болезнью (Schroeder, Costa, 1984). Таким образом, одно предостережение остается: хотя иногда при наличии сильной корреляционной зависимости между двумя переменными напрашивается вывод о наличии причинной связи между ними, в действительности установить причинно-следственные отношения можно только экспериментальными методами.