Нормальное распределение и его параметры. Кривая нормального распределения Гаусса и гистограмма Рис.2. Нормальная кривая и стандартные показатели

Для девочек 08.05.2023
Для девочек

Большинство экспериментальных исследований, связанных с измерениями, в том числе и в психологии, способных принимать практически любые значения в заданном интервале (что зависит от величины выборки) описываются моделью случайных непрерывных величин и соответственно – непрерывном распределении.

Одним из непрерывных распределений, имеющим основополагающую роль в математической статистике является нормальное (или Гауссово) распределение. Нормальное распределение является самым важным в статистике, что объясняется рядом причин:

    Многие экспериментальные наблюдения можно успешно описать с помощью близкого к нормальному распределению.

    Большинство распределений, связанных со случайной выборкой, при увеличение объёма последней переходят к нормальному распределению.

    Нормальное распределение обладает рядом благоприятных математических свойств, во многом обеспечивающих его широкое применение в статистике:

    1. Имеет колоколообразную форму, симметричную относительно точки M=X,cточками перегиба, абсциссы которых отстоят отMна +.

      Для нормального распределения математическое ожидание, дисперсия и стандартное отклонение генеральной совокупности равно (сигма).

      нормальное распределение полностью определяется двумя параметрами: математическим ожиданием (средним) и стандартным отклонением.

      мода, медиана и среднее арифметическое нормального распределения совпадают и равны математическому ожиданию M.

Исходя из того, что нормальное распределение полностью определяется двумя параметрами Mи(сигма), то при измерении этих параметров можно получить целое семейство нормальных кривых. Чтобы избежать неудобств, связанных с расчётами для каждого конкретного случая, в психологии используют так называемоенормированное (или чаще стандартное)нормальное распределение , которое и применяется для стандартизации шкал (психометрических линеек).

Нормированное нормальное распределение, имея параметры M= 0 и= 1, имеет колоколообразную форму.

Особенностью данной кривой является то, что площадь под кривой имеет постоянное значение (как показано на рисунке 1). Эта особенность является основной для стандартной интерпретации в эмпирических исследованиях с целью постановки психологического диагноза: так при изучении проявления, какого – либо признака, при попадании индивидуального результата в диапазон составляет 68,2% от всех случаев (т.е. у 68,2% испытуемых генеральной совокупности, степень проявления изучаемого признака будет находиться именно в этом диапазоне), что может оцениваться как среднее проявление изучаемого признака и интерпретироваться какнорма , в проявлении признака.

Рис.1. Процентное распределение случаев под нормальной кривой.

    1. Стандартизированные шкалы.

Показатели психометрических тестов, применяемых в практической психологии с целью постановки психологического диагноза, переводятся из первичных ("сырых" – не подвергнутых обработке) и полученных испытуемым по данному тесту в стандартные показатели, которые рассчитываются на основе линейного или нелинейного преобразования первичных показателей (при условии их распределения близкого к нормальному закону). При этом исторически сложилось наличие ряда наиболее распространённых стандартных показателей, связанных с особенностями преобразования, и отсюда – наличие "семейства" стандартных шкал, переводимых друг в друга и несводимых кZ-шкале.

Z-шкала образуется в результате центрирования, понимаемого как линейная трансформация величин признака, при которой средняя величина распределения становится равная нулю, и процедуры нормирования посредством среднеквадратических отклонений.

Z-шкала состоит из непрерывного континуумаZ-показателей, определяемых в виде разности между индивидуальными первичными результатами и средним значением для генеральной совокупности, делённые на стандартное отклонение распределения.

где X– необработанные, сырые баллы,

– Среднее,

 – стандартное отклонение.

При этом полученная Z-шкала будет иметь среднюю точкуM=0 и единицу измерения (масштаб) 1стандартного (единичного) нормального распределения как показано на рисунке 2.

Z-показатель может принимать как положительные, так и отрицательные значения. Большинство случаев (99,72%) значения показателей уменьшаются в пределах -3+3 и могут принимать любые значения. К достоинствамZ-показателя относится простота интерпретации и сравнения индивидуальных результатов: чем больше показатель, тем дальше от среднего (нормы) он может находиться, при этом знак указывает (+) – выше среднего; (-) – ниже среднего. Но недостатки, особенно в области прикладной (практической) психологии, к которым относят: сложность интерпретации для испытуемого (клиента), крупность масштаба единиц измерения, оперирование отрицательными и положительными величинами, побудили разработчиков тестов использовать нормализованные преобразования по форме:
, гдеZp– преобразованный стандартный показатель;b– стандартное отклонение преобразованного распределения;Z–Z-показатель;A– среднее значение преобразованного распределения. Такой переход правомерен, так как стандартная шкала представляет собой интервальную шкалу, что позволяет выполнить линейные преобразования, при условии, что константыbиA– действительные числа.

Разберём процедуру получения преобразованных стандартных показателей на ряде примеров:

Было проведено эмпирическое исследование уровня уверенности в себе (опросник Рейзаса – 0-90) на выборке учителей (50 человек) из различных школ г. Н. Новгорода. В результате первичной статистической обработки были получены результаты:

    Распределение первичных результатов ("сырых баллов") по форме близко к нормальному распределению (после процедур группировки и анализа кривой распределения – полигона частот).

    Вычислены характеристики для данной выборки –

Предлагается провести линейное преобразование и определить для различных шкал значение одного первичного результата X=45 ("сырой балл" одного из испытуемых).

    Преобразование в Z-показатель производится по формуле:

где Z– стандартныйZ-показатель;

X– первичный результат тестового измерения;

M x – средняя величина результатов выборки (в нашем случае медианаMe);

S x – стандартное отклонение для данной выборки. Найдите полученный показатель наZ-шкале (рисунок 2) и сделайте вывод о проявлении изучаемого признака у данного испытуемого.

    Преобразование в T-шкалу для опросников Мак-Колла производится по уже известной формуле (Zp=A+bZ), подставляя вместо константA=M = 50;b== 10 – полученные Мак-Коллом в результате нормализации эмпирических распределений собственных опросников, переведём результат испытуемого (X=45) в стандартныеT-баллы по формуле:

Таким образом, результат – 25 T-баллов (стандартных баллов).

    Преобразование в шкалу станайнов Гилфорда (англ.standardnine– стандартная девятка), где оценкам присваивают целые значения от 1 до 9, приM = 5, = 2 производятся по формуле:

В данном случае результат испытуемого будет 1 станайн (т.к. полученный результат C = 0 попал в интервал 1-го станайна).

Данная C-шкала обладает таким замечательным свойством (см. рисунок 2), что в 1 и 9 станайны попадает по 4% испытуемых всей выборки, во 2 и 8 станайны – по 7%, и т.д. Таким образом, при ранжированном упорядочивании в сторону возрастания первичных тестовых результатов и условии их нормального (или близкому к нормальному) распределения первым 4% данных присваивается 1 станайн, последующим 7% данных – 2-ой станайн, следующим 12% данных – 3-й станайн и т.д., таким образом, данные будут упорядочены в шкалу, соответствующую стандартным частотам распределения результата.

    Преобразование в шкалу стенов Кэттела (от англ.standardten– стандартная десятка) для опросника 16PF, где оценкам присваивают целые значения от 1 до 10, приM = 5;= 2 производят по формуле:

В данном случае результат испытуемого попадает в интервал 1-го стена.

В тестировании интеллекта используются нормализованные шкалы:

    Шкала Векслера представленнаяIQ-стандартными баллами:

    Шкала структуры интеллекта Амтхауэра по формуле:

С целью интерпретации данных для работников образования представляет интерес шкала Линерта:

    Шкала школьных оценок Линерта:

Рис.2. Нормальная кривая и стандартные показатели.

ОСНОВНЫЕ ПОНЯТИЯ, ИСПОЛЬЗУЕМЫЕ

В МАТЕМАТИЧЕСКОЙ ОБРАБОТКЕ

ПСИХОЛОГИЧЕСКИХ ДАННЫХ

Признаки и переменные

Признаки и переменные - это измеряемые психологические явле­ния. Такими явлениями могут быть время решения задачи, количество допущенных ошибок, уровень тревожности, показатель интеллектуаль­ной лабильности, интенсивность агрессивных реакций, угол поворота корпуса в беседе, показатель социометрического статуса и множество других переменных.

Понятия признака и переменной могут использоваться как взаи­мозаменяемые. Они являются наиболее общими. Иногда вместо них используются понятия показателя или уровня, например, уровень на­стойчивости, показатель вербального интеллекта и др. Понятия показа­теля и уровня указывают на то, что признак может быть измерен коли­чественно, так как к ним применимы определения "высокий" или "низкий", например, высокий уровень интеллекта, низкие показатели тревожности и др.

Психологические переменные являются случайными величинами, поскольку заранее неизвестно, какое именно значение они примут.

Математическая обработка - это оперирование со значениями признака, полученными у испытуемых в психологическом исследовании. Такие индивидуальные результаты называют также "наблюдениями", "наблюдаемыми значениями", "вариантами", "датами", "индивидуальны­ми показателями" и др. В психологии чаще всего используются терми­ны "наблюдение" или "наблюдаемое значение".

Значения признака определяются при помощи специальных шкал измерения.

Шкалы измерения

Измерение - это приписывание числовых форм объектам или собы­тиям в соответствии с определенными правилами (Стивене С, 1960, с.60). С.Стивенсом предложена классификация из 4 типов шкал измерения:

1) номинативная, или номинальная, или шкала наименований;

2) порядковая, или ординальная, шкала;

3) интервальная, или шкала равных интервалов;

4) шкала равных отношений.

Номинативная шкала - это шкала, классифицирующая по назва­нию: потеп (лат.) - имя, название. Название же не измеряется количе­ственно, оно лишь позволяет отличить один объект от другого или од­ного субъекта от другого. Номинативная шкала - это способ классифи­кации объектов или субъектов, распределения их по ячейкам классифи­кации.

Простейший случай номинативной шкалы - дихотомическая шка­ла, состоящая всего лишь из двух ячеек, например: "имеет братьев и сестер - единственный ребенок в семье"; "иностранец - соотечествен­ник"; "проголосовал "за" - проголосовал "против"" и т.п.

Признак, который измеряется по дихотомической шкале наимено­ваний, называется альтернативным. Он может принимать всего два значения. При этом исследователь зачастую заинтересован в одном из них, и тогда он говорит, что признак “проявился”, если тот принял ин­тересующее его значение, и что признак “не проявился” , если он при­нял противоположное значение. Например: "Признак леворукости про­явился у 8 испытуемых из 20". В принципе номинативная шкала может состоять из ячеек "признак проявился - признак не проявился.

Более сложный вариант номинативной шкалы - классификация из трех и более ячеек, например: "экстрапунитивные - интрапунитивные -импунитивные реакции" или "выбор кандидатуры А - кандидатуры Б -кандидатуры В - кандидатуры Г" или "старший - средний - младший -единственный ребенок в семье" и др.

Расклассифицировав все объекты, реакции или всех испытуемых по ячейкам классификации, мы получаем возможность от наименований перейти к числам, подсчитав количество наблюдений в каждой из ячеек.

Как уже указывалось, наблюдение - это одна зарегистрированная реакция, один совершенный выбор, одно осуществленное действие или результат одного испытуемого.

Допустим, мы определим, что кандидатуру А выбрали 7 испы­туемых, кандидатуру Б - 11, кандидатуру В - 28, а кандидатуру Г -всего 1. Теперь мы можем оперировать этими числами, представляю­щими собой частоты встречаемости разных наименований, то есть час­тоты принятия признаком "выбор" каждого из 4 возможных значений. Далее мы можем сопоставить полученное распределение частот с рав­номерным или каким-то иным распределением.

Таким образом, номинативная шкала позволяет нам подсчитывать частоты встречаемости разных "наименований", или значений признака, и затем работать с этими частотами с помощью математических методов.

Единица измерения, которой мы при этом оперируем - количест­во наблюдений (испытуемых, реакций, выборов и т. п.), или частота. Точнее, единица измерения - это одно наблюдение. Такие данные могут быть обработаны с помощью метода χ 2 , биномиального критерия m и углового преобразования Фишера φ*.

Порядковая шкала - это шкала, классифицирующая по принци­пу "больше - меньше". Если в шкале наименований было безразлично, в каком порядке мы расположим классификационные ячейки, то в по­рядковой шкале они образуют последовательность от ячейки "самое ма­лое значение" к ячейке "самое большое значение" (или наоборот). Ячейки теперь уместнее называть классами, поскольку по отношению к классам употребимы определения "низкий", "средний" и "высокий" класс, или 1-й, 2-й, 3-й класс, и т.д.

В порядковой шкале должно быть не менее трех классов, напри­мер "положительная реакция - нейтральная реакция - отрицательная реакция" или "подходит для занятия вакантной должности - подходит с оговорками - не подходит" и т. п.

В порядковой шкале мы не знаем истинного расстояния между классами, а знаем лишь, что они образуют последовательность. Напри­мер, классы "подходит для занятия вакантной должности" и "подходит с оговорками" могут быть реально ближе друг к другу, чем класс "подходит с оговорками" к классу "не подходит".

От классов легко перейти к числам, если мы условимся считать, что низший класс получает ранг 1, средний класс - ранг 2, а высший класс - ранг 3, или наоборот. Чем больше классов в шкале, тем больше у нас возможностей для математической обработки полученных данных и проверки статистических гипотез.

Например, мы можем оценить различия между двумя выборками испытуемых по преобладанию у них более высоких или более низких рангов или подсчитать коэффициент ранговой корреляции между двумя переменными, измеренными в порядковой шкале, допустим, между оценками профессиональной компетентности руководителя, данными ему разными экспертами.

Все психологические методы, использующие ранжирование, по­строены на применении шкалы порядка. Если испытуемому предлагает­ся упорядочить 18 ценностей по степени их значимости для него, проранжировать список личностных качеств социального работника или 10 претендентов на эту должность по степени их профессиональной при­годности, то во всех этих случаях испытуемый совершает так называе­мое принудительное ранжирование, при котором количество рангов со­ответствует количеству ранжируемых субъектов или объектов (ценностей, качеств и т.п.).

Независимо от того, приписываем ли мы каждому качеству или испытуемому один из 3-4 рангов или совершаем процедуру принуди­тельного ранжирования, мы получаем в обоих случаях ряды значений, измеренные по порядковой шкале. Правда, если у нас всего 3 возмож­ных класса и, следовательно, 3 ранга, и при этом, скажем, 20 ранжи­руемых испытуемых, то некоторые из них неизбежно получат одинако­вые ранги. Все многообразие жизни не может уместиться в 3 градации, поэтому в один и тот же класс могут попасть люди, достаточно серьез­но различающиеся между собой. С другой стороны, принудительное ранжирование, то есть образование последовательности из многих ис­пытуемых, может искусственно преувеличивать различия между людь­ми. Кроме того, данные, полученные в разных группах, могут оказаться несопоставимыми, так как группы могут изначально различаться по уровню развития исследуемого качества, и испытуемый, получивший в одной группе высший ранг, в другой получил бы всего лишь средний, и т.п.

Выход из положения может быть найден, если задавать доста­точно дробную классификационную систему, скажем, из 10 классов, или градаций, признака. В сущности, подавляющее большинство психологи­ческих методик, использующих экспертную оценку, построено на изме­рении одним и тем же "аршином" из 10, 20 или даже 100 градаций разных испытуемых в разных выборках.

Итак, единица измерения в шкале порядка - расстояние в 1 класс или в 1 ранг, при этом расстояние между классами и рангами может быть разным (оно нам неизвестно). К данным, полученным по поряд­ковой шкале, применимы все описанные в данной книге критерии и ме­тоды.

Интервальная шкала - это шкала, классифицирующая по прин­ципу "больше на определенное количество единиц - меньше на опреде­ленное количество единиц". Каждое из возможных значений признака отстоит от другого на равном расстоянии.

Можно предположить, что если мы измеряем время решения за­дачи в секундах, то это уже явно шкала интервалов. Однако на самом деле это не так, поскольку психологически различие в 20 секунд между испытуемым А и Б может быть отнюдь не равно различию в 20 се­кунд между испытуемыми Б и Г, если испытуемый А решил задачу за 2 секунды, Б - за 22, В - за 222, а Г - за 242.

Аналогичным образом, каждая секунда после истечения полутора минут в опыте с измерением мышечного волевого усилия на динамомет­ре с подвижной стрелкой, по "цене", может быть, равна 10 или даже более секундам в первые полминуты опыта. "Одна секунда за год идет" - так сформулировал это однажды один испытуемый.

Попытки измерять психологические явления в физических едини­цах - волю в секундах, способности в сантиметрах, а ощущение собст­венной недостаточности - в миллиметрах и т. п., конечно, понятны, ведь все-таки это измерения в единицах "объективно" существующего времени и пространства. Однако ни один опытный исследователь при этом не обольщает себя мыслью, что он совершает измерения по психо­логической интервальной шкале. Эти измерения принадлежат по-прежнему к шкале порядка, нравится нам это или нет (Стивене С, 1960, с.56; Паповян С.С., 1983, с.63; Михеев В.И.: 1986, с.28).

Мы можем с определенной долей уверенности утверждать лишь, что испытуемый А решил задачу быстрее Б, Б быстрее В, а В быстрее Г.

Аналогичным образом, значения, полученные испытуемыми в баллах по любой нестандартизованной методике, оказываются измерен­ными лишь по шкале порядка. На самом деле равноинтервальными можно считать лишь шкалы в единицах стандартного отклонения и про-центильные шкалы, и то лишь при условии, что распределение значений в стандартизующей выборке было нормальным (Бурлачук Л. Ф., Мо­розов С. М., 1989, с. 163, с. 101).

Принцип построения большинства интервальных шкал построен на известном правиле "трех сигм": примерно 97,7-97,8% всех значений признака при нормальном его распределении укладываются в диапазоне М±3σ Можно построить шкалу в единицах долей стандартного откло­нения, которая будет охватывать весь возможный диапазон изменения признака, если крайний слева и крайний справа интервалы оставить открытыми.

Р.Б. Кеттелл предложил, например, шкалу стенов - "стандартной десятки". Среднее арифметическое значение в "сырых" баллах прини­мается за точку отсчета. Вправо и влево отмеряются интервалы, равные 1/2 стандартного отклонения. На Рис. 1.2 представлена схема вычисле­ния стандартных оценок и перевода "сырых" баллов в стены по шкале N 16-факторного личностного опросника Р. Б. Кеттелла.

Справа от среднего значения будут располагаться интервалы, равные 6, 7, 8, 9 и 10 стенам, причем последний из этих интервалов открыт. Слева от среднего значе­ния будут располагаться интервалы, равные 5, 4, 3, 2 и 1 стенам, и крайний интервал также открыт. Теперь мы поднимаемся вверх, к оси "сырых баллов", и размечаем границы интервалов в единицах "сырых" баллов. Поскольку М=10,2; σ=2,4, вправо мы откладываем 1/2σ, т.е. 1,2 "сырых" балла. Таким образом, гра­ница интервала составит: (10,2 + 1,2) = 11,4 "сырых" балла. Итак, границы ин­тервала, соответствующего 6 стенам, будут простираться от 10,2 до 11,4 баллов. В сущности, в него попадает только одно "сырое" значение - 11 баллов. Влево от средней мы откладываем 1/2 σ и получаем границу интервала: 10,2-1,2=9. Таким образом, границы интервала, соответствующие 9 стенам, простираются от 9 до 10,2. В этот интервал попадают уже два "сырых" значения - 9 и 10. Если испы­туемый получил 9 "сырых" баллов, ему начисляется теперь 5 стенов; если он по­лучил 11 "сырых" баллов - 6 стенов, и т. д.

Мы видим, что в шкале стенов иногда за разное количество "сырых" баллов будет начисляться одинаковое количество стенов. Например, за 16, 17, 18, 19 и 20 баллов будет начисляться 10 стенов, а за 14 и 15 - 9 стенов и т. д.

В принципе,шкалу стенов можно построить по любым данным, измеренным по крайней мере в порядковой шкале, при объеме выборки п>200 и нормальном рас­пределении признака.

Другой способ построения равноинтервальной шкалы - группировка интервалов по принципу равенства накопленных частот. При нормальном распределении при­знака в окрестности среднего значения группируется большая часть всех наблюде­ний, поэтому в этой области среднего значения интервалы оказываются меньше, уже, а по мере удаления от центра распределения они увеличиваются, (см. Рис. 1.2). Следовательно, такая процентильная шкала является равноинтервальной толь­ко относительно накопленной частоты (Мельников В.М., Ямпольский Л.Т., 1985, с. 194).

Построение шкал равных интервалов по данным, полученным по шкале порядка, напоминает трюк с веревочной лестницей, на который ссылался С. Стивене. Мы сначала поднимаемся по лестнице, которая ни на чем не закреплена, и добираемся до лестницы, которая закрепле­на. Однако каким путем мы оказались на ней? Измерили некую психо­логическую переменную по шкале порядка, подсчитали средние и стан­дартные отклонения, а затем получили, наконец, интервальную шкалу. "Такому нелегальному использованию статистики может быть дано из­вестное прагматическое оправдание; во многих случаях оно приводит к плодотворным результатам" (Стивене С, 1960, с. 56).

Многие исследователи не проверяют степень совпадения получен­ного ими эмпирического распределения с нормальным распределением, и тем более не переводят получаемые значения в единицы долей стан­дартного отклонения или процентили, предпочитая пользоваться "сырыми" данными. "Сырые" же данные часто дают скошенное, срезан­ное по краям или двухвершинное распределение. На Рис. 1.3 представле­но распределение показателя мышечного волевого усилия на выборке из 102 испытуемых. Распределение с удовлетворительной точностью мож­но считать нормальным (χ 2 =12,7, при v=9, M=89,75, σ= 25,1).

На Рис. 1.4 представлено распределение показателя самооценки по шкале методики Дж. Менестера - Р.Корзини "Уровень успеха, ко­торого я должен был достичь уже сейчас" (n=356). Распределение зна­чимо отличается от нормального (χ 2 =58,8, при v=7; p< 0,01; М=80,64; σ =16,86).

С такими "ненормальными" распределениями приходится встре­чаться очень часто, чаще, может быть, чем с классическими нормаль­ными. И дело здесь не в каком-то изъяне, а в самой специфике психо­логических признаков. По некоторым методикам от 10 до 20% испы­туемых получают оценку "ноль" - например, в их рассказах не встреча­ется ни одной словесной формулировки, которая отражала бы мотив "надежда на успех" или "боязнь неудачи" (методика Хекхаузена). То, что испытуемый получил оценку "ноль", нормально, но распределение таких оценок не может быть нормальным, как бы мы ни увеличивали объем выборки (см. п. 5.3).

Методы статистической обработки, предлагаемые в настоящем руководстве, в большинстве своем не требуют проверки совпадения по­лученного эмпирического распределения с нормальным. Они построены на подсчете частот и ранжировании. Проверка необходима только в случае применения дисперсионного анализа. Именно поэтому соответст­вующая глава сопровождается описанием процедуры подсчета необхо­димых критериев.

Во всех остальных случаях нет необходимости проверять степень совпадения полученного эмпирического распределения с нормальным, и тем более стремиться преобразовать порядковую шкалу в равноинтервальную. В каких бы единицах ни были измерены переменные - в се­кундах, миллиметрах, градусах, количестве выборов и т. п. - все эти данные могут быть обработаны с помощь непараметрических критери­ев, составляющих основу данного руководства.

Шкала равных отношений - это шкала, классифицирующая объекты или субъектов пропорционально степени выраженности изме­ряемого свойства. В шкалах отношений классы обозначаются числами, которые пропорциональны друг другу: 2 так относится к 4, как 4 к 8. Это предполагает наличие абсолютной нулевой точки отсчета. В физике абсолютная нулевая точка отсчета встречается при измерении длин от­резков или физических объектов и при измерении температуры по шка­ле Кельвина с абсолютным нулем температур. Считается, что в психо­логии примерами шкал равных отношений являются шкалы порогов аб­солютной чувствительности (Стивене С, 1960; Гайда В. К., Захаров В. П., 1982). Возможности человеческой психики столь велики, что трудно представить себе абсолютный нуль в какой-либо измеряемой психологической переменной. Абсолютная глупость и абсолютная чест­ность - понятия скорее житейской психологии.

То же относится и к установлению равных отношений: только метафора обыденной речи допускает, чтобы Иванов был в 2 раза (3, 100, 1000) умнее Петрова или наоборот.

Абсолютный нуль, правда, может иметь место при подсчете ко­личества объектов или субъектов. Например, при выборе одной из 3 альтернатив испытуемые не выбрали альтернативу А ни одного раза, альтернативу Б - 14 раз и альтернативу В - 28 раз. В этом случае мы можем утверждать, что альтернативу В выбирают в два раза чаще, чем альтернативу Б. Однако при этом измерено не психологическое свойст­во человека, а соотношение выборов у 42 человек.

По отношению к показателям частот возможно применять все арифметические операции: сложение, вычитание, деление и умножение. Единица измерения в этой шкале отношений - 1 наблюдение, 1 выбор, 1 реакция и т. п. Мы вернулись к тому, с чего начали: к универсальной шкале измерения в частотах встречаемости того или иного значения признака и к единице измерения, которая представляет собой 1 наблю­дение. Расклассифицировав испытуемых по ячейкам номинативной шка­лы, мы можем применить потом высшую шкалу измерения - шкалу от­ношений между частотами.

Распределение признака. Параметры распределения

Распределением признака называется закономерность встречаемо­сти разных его значений (Плохинский Н.А., 1970, с. 12).

В психологических исследованиях чаще всего ссылаются на нор­мальное распределение.

Нормальное распределение характеризуется тем, что крайние зна­чения признака в нем встречаются достаточно редко, а значения, близ­кие к средней величине - достаточно часто. Нормальным такое распре­деление называется потому, что оно очень часто встречалось в естест­веннонаучных исследованиях и казалось "нормой" всякого массового случайного проявления признаков. Это распределение следует закону, открытому тремя учеными в разное время: Муавром в 1733 г. в Англии, Гауссом в 1809 г. в Германии и Лапласом в 1812 г. во Франции (Плохинский Н.А., 1970, с.17). График нормального распределения представляет собой привычную глазу психолога-исследователя так на­зываемую колоколообразную кривую (см. напр., Рис. 1.1, 1.2).

Параметры распределения - это его числовые характеристики, указывающие, где "в среднем" располагаются значения признака, на­сколько эти значения изменчивы и наблюдается ли преимущественное появление определенных значений признака. Наиболее практически важными параметрами являются математическое ожидание, дисперсия, показатели асимметрии и эксцесса.

В реальных психологических исследованиях мы оперируем не па­раметрами, а их приближенными значениями, так называемыми оценка­ми параметров. Это объясняется ограниченностью обследованных выбо­рок. Чем больше выборка, тем ближе может быть оценка параметра к его истинному значению. В дальнейшем, говоря о параметрах, мы будем иметь в виду их оценки.

Среднее арифметическое (оценка математического ожидания) вы­числяется по формуле:

i - индекс, указывающий на порядковый номер данного зна­чения признака;

п - количество наблюдений;

∑- знак суммирования.

Оценка дисперсии определяется по формуле:

где x i - каждое наблюдаемое значение признака;

Среднее арифметическое значение признака;

n - количество наблюдений.

Величина, представляющая собой квадратный корень из несме­щенной оценки дисперсии (S), называется стандартным отклонением или средним квадратическим отклонением. Для большинства исследова­телей привычно обозначать эту величину греческой буквой σ (сигма), а не S. На самом деле, σ - это стандартное отклонение в генеральной совокупности, a S - несмещенная оценка этого параметра в исследован­ной выборке. Но, поскольку S - лучшая оценка σ (Fisher R.A., 1938), эту оценку стали часто обозначать уже не как S, а как σ:

В тех случаях, когда какие-нибудь причины благоприятствуют более частому появлению значений, которые выше или, наоборот, ниже среднего, образуются асимметричные распределения. При левосторон­ней, или положительной, асимметрии в распределении чаще встречаются более низкие значения признака, а при правосторонней, или отрица­тельной - более высокие (см. Рис. 1.5).

Показатель асимметрии (A)вычисляется по формуле:

В тех случаях, когда какие-либо причины способствуют преиму­щественному появлению средних или близких к средним значений, об­разуется распределение с положительным эксцессом. Если же в рас­пределении преобладают крайние значения, причем одновременно и бо­лее низкие, и более высокие, то такое распределение характеризуется отрицательным эксцессом и в центре распределения может образоваться впадина, превращающая его в двувершинное (см. Рис. 1.6).

Показатель эксцесса (E) определяется по формуле:

Рис. 1.6. Эксцесс: а) положительный; 6) отрицательный

В распределениях с нормальной выпуклостью E=0.

Параметры распределения оказывается возможным определить только по отношению к данным, представленным по крайней мере в интервальной шкале. Как мы убедились ранее, физические шкалы длин, времени, углов являются интервальными шкалами, и поэтому к ним применимы способы расчета оценок параметров, по крайней мере, с формальной точки зрения. Параметры распределения не учитывают истинной психологической неравномерности секунд, миллиметров и других физических единиц измерения.

На практике психолог-исследователь может рассчитывать пара­метры любого распределения, если единицы, которые он использовал при измерении, признаются разумными в научном сообществе.

Если мы применяем параметрические методы (к примеру, формулу для расчета коэффициента корреляции Браве-Пирсона или дисперсионный анализ) которые следует применять только тогда, когда известно или доказано, что распределение признака является нормальным (Суходольский Г.В., 1972; Шеффе Г., 1980 и др.), то в этом случае нам необходимо убедиться в нормальности распределения результативного признака. Нормальность распределения результативного признака можно проверить путем расчета показателей асимметрии и эксцесса и сопоставления их с критическими значениями (Пустыльник Е.И., 1968, Плохинский Н.А.. 1970 и др.). Рассмотрим применение метода Е.И. Пустыльника на примере.
Действовать будем по следующему алгоритму:
рассчитаем критические значения показателей асимметрии и эксцесса по формулам Е.И. Пустыльника и сопоставим с ними эмпирические значения;
если эмпирические значения показателей окажутся ниже критических, сделаем вывод о том, что распределение признака не отличается от нормального.
Расчет эмпирических показателей асимметрии и эксцесса будем производить по формулам данным ранее.
Сначала сделаем расчет промежуточных значений, который удобно выполнять поэтапно, занося данные в таблицу (Таблица 3.6.).
Таблица 3.6. Расчет промежуточных значений № (*.¦ - *) (х. - х)2 (*, - *) (Л, -*)4 1 и 0,94 0,884 0,831 0,781 2 13 2,94 8,644 25,412 74,712 3 12 1,94 3,764 7,301 14,165 4 9 -1,06 1,124 -1,191 1,262 5 10 -0,06 0,004 -0,000 0,000 6 11 0,94 0,884 0,831 0,781 7 8 -2,06 4,244 -8,742 18,009 8 10 -0,06 0,004 -0,000 0,000 9 15 4,94 24,404 120,554 595,536 10 14 3,94 15,524 61,163 240,982 11 8 -2,06 4,244 -8,742 18,009 12 7 -3,06 9,364 -28,653 87,677 13 10 -0,06 0,004 -0,000 0,000 14 10 -0,06 0,004 -0,000 0,000 15 5 -5,06 25,604 -129,554 655,544 16 8 -2,06 4,244 -8,742 18,009 Суммы 161 102,944 30,468 1725,467
Для расчетов в таблице, необходимо значение среднего арифметического, которое вычисляется по формуле:
Л = - -¦¦¦-
п
где Xj - каждое наблюдаемое значение признака;
п - количество наблюдений. В данном случае:
* = 10,06 16
Стандартное отклонение (сигма) вычисляется по формуле:
п- 1
где х^ - каждое наблюдаемое значение признака; х - среднее значение (среднее арифметическое); п " количество наблюдений. В данном случае:
ст =
,02"944 = Д893 = 2,62
V 16-1
Подставляя в формулы для расчета А и Е полученные значения n, с и соответствующие
значения из таблицы, получаем:
. +30,468 Л _
А = г = +0,106
16 2,62
16 2,62
Теперь рассчитаем критические значения для показателей А и Е по формулам Е.И. Пустыльника:
V(« + l)-(n + 3)
Ар =3"- V "
Е«Р ~5 Л|/_ . ,42
24 я (я - 2) (я - 3) (и + I)2 (я + 3) (и + 5) где п - количество наблюдений.
В данном случае:
(16 + 1) (16 + 3) V 323
I *qrrr
89
-кр
I 2416-(16-2) (16-3) _5 169888 ?кр_5"^(16 + 1)2-(16+3)(16 + 5) V115311
Аамп=0,Ю6
"-эмп^-гл-кр
Еэмп -0,71 1 Еэмп^Екр
Так как эмпирические значения А и Е меньше критических значений, то можно сделать следующий вывод: распределение результативного признака в данном примере не отличается от нормального распределения.

1. Понятие нормального распределения. Историческая справка

2. Стандартизация и нормализация данных

3. Проверка нормальности распределения

4. Разработка тестовых шкал

5. Функция Лапласа и ее использование. Правило 3σ.

1. Нормальный закон распределения играет важнейшую роль в применении статистических методов в психологии. Он лежит в основе измерений, разработки тестовых шкал, методов проверки гипотез.

Нормальное распределение подчиняется закону, который был открыт в разное время учеными Муавром (в 1733 г.), Гауссом (в 1809 г.) и Лапласом (в 1812 г.)

Де Муавр пытался решить следующую задачу: предположим, что подбрасывается симметричная монета 10 раз. Какова вероятность того, что в результате подбрасываний “орел” может выпасть 0 раз, 1 раз, …, 10 раз? Вероятности можно вычислить (по формуле Бернулли), но вычисления для большого количества подбрасываний становятся достаточно трудными. Задача, которую ставил перед собой де Муавр, состояла в том, чтобы найти уравнение кривой, которая бы хорошо аппроксимировала кривую, полученную соединением концов отрезков на графике распределения вероятностей получения определенного числа “орлов” при 10 подбрасываниях монеты:

Если бы такую кривую удалось бы найти, то проблемы вычисления вероятностей можно было бы замениять простым считыванием точек с кривых или просмотром чисел в математической таблице. Ему удалось показать, что уравнение кривой, проходящей совсем близко от кривой, соединяющей концы точек на графике (рис.1) имеет следующую формулу:

f(x)= , (*)

где π=3,14, е=2,718 – постоянные величины. Эта формула и соответствующая ей кривая впоследствии получили название нормального распределения.

История применения закона нормального распределения в социальных и биологических науках начинается с работы бельгийского ученого А.Кетле «опыт социальной физики» (1835г.). В ней он доказывал, что такие явления, как продолжительность жизни, рост человека, возраст вступления в брак и появления первого ребенка и т.д., подчиняется строгой закономерности, которую он назвал «законом уклонения от средней величины». Ф.Гальтон, двоюродный брат Ч.Дарвина, проявление нормального закона рассматривал в связи с биологической изменчивостью, наследственностью и отбором. В дальнейшем он и его последователи доказали, что психологические особенности, например способности, также подчиняются нормальному закону. Поэтому дальнейшее развитие измерительного подхода в психологии и статистического аппарата проверки гипотез происходило на базе этого общего закона.



Т.е., начиная со второй половины XIX века измерительные и вычислительные методы в психологии разрабатываются на основе следующего принципа: если индивидуальная изменчивость некоторого свойства есть следствие действия множества причин, то распределение частот для всего многообразия проявлений этого свойства в генеральной совокупности соответствует кривой нормального распределения . Это и есть закон нормального распределения.

2. Каждому биологическому (в т.ч. и психологическому) свойству соответствует свое распределение в генеральной совокупности. Чаще всего оно является нормальным.

График уравнения (*) – симметричная, колоколообразнаякривая, которую называют нормальной кривой с параметрами М и σ, которые отличают друг от друга бесконечное множество нормальных кривых. Величина М соответствует среднему распределения частот генеральной совокупности (математическому ожиданию) и задает пололжение кривой на числовой оси, а σ – стандартному отклонению этого распределения и задает ширину этой кривой.


2 3 σ 1 =σ 3 , σ 1 <σ 2

Если М=0, σ=1, то такое нормальное распределение называется нормированным (стандартным, единичным нормальным), т.е.

Все многообразие нормальных распределений может быть сведено к одной кривой, если применить стандартизацию данных ко всем возможным измерениям свойств. Стандартизация – это процедура унификации, т.е. приведение к единым нормативам.

Стандартизация или z-преобразование данных – это перевод измерений в стандартную Z-шкалу со средним М z =0 и σ z =1. Сначала для переменной, измеренной на выборке, вычисляется и стандартное отклонение σ х. Затем все значения переменной x i пересчитываются по формуле: z i = . Величина z= называется единичным стандартным отклонением .

В результате преобразованные значения (z-значения) непосредственно выражаются в единицах стандартного отклонения от среднего. Если для одной выборки несколько признаков переведены в z-значения, появляется возможность сравнения уровня выраженности разных признаков у того или иного испытуемого. Для того, чтобы избавиться от неизбежных отрицательных и дробных значений, можно перейти к любой другой известной шкале: IQ ( σ=15), Т-оценок ( σ=10), 10-бальной стенов - ( σ=2) и др. Перевод в новую шкалу ос уществляется путем умножения каждого z-значения на заданную σ и прибавления среднего:

s i = σ s z i + s .

При стандартизации каждое свойство будет иметь среднее 0 и стандартное отклонение 1, т.е. будет являться единичным нормальным распределением, которое используется как стандарт (эталон).

Свойства стандартного распределения:

1. Единицей измерения является стандартное отклонение.

2. Кривая приближается к оси Z по краям асимптотически – никогда не пересекая ее.

3. Кривая симметрична относительно М=Z=0. Ее Е k =А s =0, т.к. она симметрична и средневершинна.

4. Кривая имеет характерный изгиб: точка перегиба лежит точно на расстоянии в одну σ от М.

5. Площадь между кривой и осью Z равна 1.


3 -2 -1 0 1 2 3 Z

Вершина нормированной кривой f≈0,3989.

Пятое свойство объясняет название единичное нормальное распределение, благодаря нему площадь под кривой интерпретируется как вероятность, или относительная частота. Действительно, вся площадь под кривой соответствует вероятности того, что признак примет любое значение из всего диапазона его изменчивости (от - ∞ до +∞).

Нормированная кривая позволяет увидеть общее свойство любых кривых нормального распределения – это то, что они имеют одинаковую долю площади под кривой между одними и теми же двумя значениями признака, выраженными в единицах стандартного отклонения, а именно:

1. ≈68% площади под кривой находится в пределах одной σ от среднего, т.е. М ;

2. ≈95% площади под кривой находится в пределах двух σ от среднего, т.е. М ;

3. ≈99,73% площади под кривой находится в пределах трех σ от среднего, т.е. М .


М-3σ М-2σ М-σ М М+σ М+2σ М+3σ Z

Для единичного нормального распределения значение Х указывает, что точка отстоит от среднего на Х единиц. Зная свойства единичного нормального распределения, можем ответить на вопросы: какая доля генеральной совокупности имеет выраженность свойства, например, от –σ до +σ; или какова вероятность того, что случайно выбранный представитель ген. совокупности будет иметь выраженность свойства, на 3σ превышающую среднее значение и т.д. В первом случае – это 68%, а во втором – (100 – 99,72)/2=0,14%. (См. график)

Существует специальная таблица, позволяющая определить площадь под кривой справа от любого положительного значения z. Пользуясь ею, можно определить вероятность встречаемости значений признака из любого диапазона. Это широко используется при интерпретации данных тестирования.

Пример 1. Значение IQ по шкале Векслера (М=100, σ=15) некоторого испытуемого равнно 125. Вопрос: как часто встречаются значения IQ выше 125?

Перейдем от шкалы IQ к единицам стандартного отклонения:

z=(125 – 100)/15=1,66.

По таблице находим площадь под кривой справа от этого значения, она равна 0,0485. Это значит, что IQ 125 и выше встречается редко – менее, чем в 5% случаев.

Пример 2. Какова вероятность того, что случайно выбранный человек будет иметь IQ по шкале Векслера в интервале от 100 до 120.

В единицах стандартного отклонения z 1 =0 и z 2 =1,33. Площадь справа от z 1 равна 0,5 и справа от z 2 - 0,918, тогда площадь между z 1 и z 2 равна 0,918– 0,5 = 0,4082. Т.е. вероятность того, что случайно выбранный человек будет иметь IQ по шкале Векслера в интервале от 100 до 120, равна 0, 41.

Иногда складывается неправильное мнение, что существует обязательная связь между нормальным распределением – идеальным описанием некоторых распределений частот – и практически любыми данными. Нормальная кривая – это изобретение математика, довольно хорошо описывающее полигон частот измерений нескольких различных переменных. Никогда не была (и не будет) получена совокупность данных, которые бы были точно нормально распределены. Но иногда полезно утверждать, допуская незначительную ошибку, что рассматриваемая переменная распределена нормально. Существует множество методов, позволяющих анализировать данные без всякого предположения о виде распределения, как выборки, так и генеральной совокупности. Но есть три важных аспекта применения нормального распределения:

1. Проверка нормальности выборочного распределения для принятия решения о том, в какой шкале измерен признак – в метрической или порядковой.

2. Разработка тестовых шкал.

3. Статистическая проверка гипотез, в том числе – при определении риска принятия неверного решения.

3 . Для проверки нормальности используют различные процедуры, позволяющие выяснить отличается ли выборочное распределение измеренной величины от нормального или нет. Необходимость такого сопоставления возникает, когда мы сомневаемся, в какой шкале представлен признак, что очень важно для выбора методов анализа данных. Если исследователь принимает решение ранжировать данные, принимая их измеренными в порядковой шкале, то он может потерять часть исходной информации о различиях между испытуемыми, о взаимосвязях между признаками и т.д. Кроме того, метрические данные позволяют использовать значительно широкий набор методов анализа.

Как следствие закона нормального распределения можно рассматривать следующий вывод:

Если выборочное распределение не отличается от нормального, то это значит, что измеряемое свойство измерено в метрической шкале (чаще всего в интервальной).

Общей причиной отклонения формы выборочного распределения признака от нормального чаще всего является особенность процедуры измерения: используемая шкала может обладать неравномерной чувствительностью к измеряемому свойству в разных частях диапазона его изменчивости. Например, при измерении некоторого признака при решении задач за определенное время, если задачи простые, то большая часть испытуемых, решит все или почти все задания, и такая процедура измерения будет чувствительна только к тем, кому они достаточно трудны. В итоге получим распределение с правосторонней асимметрией.

Другой причиной отклонения от нормальности может являться наличие экстремальных значений. Такими можно считать значения признака, отличающиеся от среднего более чем на 2σ (при 50) и более чем на 3σ (при Если таких значений не много, то можно исключить из выборки.

Существует несколько способов проверки нормальности, рассмотрим некоторые из них.

Графический способ. Строят либо квантильные графики, либо графики накопленных частот. Квантильные графики строятся следующим образом. Сначала определяются эмпирические значения признака, соответствующие 5,10, …, 95-процентилю. Затем по таблице для каждого их них находятся z-значения (теоретические). Эти два ряда чисел задают координаты точек на графике: эмпирические значения откладываются на оси ОХ, а соответствующие им теоретические – на оси ОУ. Для нормального распределения все точки должны лежать на одной прямой или рядом с ней. Чем ближе точки расположены к прямой, тем больше распределение соответствует нормальному.

Аналогично строятся графики накопленных частот. При этом на оси ОХ через равные интервалы откладываются значения накопленных частот, например 0,05; 0,1;…0,95. Затем определяются эмпирические значения, соответствующие каждому значению накопленной частоты, которые переводятся в z-значения. По таблице определяются накопленные частоты для каждого z-значения, которые и откладываются на оси ОУ. Если точки лежат почти на одной прямой, то данное распределение соответствует нормальному.

Критерии асимметрии и эксцесса . Эти критерии определяют допустимую степень отклонения эмпирических значений асимметрии и эксцесса от нулевых значений, соответствующих нормальному распределению. Величина допустимых отклонений определяется так называемыми стандартными ошибками асимметрии и эксцесса. Для асимметрии и эксцесса стандартные ошибки определяются по формулам: А ssd =3 , Е k sd =5 , где – объем выборки.

Выборочные значения асимметрии и эксцесса не отличаются от нуля, если они не превышают по абсолютной величине значения своих стандартных ошибок. Это и будет признаком соответствия выборочного распределения нормальному закону.

Статистический критерий нормальности Колмагорова-Смирнова . Данный критерий позволяет оценить вероятность того, что данная выборка принадлежит генеральной совокупности с нормальным распределением. Если эта вероятность р≤0,05, о данное эмпирическое распределение существенно отличается от нормального, а если р>0,05, то делают вывод о приблизительном соответствии данного эмпирического распределения нормальному.

4 . Тестовые шкалы разрабатываются для того, чтобы оценить индивидуальный результат тестирования путем сопоставления его с тестовыми нормами, полученными на выборке стандартизации. Выборка стандартизации специально формируется для разработки тестовой шкалы – она должна быть репрезентативна генеральной совокупности, для которой планируется применять данный тест. Впоследствии будем считать, что и испытуемый, и выборка стандартизации принадлежат одной и той же генеральной совокупности.

Исходным принципом при разработке тестовой шкалы является предположение о том, что измеряемое свойство распределено в генеральной совокупности по нормальному закону. Поэтому измерение в тестовой шкале данного свойства на выборке стандартизации должно обеспечивать нормальное распределение, а значит, тестовая шкала будет являться интервальной. Если же это не так, то свойство удалось отразить в шкале порядка. Т.е., основная проблема стандартизации теста заключается в разработке такой шкалы, в которой распределение тестовых показателей на выборке стандартизации соответствовало бы нормальному распределению.

Исходные тестовые оценки – это количество ответов на вопросы тестов, время или количество решенных задач и т.д. Это первичные, «сырые» оценки. Итогом стандартизации являются тестовые нормы – таблицы пересчета «сырых» оценок в стандартные тестовые шкалы.

Существует множество стандартных тестовых шкал: z –шкала, стены, процентили, шкала Векслера (IQ) и др. Общим для них является соответствие нормальному распределению, а различаются они только средним значением и стандартным отклонением (который выступает, как масштаб, определяющий дробность шкалы).


4σ -3σ -2σ -σ М +σ +2σ +3σ

Тестовый показатель

4 -3 -2 -1 0 1 2 3

1 2 3 4 5 6 7 8 9 10

Процентили

1 5 10 20 30 40 50 60708090 95 99

Шкала Векслера

(IQ) 55 70 85 100 115 130 145

Стенайны


Общая последовательность стандартизации (разработки тестовых норм – таблицы пересчета «сырых» данных в стандартные тестовые) состоит в следующем:

1) определяется генеральная совокупность, для которой разрабатывается методика и формируется репрезентативная выборка стандартизации;

2) по результатам применения первичного варианта теста строится распределение «сырых» баллов;

3) проверяют соответствие полученного распределения нормальному закону;

4) если распределение «сырых» баллов соответствует нормальному, производится линейная стандартизация;

5) если распределение «сырых» баллов не соответствует нормальному, то производят перед линейной стандартизацией эмпирическую нормализацию или проводят нелинейную нормализацию.

Линейная стандартизация заключается в том, что определяются границы интервалов «сырых» оценок, соответствующие стандартным тестовым показателям. Эти границы вычисляются путем прибавления к среднему «сырых» оценок (или вычитанием из него) долей стандартных отклонений, соответствующих тестовой шкале.

Например. Пусть получено распределение «сырых» оценок, соответствующее нормальному, со средним М х = = 22 и σ х =6. В качестве стандартной тестовой шкалы выбрана 10-бальная шкала стенов, предложенная Р. Кеттелом (М st =5,5; σ st =2). Результатом линейной стандартизации должна быть таблица пересчета из шкалы «сырых» оценок в шкалу стенов. Для этого каждому стандартному значению ставится в соответствие интервал «сырых» оценок. Границы интервала определяются следующим образом. Среднее «сырых» оценок должно делить шкалу стенов пополам (1-5 ниже среднего, 6-10 – выше среднего). Т.е. среднее «сырых» оценок М х ==22 – это граница стенов 5 и 6. Следующая граница справа – отделяющая стены 6 и 7 – отстоит от среднего на σ st /2. Этой границе должна соответствовать граница «сырых» оценок М х + σ х /2= 22+3=25. Аналогично, определяются границы оставшихся интервалов, а границы крайних интервалов остаются открытыми. Результатом являются тестовые нормы – таблица пересчета «сырых» баллов в стандартные тестовые оценки:

Пользуясь этой таблицей тестовых норм «сырой» балл переводят в шкалу стенов, что позволяет интерпретировать выраженность измеряемого свойства.

В общем случае границы интервалов определяются по формуле z-преобразования:

z= = x i = M x + ( ,

где - искомая граница интервала «сырых» баллов, граница интервала в стандартной тестовой шкале, M x , - средние и стандартные отклонения «сырых» баллов (х) и стандартной шкалы (st).

Эмпирическая нормализация применяется, когда распределение «сырых» баллов отличается от нормального. Она заключается в изменении содержания тестовых заданий. Например, если «сырая» оценка – это количество задач, решенных испытуемыми за данное время, и получено распределение с правосторонней асимметрией, то это значит, что слишком большая доля испытуемых решает больше половины заданий. В этом случае необходимо либо добавить более трудные задания, либо сократить время решения.

Нелинейная нормализация применяется, если эмпирическая нормализация невозможна или нежелательна. Тогда перевод «сырых» оценок в стандартные производится через нахождение процентильных границ групп в исходном распределении, соответствующих процентильным границам групп в нормальном распределении стандартной шкалы. Каждому интервалу стандартной шкалы ставится в соответствие такой интервал шкалы «сырых» оценок, который содержит ту же процентную долю выборки стандартизации. Величины долей определяются по площади под единичной нормальной кривой, заключенной между соответствующими данному интервалу стандартной шкалы z-оценками.

Например, для того, чтобы определить, какой «сырой» балл должен соответствовать нижней границе стена 10, необходимо сначала выяснить, какому z-значению соответствует эта граница (z=2). Затем по таблице нормального распределения определяем, какая доля площади под кривой находится правее этого значения (0,023). После этого находим, какое значение отсекает 2,3% наибольших значений «сырых» баллов выборки стандартизации. Найденное значение и будет соответствовать границе 9 и 10 стена.

Пример . Пусть данный тест предполагает решение 20 заданий. Объем выборки стандартизации n=200 человек. Таблица распределения частот «сырых» оценок с правосторонней асимметрией:

В качестве стандартной возьмем шкалу стенайнов, для каждой градации которой известны процентные доли. Исходя их этих процентных долей и таблицы частот, строится таблица тестовых норм. Сначала отбираются 4% испытуемых, решивших наименьшее количество заданий. Это 8 человек, которые решили менее 4 заданий. Это число заданий будет соответствовать 1-му стенайну. Второму – результат следующих 7% (14) испытуемых: от 4 до 6 заданий и т.д. В итоге нелинейной стандартизации – таблица перевода «сырых» баллов шкальные, стенайны:

Изложенные основы психодиагностики позволяют сформулировать математически обоснованные требования к тесту. Тестовая методика должна содержать :

· описание выборки стандартизации;

· характеристику распределения «сырых» баллов с указанием среднего и стандартного отклонения;

· наименование, характеристику стандартной шкалы;

· тестовые нормы – таблицы пересчета «сырых» баллов в шкальные.

5 . Вспомним, нормальное распределение имеет следующую формулу

f(x)= , тогда функция распределения (из теории вероятостей) F(х)= , тогда функция распределения единичного нормального распределения F(х)= . Учитывая симметричность нормированного распределения, рассматривают следующую функцию

Ф(х)= , которая называется функцией Лапласа . Очевидно, что она нечетна, т.е. Ф(-х)=-Ф(х). Значения этой функции определяются по таблице. Эта функция помогает определить вероятность встречаемости значений признака в определенном интервале (а, в).

По теории вероятностей

Р(а<Х<в)= F(в)- F(а)= , если , то получим

Р(а <Х<в)=Ф() - Ф().

Тогда вероятность того, что отклонение значений признака от своего среднего не превысит утроенного стандартного отклонения, будет равна

Р(М-3σ <Х<М+3σ)= Ф() - Ф()= Ф() - Ф() = Ф()+ Ф() =2Ф(3)≈2 0,4987≈0,9973.

Т.е. вероятность того, что отклонение значений признака от своего среднего превысит утроенное стандартное отклонение, очень мала 0,0027, т.е. это может произойти только в 0,27% случаев, т.е. практически невозможно. В этом заключается правило 3σ :

если признак распределен по нормальному закону, то абсолютная величина его отклонения от своего среднего не превосходит утроенного среднеквадратичного отклонения .

На практике это используется следующим образом: если распределение изучаемой величины неизвестно, но правило 3σ выполняется, то есть основание полагать, что изучаемый признак распределн нормально (в противном случае – нет).


Закон нормального распределения, или как его еще называют – кривая Гаусса, является одним из основных столпов в теории вероятности. Его применение можно проследить практически во всех сферах современного человеческого знания, от физики до философии. Я же попробую в кратком обзоре на примерах, объяснить как можно применить этот принцип, при аналитике народных процессов в социологии.

Хотя точное вычисление кривой Гаусса и требует решения довольно сложного уравнения, в этом тексте знания высшей математики вам не потребуются. И так, давайте для начала поймем, в общих чертах, в чем смысл этого графика, на примере изображения, показанного в заголовке статьи. Закон нормального распределения показывает вероятность некоторого значения из некоторой градации этих самых значений. Ось X является цифровым представлением этой самой градации и уходит от нуля в обе стороны до относительной бесконечности (но в некоторых случая она жестка ограничена). Ось Y является показателем величины вероятности значения из градации и может быть от нуля до одного. Сложно? Нет, все просто, взгляните вот на этот график и вам станет все довольно ясно.



Допустим, вы идете по улице, хотите спросить что-то умное у прохожего, и обращаясь к случайному человеку, вы можете быть уверены в том, что с максимально вероятностью он будет человеком среднего ума, в меньшей вероятности, что он будет дураком или умником и в практически минимальной возможности – гением или откровенным тупицей.

Одним словом этот график показывает вероятностное распределение интеллектуальности общества. Таким образом, обратившись к любой позиции на графике, можно сказать, какова вероятность при переборе людей, встретить гения, умного или дурака.

Естественно этот график является просто примером, и может не иметь никакого отношения к реальности. Для реальной же картины подобного рода, должен работать целый статистический комитет. Как можно понять из приведенного примера, график может деформироваться, в ту или иную сторону, и представлять уже иную вероятность. Показанный же график, называется – Стандартным нормальным распределением, потому что такая форма кривой вероятности установлена самой природой. И если мы обратимся в мир биосферы, и будем оценивать разные вероятности, то обнаружим, что данная форма кривой будут доминировать.

В определении ЗНР я указал, что ось X уходит по обе стороны в бесконечность. Дело в том, что оценка, каких либо общественных величин методом живой статистики, является явлением, находящемся только в настоящем времени. Общество не стоит на месте, оно постоянно движется, развивается или деградирует, поэтому сейчас оно одно, завтра другое, а значит, будет и другая форма и положение кривой Гаусса. Если не уходить с позиции стандартного нормального распределения, то для демонстрации вышесказанного можно опереться на ту же кривую вероятности интеллектуальной развитости общества.

График представляет собой пример оценки интеллектуального развития общества за некоторый необъявленный промежуток времени. Зеленая кривая, находящаяся на нуле, показывает положение дел «раньше». Красная и синяя кривые показывают момент «сейчас». Две кривые (красная и синяя) показаны исключительно в качестве иллюстрации, так как в реальной ситуации будет только одна из них, ведь общество не может одновременно развиться и деградировать по одному и тому же критерию оценки. Разбор одной из кривых, например красной, покажет вот такую картину. Общество поумнело на две единицы градации, что стало причиной того, чтоте люди, которые раньше считались очень умными, стали обычным явлением, те, кого раньше считали гениями, стали частенько встречаться и уже не являются чем-то необычным, а не очень умные в былые времена люди стали считаться чуть ли не дегенератами. Полностью противоположная картина будет при оценке синей кривой. Ее кстати очень хорошо продемонстрировал фильм «Идиократия», в котором «человек со средним умом» попав в будущее, оказался умнейшим человеком на земле, потому что за столетия, общество умственно деградировало настолько, что уровень дегенерата в нем стал среднестатистическим.

На основе понимания и умения выстраивать эти графики, можно не только оценивать движение общества в прошлом, но и строить планы на будущее на основе осознания того, как должно быть. Например, усиленно рассматриваемую мной в последнее время проблему алкоголизации общества, можно привести вот в такой форме. (Это чисто мое субъективное мнение, сформированное не математической статистикой, а тем, что я лично вижу вокруг себя.)

Тут присутствует жесткое ограничение оси X , за пределами которого, толкование кривой становится бессмысленно. На приведенном графике я определил четкие границы рассматриваемого явления – от идейного трезвенника до запойного алкоголика. Ясно, что попытка оценить точку кривой за этим диапазоном невозможна, из-за отсутствия величины оценки. В умственном развитии, конечно, тоже есть границы диапазона, но правда такова, что он настолько велик, что проще определить его как бесконечность, нежели как ограниченную величину. Так же на графике видна деформация одной из кривых, что является естественным положением дел в отношении описываемого явления.

И так, на графике красной кривой, показано приблизительное положение дел с алкоголизацией Российского общества на данный момент времени. Зеленой линией демонстрируется положение вещей с употреблением алкоголя «как должно быть» в нормальном (здоровом и думающем) обществе. Таким образом, мы видим, очень печальное положение вещей в данный момент. Если начать перебирать людей поштучно, мы выясним, что наиболее часто среди них будут встречаться пассивные алкоголики (термин определенный мной в прошлой статье «Алкогольная арифметика с картинками», обозначающий человека регулярно (через день, раз в неделю, раз в месяц, неважно, важно то, что ему это нравиться и он на этом сидит) выпивающего независимо от количества выпиваемого).Приблизительно с равной вероятностью будут встречаться позволяющий себе выпить (т. е. равнодушные – предложат, выпьет, не предложат не будет) и алкоголики. С еще чуть меньшей вероятностью – совсем падшие и запойные алкоголики. Трезвенник при таком положение вещей - откровенный рецидив, а идейный трезвенник, так вообще явление крайне редкое. (Идейный трезвенник – человек который не просто ведет трезвый образ жизни, а несет при этом некую идеологию, например, прямо заявляет о принципах здорового общества.)

В нормальном же обществе (зеленая кривая), трезвенник должен быть нормой. С минимальным отрывом от него должен идти идейный трезвенник. А вот равнодушный человек, позволяющий не отказаться от рюмочки, уходит в область рецидива, и становиться чуть ли не врагом общества. Пассивных алкоголиков как вы понимаете в том обществе вообще нет, так как они не смогут в нем существовать (они будут откровенными врагами народа, из-за того что понижают этику и демографию общества). Последнее как раз и выражено деформацией зеленой кривой Гаусса.

Ясное дело, что в этом крохотном тексте просто невозможно уложить всю полноту возможных вариантов применения закона нормального распределения в социологии. Но я надеюсь, что почву для размышлений я дал.

На мой взгляд, знанием данного закона, должен обладать любой человек, хотя бы чуть-чуть задумывающийся о своем будущем. А ведь, как известно – свое будущее, прямо зависит от будущего общества в целом, т. е. среды, в которой мы все живем. И если каждый будет знать, куда, а главное как нужно идти, то это уже гарантия уверенности, что мы идем к чему-то лучшему.

________________________________________ ________________________________________ ____



Рекомендуем почитать

Наверх