лекц по методам стат анализа-редакт вас

  • doc
  • 30.05.2021
Публикация на сайте для учителей

Публикация педагогических разработок

Бесплатное участие. Свидетельство автора сразу.
Мгновенные 10 документов в портфолио.

Иконка файла материала лекц по методам стат анализа-редакт вас.doc

Введение в проблему статистического вывода

Любое исследование сводится к выявлению связи между переменными. Связь характеризуется своей силой и направлением, надежностью.

Надежность связи определяется тем, насколько вероятно, что обнаруженная в выборке связь будет вновь обнаружена

(подтвердится) на другой аналогичной выборке, извлеченной из той же генеральной совокупности.

Статистическая гипотеза — это утверждение относительно неизвестного параметра генеральной совокупности, которое формулируется для проверки надежности связи и которое можно проверить по известным выборочным статистикам — результатам исследования.

Статистические  гипотезы        подразделяются        на        нулевые         и альтернативные, направленные и ненаправленные.

Нулевая гипотеза – это гипотеза об отсутствие различий. Это то, что мы хотим опровергнуть ,если перед нами стоит задача доказать значимость различий . Обозначается как Но.

Статистическая значимость или р-уровень значимости (p-level) — основной результат проверки статистической гипотезы; это вероятность получения данного результата выборочного исследования при условии, что на самом деле для генеральной совокупности верна нулевая статистическая гипотеза — то есть связи нет; это вероятность того, что обнаруженная связь носит случайный характер, а не является свойством совокупности. Именно статистическая значимость, руровень значимости является количественной оценкой надежности связи: чем меньше эта вероятность, тем надежнее связь.

Чем меньше значение р-уровня, тем выше статистическая значимость результата исследования, подтверждающего научную гипотезу.

Факторы, влияющие на уровень значимости. Уровень значимости при прочих равных условиях выше (значение р-уровня меньше), если:

q  •        величина связи (различия) больше;

q  •        изменчивость признака (признаков) меньше; q •          объем выборки (выборок) больше.

Статистический критерий       (StatisticalTest)           —        это      инструмент определения уровня статистической значимости.

Эмпирические значение критерия – получаемое в результате расчетов по результатам проведенного исследования значение; Критические значение критерия – теоретическое распределение (квантили) в соответствии с р-уровнем статистической значимости (представлены в таблицах критических значений).

Число степеней свободы (degreesoffreedom— обозначается как df) — это количество возможных направлений изменчивости признака.

Таблица критических значений содержит значения (квантили) теоретического распределения, соответствующие наиболее важным — критическим значениям р-уровня (0,1; 0,05; 0,01 и т. д.) для различных чисел степеней свободы.

Статистическая ошибка – неверное (ошибочное) отклонение или принятие гипотезы.

Ошибки бывают І рода и II рода.

Ошибка, состоящая в том, что мы отклонили нулевую гипотезу, в то время как она верна, называется ошибкой І рода.

Ошибка, состоящая в том, что мы приняли нулевую гипотезу, в то время как она неверна, называется ошибкой II рода.

ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ 1.Позволяют прямо оценить различия в средних, полученных в двух выборках (t - критерий Стьюдента).

2.Позволяют прямо оценить различия в дисперсиях (критерий Фишера).

3.Позволяют выявить тенденции изменения признака при переходе от условия к условию (дисперсионный однофакторный анализ), но лишь при условии нормального распределения признака.

4.Позволяют оценить взаимодействие двух и более факторов в их влиянии на изменения признака (двухфакторный дисперсионный анализ).

5.Экспериментальные данные должны отвечать двум, а иногда трем, условиям: а) значения признака измерены по интервальной шкале;

б) распределение признака является нормальным;

                                       в)                  в                    дисперсионном                         анализе                  должно                              соблюдаться

требование равенства дисперсий в ячейках комплекса.

6.Математические расчеты довольно сложны.

7.Если условия, перечисленные в п.5, выполняются, параметрические критерии оказываются более мощными, чем непараметрические.

НЕПАРАМЕТРИЧЕСКИЕКРИТЕРИИ

1.    Позволяют оценить лишь средние тенденции, например, ответить на вопрос, чаще ли в выборке А встречаются более высокие, а в выборке Б - более низкие значения признака (критерии Q, U, φ* и др.).

2.    Позволяют оценить лишь различия в диапазонах вариативности признака (критерий φ*).

3.Позволяют выявить тенденции изменения признака при переходе от условия к условию при любом распределении признака (критерии тенденций L и S).

4.Не позволяют оценить взаимодействие двух и более факторов в их влияние на изменения признака 5.Экспериментальные данные могут:

а)    быть    представлены            в          любой шкале, начиная          от        шкалы наименований;

б) распределение признака может быть любым и совпадение его с каким-либо теоретическим законом распределения необязательно и не нуждается в проверке;

в) требование равенства дисперсий отсутствует.

6.Математические расчеты по большей части просты и занимают мало времени (за исключением критериев χ2 и λ).

Уровни статистической значимости:

р> 0,1 – Принимается Н0 – Статистически достоверные различия не обнаружены;

р< или = 0,1 - Сомнения в истинности Н0 – Различия обнаружены на уровне статистической тенденции;

р<                     или           =            0,05                   значимость,                        отклонение                 Н0      –                  обнаружены

статистически значимые (достоверные) различия;

р< или = 0,01 высокая значимость, отклонение Н0 – Различия обнаружены на высоком уровне

Статистические задачи

Условия

Статистический критерий

Выявление различий в уровне исследуемого признака

2 несвязанные выборки

U Критерий Манна-Уитни, критерий серий Вальда-

Вольфовица, двухвыборочный критерий Колмогорова-Смирнова

Оценка                         сдвигов               в уровне

исследуемого признака

2 связанные выборки

G               критерий                   знаков,            Т                    критерий

Вилкоксона

Выявление различий в уровне исследуемого признака

3              и              более       несвязанные выборки

Критерий Краскела-Уоллеса   и медианный тест

Оценка                         сдвигов               в уровне

исследуемого признака

3           и             более                 связанные

выборки

ANOVA Фридмана, коэффициент конкордации (согласия) Кендалла

Оценка    направления                и выраженности                взаимосвязи между признаками

-

Коэффициенты                                        корреляции                 r          -

Спирмена, t – Кендалла и gamma

Построение классификации признаков или испытуемых

-

Кластерный анализ

Нахождение структуры взаимосвязей между большим количеством переменными, позволяющим осуществить их редукцию и классификацию

-

Факторный анализ


 

ЛИТЕРАТУРА

1.                Наследов А.Д. Математические методы психологического исследования. Анализ и интерпретация данных. СПб., 2004;

2.                Сидоренко             Е.            Методы  математической     обработки              в психологии. СПб., 2002;

3.                Ермолаев О.Ю. Математическая статистика для психологов. М., 2003.


 

4.