Лекция Регрессионная модель

  • docx
  • 04.10.2021
Публикация на сайте для учителей

Публикация педагогических разработок

Бесплатное участие. Свидетельство автора сразу.
Мгновенные 10 документов в портфолио.

Иконка файла материала Лекция Регрессионная модель.docx

Опорный конспект                                      11 класс

Тема урока: Регрессионная модель.

 

Цели урока:

1. Совершенствовать понятия о регрессионных моделях.

2. Развивать логическое мышление, память, внимание при изучении нового материала.

3. Воспитывать у учащихся аккуратность при записи в тетрадях, познавательный интерес к предмету.

 

Оборудование: ПК.

Тип урока: урок усвоения новых знаний.

Приемы обучения: рассказ, беседа, объяснение.

 

Ход урока.

Сообщение темы и целей урока.

 

1.      Описание регрессионной модели.

2.      Характеристика МНК (метод наименьших квадратов)

 

1.             Регрессионная модель – это функция, описывающая зависимость между количественными характеристиками сложных систем.

Получение регрессионной модели происходит в два этапа:

·         подбор вида функции;

·         вычисление параметров функции.

Первая задача не имеет строгого решения. Здесь может помочь опыт и интуиция исследователя, а возможен и "слепой" перебор из конечного числа функций и выбор лучшей из них.

Чаще всего выбор производится среди следующих функций:

у = ax+b – линейная функция;

y = ax2+bx+c – квадратичная функция (полином второй степени);

y = aln(x)+b – логарифмическая функция;

y = aebx - экспоненциальная функция;

y = axb - степенная функция.

 

Иногда используются полиномы и более высоких степеней, например, полином третьей степени имеет вид: .

Во всех этих формулах х - аргумент, у - значение функции, а, b, с, d - параметры функций. Ln(*) - натуральный логарифм, е - константа, основание натурального логарифма.

После выбора (сознательно или наугад) одной из предлагаемых функций, следующим шагом нужно подобрать параметры (a,b,c и пр.) так, чтобы функция располагалась как можно ближе к экспериментальным точкам.

На графике присутствует еще одна величина, полученная в результате построения тренда. Она обозначена как  R2. В статистике эта величина называется коэффициентом детерминированности. Именно она определяет, насколько удачной является полученная регрессионная модель.

 

  • R2 всегда заключен в диапазоне от 0 до 1.
  • Если R2 – 1, то функция точно проходит через табличные значения, если R2 = 0, то выбранный вид модели предельно неудачен. Чем ближе R2 к 1, тем удачнее регрессионная модель.

 

2.        Что значит "располагалась как можно ближе"? Ответить на этот вопрос - значит предложить метод вычисления параметров. Такой метод был предложен в XVIII веке немецким математиком К. Гауссом. Он называется методом наименьших квадратов (МНК). Суть его заключается в следующем: искомая функция должна быть построена так, чтобы сумма квадратов отклонений у-координат всех экспериментальных точек от у-координат графика функции была бы минимальной.

МНК очень широко используется в статистической обработке данных и встроен во многие математические пакеты программ. Важно понимать следующее: методом наименьших квадратов по данному набору экспериментальных точек можно построить любую  функцию. А вот будет ли она нас удовлетворять, это уже другой вопрос — вопрос критерия соответствия. На рис. 3 изображены три функции, построенные методом наименьших квадратов.

а)

б)

в)

Рис. 3  Использование метода наименьших квадратов

Данные рисунки получены с помощью MS Excel.

 

График регрессионной модели называется трендом. Английское слово trend можно перевести как общее направление, или тенденция.

Уже с первого взгляда хочется отбраковать вариант линейного тренда. График линейной функции — это прямая. Полученная по МНК прямая отражает факт роста функции, но по этому графику трудно что-либо сказать о характере этого роста. А вот квадратичный и экспоненциальный тренды ведут себя очень правдоподобно.

Теперь пора обратить внимание на надписи, присутствующие на графиках. Во-первых, это записанные в явном виде искомые функции — регрессионные модели:

·        линейная функция: ;

·        экспоненциальная функция: ;

·        квадратичная функция: .

На графиках присутствует еще одна величина, полученная в результате построения трендов. Она обозначена как R2. Именно она определяет, насколько удачной является полученная регрессионная модель. Коэффициент детерминированности всегда заключен в диапазоне от 0 до 1. Если он равен 1, то функция точно проходит через табличные значения, если 0, то выбранный вид регрессионной модели предельно неудачен. Чем R2 ближе к 1, тем удачнее регрессионная модель.

Из трех выбранных моделей значение R2 наименьшее у линейной. Значит, она самая неудачная. Значения же R2 у двух других моделей достаточно близки (разница меньше одной 0,01). Если определить погрешность решения данной задачи как 0,01, по критерию R2 эти модели нельзя разделить. Они одинаково удачны. Здесь могут вступить в силу качественные соображения.

 

Коротко о главном

1.        Метод наименьших квадратов используется для вычисления параметров регрессионной модели. Этот метод содержится в математическом арсенале электронных таблиц (в том числе и в MS Excel).

2.        Выбор типа регрессионной модели пользователь производит сам, а МНК позволяет построить функцию такого типа, наиболее близкую к экспериментальным данным.

3.        Характеристикой построенной модели является параметр R2 — коэффициент детерминированности. Чем его значение ближе к 1, тем модель лучше.

4.        Может оказаться, что несколько моделей имеют близкий параметр R2. В этом случае пользователь выбирает из них наиболее подходящую, исходя из эмпирических соображений.