О статистике и статистических данных

  • docx
  • 12.11.2021
Публикация на сайте для учителей

Публикация педагогических разработок

Бесплатное участие. Свидетельство автора сразу.
Мгновенные 10 документов в портфолио.

Иконка файла материала Л2-00808.docx

О статистике и статистических данных

 

Рассмотрим способ нахождения зависимости частоты заболе­ваемости жителей города бронхиальной астмой от качества возду­ ха (третий пример из сформулированных в начале предыдущего параграфа). Любому человеку понятно, что такая зависимость су­ществует. Очевидно, что чем хуже воздух, тем больше больных астмой. Но это качественное заключение. Его недостаточно для того, чтобы управлять уровнем загрязненности воздуха. Для управления требуются более конкретные знания. Нужно устано­вить, какие именно примеси сильнее всего влияют на здоровье людей, как связана концентрация этих примесей в воздухе с чис­лом заболеваний. Такую зависимость можно установить только экспериментальным путем: посредством сбора многочисленных данных, их анализа и обобщения.

При решении таких проблем на помощь приходит статистика.

Статистика - наука о сборе, измерении и анализе массовых количественных данных.

Существуют медицинская статистика, экономическая статис­тика, социальная статистика и другие. Математический аппарат статистики разрабатывает наука под названием математическая статистика.

Рассмотрим пример из области медицинской статистики.

Известно, что наиболее сильное влияние на бронхиально-легоч­ные заболевания оказывает угарный газ - монооксид углерода. Поставив цель определить эту зависимость, специалисты по меди­цинской статистике проводят сбор данных. Они собирают сведения из разных городов о средней концентрации угарного газа в атмос­фере и о заболеваемости астмой (число хронических больных на 1000 жителей). Полученные данные можно свести в таблицу, а также представить в виде точечной диаграммы (рис .3.31 ) .

1 Приведенные в примере данные не являются официальной статисти­кой, однако правдоподобны.

Рис. 3.3. Табличное и графическое представление статистических данных

 

Статистические данные всегда являются приближенными, усредненными. Поэтому они носят оценочный характер, но верно отражают характер зависимости величин. И еще одно важное за­мечание: для достоверности результатов, полученных путем ана­лиза статистических данных, этих данных должно быть много.

Из полученных данных можно сделать вывод, что при кон­центрации угарного газа до 3 мг /м3 его влияние на заболевае­мость астмой несильное. С дальнейшим ростом концентрации на­ ступает резкий рост заболеваемости.

А как построить математическую модель данного явления? Очевидно, нужно получить формулу, отражающую зависимость количества хронических больных Р от концентрации угарного газа С. На языке математики это называется функцией зависи­мости Р от С: Р(С). Вид такой функции неизвестен, ее следует искать методом подбора по экспериментальным данным.

Понятно, что график искомой функции должен проходить близко к точкам диаграммы экспериментальных данных. Строить функцию так, чтобы ее график точно проходил через все данные точки (рис.3.4,а), не имеет смысла. Во-первых, математический вид такой функции может оказаться слишком сложным. Во-вто­рых, уже говорилось о том, что экспериментальные значения яв­ляются приближенными. Отсюда следуют основные требования к искомой функции:

• она должна быть достаточно простой для использования ее в дальнейших вычислениях;

• график этой функции должен проходить вблизи экспери­ментальных точек так, чтобы отклонения этих точек от гра­фика были минимальны и равномерны (рис.3.4,6).

Рис. 3.4. Два варианта построения графической зависимости по экспериментальным данным

 

Полученную функцию, график которой приведен на рис.3.4,б, в статистике принято называть регрессионной моделью.