Понятие о статистических гипотезах и критериях проверки гипотез


ПРИМЕРЫ РАЗЛИЧНЫХ КРИТЕРИЕВ И ПРАВИЛА РАБОТЫ С НИМИ

Loading...


бет3/3
Дата03.04.2020
өлшемі0.69 Mb.
1   2   3

ПРИМЕРЫ РАЗЛИЧНЫХ КРИТЕРИЕВ И ПРАВИЛА РАБОТЫ С НИМИ

Работа с двумя выборками.

1. Проверка гипотезы о равенстве математических ожиданий (средних) двух нормальных генеральных совокупностей (малые независимые выборки (независимые выборки - выборки, полученные для разных объектов, связанных определенным исследованием), двухвыборочный t-критерий Стьюдента).

t-критерий Стьюдента направлен на оценку различий величин и двух выборок Х1 и Х2, которые распределены по нормальному закону. Одним из главных достоинств критерия является широта его применения. Он может быть использован для сопоставления средних у зависимых и независимых выборок, причем выборки могут быть не равны по величине. В общем случае формула для расчета по t-критерию Стьюдента такова:

Постановка задачи: получены 2 независимые выборки из нормальных генеральных совокупностей случайных величин Х1 и Х2, их объемы n1 и n2.

По этим выборкам найдены , , и .

Требуется проверить гипотезу Н0: µ1= µ2.

Прежде чем проверить данную гипотезу необходимо определить равенство дисперсий рассматриваемых совокупностей.



2. Проверка гипотезы о равенстве дисперсий двух нормальных генеральных совокупностей (F-критерий Фишера-Снедекора).

Постановка задачи: пусть генеральные совокупности величин X1 и X2 распределены по нормальному закону. По независимым выборкам объемами n1 и n2, извлеченным из этих совокупностей, найдены выборочные дисперсии и . По этим дисперсиям при заданном уровне значимости α требуется проверить нулевую гипотезу, при этом генеральные дисперсии рассматриваемых совокупностей равны между собой:

Н0: D(X1)=D(X2).

Если окажется, что гипотеза Н0 справедлива, т.е. генеральные дисперсии одинаковы, то различие выборочных дисперсий незначимо и объясняется случайными причинами. Если Н0 будет отвергнута, т. е. если генеральные дисперсии неодинаковы, то различие выборочных дисперсий значимо. Оно не может быть объяснено случайными причинами, а является следствием различия самих генеральных дисперсий.

В качестве критерия (статистики) проверки нулевой гипотезы о равенстве генеральных дисперсий принимают величину:

(критерий F Фишера–Снедекора) (1)

где и - соответственно меньшее и большее значение выборочных дисперсий.

При использовании критерия (1) критическая область, как всегда, определяется видом конкурирующей гипотезы. Рассмотрим два случая.

1. Нулевая гипотеза Н0: D(X1)=D(X2).

Конкурирующая гипотеза Н1: D(X1)≠D(X2). Здесь критическая область двусторонняя.

2. Если есть основание предполагать, что одна из дисперсий обязательно не меньше другой, например, D(X1)≥D(X2), тогда нулевая гипотеза Н0: D(X1)=D(X2), а конкурирующая гипотеза Н1: D(X1)>D(X2). В данном случае критическая область правосторонняя. Если Н1: D(X1)2), критическая область левосторонняя.

При решении конкретных задач придерживаются следующих правил:

1. Чтобы при заданном уровне значимости α проверить нулевую гипотезу Н0: D(X1)=D(X2) при конкурирующей гипотезе Н1: D(X1)>D(X2), надо вычислить наблюдаемое значение критерия (отношение большей выборочной дисперсии к меньшей):

Далее по заданному α и числам степеней свободы df1=n1-1 и df2=n2-1 (n1 - объем выборки, для которой получена большая выборочная дисперсия) находят критическую точку Fкр.(α, df1, df2). Если Fнaбл.кр. - нет оснований отвергать Н0 и она принимается. Если же Fнaбл.>Fкр, то Н0 отвергают и полагают, что D(X1)>D(X2).

При работе со статистическими пакетами гипотезу Н0 принимают, если Р>α, в противном случае - нет.

2. При конкурирующей гипотезе Н1: D(X1)≠D(X2) критическую точку Fкp.(α/2, df1, df2) ищут по уровню значимости α/2. Если Fнaбл.кр. – нет оснований отвергать Н0. Если Fнaбл.>Fкр. - Н0 отвергают.

При известной вероятности Р гипотезу Н0 принимают, если Р>α=α/2+α/2.



Пример. Сравнительное исследование концентрации свинца в крови (в мг/100г) группы рабочих аккумуляторного завода Х1 (подвергавшихся профессиональному воздействию) и группы рабочих текстильной фабрики X2 (не подвергавшихся профессиональному воздействию), привело к следующим результатам:

=0,08157 мг/100г, S1=0,0067 мг/100г, =4,489·10-5, n=7

=0,03943 мг/100г, S2=0,00355 мг/100г, =1,26·10-5, n=7.

Числа степеней свободы df1=n1-1=7-1=6 и df2=n2-1=7-1=6.

Сформулируем вопрос: при уровне значимости α=0,05 проверить Н0: D(X1)=D(X2), при Н1: D(X1)≠D(X2).

По данным задачи, Fнабл.=4,489/1,26=3,56. Так как критическая область двусторонняя, то при отыскании критической точки следует брать уровень значимости в два раза меньший заданного, то есть α/2 = 0,025, тогда Fкр.=(0,025; 6; 6)=5,82.

Так как Fнaбл.кр., нет основания отвергнуть Н0 - D(X1)=D(X2).

Для расчета критерия Стьюдента используются следующие формулы с учетом равенства дисперсий и объемов выборок.


1) Дисперсии равны и объемы сравниваемых выборок различны, n1≠n2:

,

В этом случае число степеней свободы рассчитывается по формуле df= n1+n2-2.


2) Дисперсии равны и объемы сравниваемых выборок равны, n1=n2: .

В этом случае число степеней свободы рассчитывается по формуле df=2n-2.


3) Дисперсии не равны и объемы сравниваемых выборок различны, n1≠n2:

В этом случае число степеней свободы рассчитывается по формуле:


4) Дисперсии не равны и объемы сравниваемых выборок различны n1=n2:

В этом случае число степеней свободы рассчитывается по формуле:

В приведенных формулах и - дисперсии двух выборок, и – средние выборочные, n1 и n2 – объемы выборок.
Методика проверки гипотезы о различии средних двух независимых групп, которые распределены по нормальному закону.


  1. Выдвигаем нулевую и альтернативную:

Н0: µ1= µ2.

Н1: µ1≠µ2.



  1. Вычисляем и – средние выборочные, и - дисперсии двух выборок.

  2. По критерию Фишера-Снедекора проверяем гипотезу о равенстве дисперсий групп.

  3. На основании результата вышеприведенного пункта выбираем соответствующую формулы расчета критерия Стьюдента и числа степеней свободы.

  4. Из таблицы распределения Стьюдента с учетом заданного уровня значимости (=0,05; 0,01)и числа степеней свободы находим критическое значение.

  5. Принимается решение о принятии или отклонении Н0.

Если полученное значение tнабл. принадлежит критической области (tнабл>tкрит), то H0 отвергается: µ1 и µ2, а следовательно, и различаются значимо, т. е. их различие вызвано принципиальными причинами. Если tнабл. оказывается в области принятия нулевой гипотезы (tнаблкрит), то µ12 и различие выборочных средних незначимо и обусловлено случайными факторами.

Пример. Определить различие белка в составе плазмы крови здоровых и больных гепатитом. α=0,05.

X1 (норма)

6,87

6,51

6,9

7,05

7




X2 (гепатит)

7,2

6,92

7,52

7,18

7,25

7,1

Вычислим средние по двум выборкам:











I) Для прверки гипотезы о равенстве дисперсий двух групп используем критерий Фишера-Снедекора.

Выдвигаем нулевую и альтернативную гипотезы:

Н0: ,

H1: .

α=0,05


Вычислим значение F – критерия Фишера

Числа степеней свободы

df1=5-1=4

df2=6–1=5

По таблице Фишера найдем критическое значение: Fкрит (0,05; 4; 5)=5,19.

Fнаблкрит  Нет основания отвергнуть нулевую гипотезу Н0.



Вывод: .

Проведем проверку гипотезу о равенстве популяционных средних.

II) Н0 – µ12 (различие белка в составе плазмы крови здоровых и больных гепатитом отсутствует).

Н1 – µ1≠µ2 (есть различие белка в составе плазмы крови здоровых и больных гепатитом).



α=0,05

Найдем t-критерий:



α=0,05 и для степени свободы df=(n1-1)+( n2-1)=9 определим критическое значение tкрит=2,26.

tнабл > tкрит (2,63>2,26), то есть нулевая гипотеза отвергается.

Заключение: при нормальном распределении и α=0,05 (доверительной вероятности р=0,95) существует статистическое различие белка в составе плазмы крови здоровых и больных гепатитом.



Пример. Сравнительное исследование концентрации свинца в крови (в мг/100г) группы рабочих аккумуляторного завода Х1 (подвергавшихся профессиональному воздействию) и группы рабочих текстильной фабрики X2 (не подвергавшихся профессиональному воздействию), привело к следующим результатам:

=0,08157 мг/100г, S1=0,0067 мг/100г, =4,489·10-5, n=7

=0,03943 мг/100г, S2=0,00355 мг/100г, =1,26·10-5, n=7.

Число степеней свободы df=2*(7-1)=12.

Предполагается, что = и исследуемый показатель в генеральной совокупности распределен по нормальному закону.

При α=0,05 проверяется Н0: µ12 против альтернативы Н1: µ1≠µ2. В соответствии с вышеприведенными числовыми данными tнабл.=19,6, tдвухст. кр.=2,18. Так как tнабл.>tдвухст. кр., нулевая гипотеза отвергается с заданным уровнем значимости. То же подтверждает расчет P, P<0,05.

Вывод: условия работы значимо влияют на содержание свинца в крови рабочих.
3. Проверка гипотезы о равенстве средних двух нормальных генеральных совокупностей с неизвестными дисперсиями (зависимые выборки - выборки, полученные для одних и тех же объектов, связанных определенным исследованием).

Постановка задачи: пусть генеральные совокупности X1 и X2 распределены нормально, причем их дисперсии неизвестны. Требуется, используя зависимые выборки, при уровне значимости α, проверить основную гипотезу Н0: µ12 при альтернативе Н1: µ1≠µ2 или Н1: µ1> µ2, или Н1: µ1< µ2.



В этом случае используется парный двухвыборочный t-критерий Стьюдента с df=n-1 степенями свободы, который имеет вид:

, (5)

где , , , n – объем выборки.

Далее решение задачи находится тривиально: сравниваем tнабл., полученное по данным выборки из (5), и tкр. при разных вариантах критических областей. Например, если Н1: µ1≠µ2 и |tнабл.|двухст. кр., Н0 принимается, в противном случае принимается Н1. При возможности вычисления Р, Н0 принимается при Р>α.



Пример. Рассмотрим популяцию, состоящую из критически больных пациентов с циркуляторным шоком. Была получена выборка из 108 пациентов и у каждого из них измерялось Х1 - венозное рН и X2 - артериальное рН. Из клинического опыта известно, что для здоровых людей среднее венозное рН меньше, чем артериальное. Проверим, выполняется ли это соотношение для популяции больных с указанной выше патологией, используя парный t-критерий Стьюдента, примем Н0: µ12, а Н1: µ12.

По данным имеем что, =–0,04, Sd=0,1533, . Используя (5), получим, что tнабл.=–2,71, tлевост.кр.=–1,66 на уровне значимости α=0,05. Так как tнабл.левост.кр., то Н0 отвергается.

Вывод: в популяции критически больных пациентов среднее венозное рН и среднее артериальное рН значимо отличаются друг от друга, причем (рН)вен.<(рН)арт.. Это неравенство подтверждается медицинскими фактами.

Пример. Исследовали влияние препарата адельфан на артериальное давление в группе состоящей из шести больных. В результате эксперимента было получено 2 вариационных ряда систолического давления: 1 ряд – показатели, полученные до приема препарата, 2 ряд – показатели, полученные после приема препарата.

Контроль (до)

250

240

210

190

185

170

Эксперимент (после)

210

195

165

170

155

175

На сколько понижается систолическое давление после приема адельфана?
Н0 – µ12 (препарат адельфан не влияет на систолическое давление).

Н1 – µ1≠µ2 (препарат адельфан влияет на систолическое давление).

Вычислим разность пар:

xki (контроль)

хoi (эксперимент)

di (разность давления)

250

210

-40

240

195

-45

210

165

-45

190

170

-20

185

155

-30

170

175

5

Для ряда разности вычислим значения числовых характеристик:





Определим tнабл:

tкрит=2,57 найдем из распределения Стьюдента для α=0,05 и степени свободы n-1=5.

tнабл > tкрит – нулевая гипотеза отвергается, то есть адельфан понижает артериальное давление.

Заключение: при вероятности р=0,95 препарат адельфан понижает давление на 29,17/207,5*100%=14%.().

Для проверки нулевой гипотезы может служить интервальная оценка статистических параметров: доверительный интервал для генеральной средней или доверительный интервал для генеральной разности.

1. При сравнении выборочных средних рассчитываются доверительные интервалы для генеральной средней µ1 и µ2:



95% доверительный интервал для средних:

•Общая формула (большой размер выборки) ;



•Общая формула («небольшие» выборки) .

- доверительный интервал для генеральной средней µ1;

- доверительный интервал для генеральной средней µ2.

Где t05 берется для и отдельно для каждого среднего значения.

Если доверительные интервалы перекрывают друг друга, то разницу между и нельзя переносить на µ1 и µ2, поэтому нулевая гипотеза не отвергается, т.е. различия между вариантами признаются несущественными. Если доверительные интервалы не перекрывают друг друга, то различия между вариантами достоверны.

2. Нулевая гипотезу можно проверить также путем расчета доверительного интервала для генеральной разности D = µ1- µ2. для этого рассчитывают разность между выборочными средними d и ошибку разности средних.



Важно знать что:

- Выборочное распределение разницы двух выборочных средних, оба которых получены из больших выборок, приближено к нормальному.

- Центр этого выборочное распределение равен истинной разнице средних, .

95% доверительный интервал для разницы средних:

•Общая формула (большой размер выборки) ;

•Общая формула («небольшие» выборки) .

Стандартная ошибка разницы средних двух независимых выборок вычисляется иначе, чем для парных выборок:

- В парном дизайне мы сокращали количество данных от двух выборок до одного набора данных, который включал в себя разницу между спаренными наблюдениями.

- Формула для стандартной ошибки разницы (зависит от размера выборки двух групп и стандартного отклонения двух групп):



.

3. Если доверительный интервал для разности средних перекрывает нулевое значение и захватывает область отрицательных величин, то нулевая гипотеза не отвергается (различия между вариантами признаются несущественными). Если доверительный интервал лежит в области положительных величин, то Н0 отвергается, т.е. разность между выборочными средними признается достоверной.


Пример. Сравнение двух независимых групп: Исследование типов диеты «Низкоуглеводная диета по сравнению с низкожировой диетой среди страдающих тяжелой формой ожирения».

- 132 человека с тяжелой формой ожирения были случайно распределены в одну из двух групп диет.

- Участники наблюдались в течение 6 месяцев.

Научный вопрос: Связано ли изменение веса с типом диеты?






Диета




Низкоуглеводная

Низкожировая

Количество участников (n)

64

68

Среднее изменение веса (кг)

-5.7

-1.8

Вес после диеты минус вес до диеты

Стандартное отклонение изменения веса (кг)

8.6

3.9

95% ДИ для изменения веса

=

=

=

=

Выражаясь статистически, существует ли ненулевая разница изменения веса среди участников на низкожировой диете по сравнению с участниками на низкоуглеводной диете?

- 95% доверительные интервалы изменения веса в двух группах диет не пересекаются, но как количественно измерить эту разницу?

- Интересующие нас показатели не «спарены»: Разные участники в каждой группе.

- Для каждого участника было вычислено значение изменения веса (после диеты-до диеты): Но авторы сравнивают изменения веса в двух независимых группах!

Как вычислить доверительный интервал разницы показателей?

Поскольку обе выборки относительно большие (обе больше 60), мы знаем, что выборочное распределение выборочного среднего в двух группах близко к нормальному. Исходя из этого, разница показателей, которые распределены (приблизительно) нормально, имеет также нормальное распределение.

95% доверительный интервал для разницы средних:

Лучшая оценка разницы популяционных средних на основе двух выборок: . Здесь является средним значением изменения веса 64 участников на низкоуглеводной диете, а - среднее значение изменения веса 68 участников на низкожировой диете.



Итак, , поэтому формула для : , где - стандартная ошибка разницы двух выборочных средних.



Таким образом, в этом примере 95% доверительный интервал для истинного значения разницы популяционных средних :

По завершению исследования:

- «Участники на низкоуглеводной диете потеряли больше веса по сравнению с тем, кто был на низкожировой диете (95% доверительный интервал разницы потери веса между группами: от -1.6 до -6.2 кг; p<0.01».

- Таким образом, придерживающиеся низкоуглеводной диеты потеряли на 3.9 кг больше; после учета случайной вариабельности выборки эта дополнительное уменьшение веса по сравнению с низкожировой диетой может быть от 1.6 кг до 6.2 кг.

- Этот доверительный интервал не включает 0, предполагая наличие ассоциации на популяционном уровне между типом диеты (низкоуглеводная или низкожировая) и снижением веса.
Непараметрические критерии.

Непараметрическими называют критерии, использование которых не требует предварительного вычисления оценок неизвестных параметров распределения и даже приближенного значения закона распределения признака. Они могут применяться и тогда, когда распределение сильно отклоняется от нормального. С другой стороны, непараметрические критерии менее эффективны по сравнению с параметрическими, и поэтому их целесообразно использовать только в предварительных исследованиях.

Впервые непараметрические критерии применили в 30-х годах ХХ века. В последние 40-50 лет непараметрическая статистика быстро развивалась и находила все большее широкое применение в медицинских и биологических исследованиях. Они отличаются простотой проведения, для них не требуется вычислять какие-либо параметры распределения (средние значения, стандартные отклонения и др.).



Непараметрические критерии оценки - это совокупность статистических методов, которые позволяют оценить результаты исследований без вычисления общепринятых параметров (и т. д.).

Достоинства непараметрических методов (критериев) заключаются в том, что они не требуют знания характера распределения, могут применяться при любых распределениях, могут быть использованы при любом, даже небольшом числе наблюдений, применимы для признаков, имеющих количественное выражение, и признаков полуколичественного характера (например, степень тяжести и заболевания, результаты лечения и др.), относительно просты и не требуют проведения сложных расчетов, соответственно, экономят время при вычислении. Кроме того, непараметрические критерии обладают достаточной мощностью (чувствительностью).

В основе расчета непараметрических критериев лежит упорядочивание (ранжирование) имеющихся значений по отношению друг к другу, типа «больше-меньше» или «лучше-хуже». Это разграничение значений не предполагает точных количественных соотношений, а, следовательно, и ограничений на параметры и вид распределения. Поэтому для использования непараметрических критериев нужно меньше информации, нежели для критериев параметрических. В качестве оценок при непараметрических методах используются относительные характеристики - ранги, серии, знаки и др. Если в ситуации возможно применение параметрических критериев (нормальное распределение признака и незначительно различающееся разнообразие признака в совокупности), то им, как учитывающим большее количество информации, следует отдать предпочтение, так как они оказываются более мощными, чем непараметрические критерии, хотя и более трудоемкими.

Но это не означает, что повсеместно необходимо применять непраметрические методы анализа. Так как при нормальном распределении признака параметрические критерии обладают большей мощностью. При больших отличиях изучаемого распределения от нормального следует использовать непараметрические критерии.

Использование непараметрических критериев связано с такими понятиями, как «нулевая гипотеза» (Н0), уровень значимости, достоверность статистических различий. «Нулевая гипотеза» - это предположение о том, что в сравниваемых группах отсутствует различие в распределении частот. Уровень значимости - это такая вероятность, которую принимают за основу при статистической оценке гипотезы. В качестве максимального уровня значимости, при котором нулевая гипотеза еще отклоняется, принимается 5%. При уровне значимости более 5% «нулевая гипотеза» принимается, различия между сравниваемыми совокупностями принимаются статистически недостоверными, незначимыми.

Особого внимания заслуживает вопрос о мощности (чувствительности) критериев. Каждый из изучаемых критериев имеет характерную для себя мощность. Оценку значимости различий необходимо начинать с наименее мощного критерия. Если этот критерий опровергает нулевую гипотезу, то на этом анализ заканчивается. Если же нулевая гипотеза этим критерием не опровергается, то следует проверить изучаемую гипотезу более мощным критерием. Однако если значение характеристики, вычисленной для менее мощного критерия, оказалось очень далеким от критического значения, то мало надежды, что более мощный критерий опровергнет нулевую гипотезу.



Применение непараметрических методов статистического анализа целесообразно в следующих случаях:

  • на этапе разведочного анализа;

  • при малом числе наблюдений (до 30);

  • когда нет уверенности в соответствии данных закону нормального распределения.

Как правило, любой из параметрических критериев имеет аналог в непараметрической статистике.

Непараметрические критерии представлены следующими основными группами:

  • критерии различия между группами независимых выборок;

  • критерии различия между группами зависимых выборок.

Различия между независимыми группами.

Непараметрическими аналогами t- критерию Стьюдента являются: U критерий Манна-Уитни и двухвыборочный критерий Колмогорова - Смирнова.


U – критерий Манна – Уитни.

Критерий предназначен для оценки различий между двумя выборками по уровню какого-либо количественно измеренного признака, при распределении вариант отличном от нормального. Более того, он позволяет выявлять различия между малыми выборками (когда n1, n23 или n1=2, n25). Этот метод определяет насколько слабо перекрещиваются (совпадают) значения между двумя выборками. Чем меньше перекрещивающихся значений, тем более вероятно, что различия достоверны. Чем меньше Uэмп тем более вероятно, что различия достоверны.



Нулевая гипотеза: уровень признака в выборке 2 не ниже уровня признака в выборке 1.

Прежде чем проводить оценку критерием U необходимо провести ранжирование.



Ранжирование – распределение вариант внутри вариационного ряда от меньших величин к большим.

Правила ранжирования:

  1. Меньшему значению начисляется меньший ранг, как правило, это 1. Наибольшему значению начисляется ранг, соответствующий количеству ранжируемых значений (если n=10, то наибольшее значение получит ранг 10).

  2. Если несколько значений равны, им начисляется ранг, представляющийсобой среднее значение из тех рангов, которые они получили бы, если бы не были равны:

  3. Общая сумма рангов должна совпадать с расчетной, которая определяется по формуле: , где N- общее количество ранжируемых значений. Несовпадение реальной и расчетной сумм рангов будет свидетельствовать об ошибке, допущенной при начислении рангов или их суммировании. Прежде чем продолжить работу, необходимо найти ошибку и устранить ее.

Пример. Проранжируем следующий ряд.

Варианты

Ранг






2,5
5
7
6
4
2,5
1

Ранг варианты 11 равен 1. Варианта 12 встречается дважды, ему начисляется ранг, представляющийсобой среднее значение из тех рангов, которые они получили бы, если бы не были равны: . Следовательно значению 12 соответствует ранг 2,5. Значению 13 соответствует ранг 4. Соответственно, значениям 14,15, 16 присваиваются ранги 5, 6, 7.

По формуле проверим правильность ранжирования.

. Определим сумму рангов: 1+2,5+2,5+4+5+6+7=28.

Общая сумма рангов совпадает с расчетной. Следовательно мы правильно проранжировали.



Схема подсчета критерия Манна-Уитни:

  1. Создать таблицу. (1 столбец – одна сравниваемая группа, 2 столбец – вторая).

  2. Проранжировать значения вариант в обоих столбцах (как если бы работали с одной большой выборкой).

  3. Подсчитать сумму рангов для первого и второго столбцов отдельно. Проверить, совпадает ли общая сумма рангов с расчетной.

  4. Определить большую из двух ранговых сумм.

  5. Определить значение Uэмп по формуле:

, где n1- количество вариант в выборке 1; n2- количество вариант в выборке 2; Т1, Т2 – ранговые суммы.

  1. Определить критические значения Uкр по таблице.

  2. Если Uэмп >Uкр, то нет основания отвергнуть нулевую гипотезу. Если UэмпUкр, то нулевая гипотеза отвергается.

Чем меньше значения U, тем достоверность различий выше и тем больше уверенности в отклонении нулевой гипотезы.

Пример. При заболеваниях сетчатки повышается проницаемость ее сосудов. Исследователи измерили проницаемость сосудов сетчатки у здоровых и у больных с ее поражением. Полученные результаты приведены в таблице.

Здоровые

0,5

0,7

0,7

1,0

1,0

1,2

1,4

1,4

1,6

1,6

1,7

2,2

Больные

1,2

1,4

1,6

1,7

1,7

1,8

2,2

2,3

2,4

6,4

19,0

23,6

Проверить, подтверждают ли эти данные гипотезу о различии в проницаемости сосудов сетчатки.

Н0: проницаемость сосудов сетчатки при заболеваниях сетчатки у больных не больше, чем у здоровых, (нет статистического различия между двумя выборками).



Н1: проницаемость сосудов сетчатки при заболеваниях сетчатки у больных больше, чем у здоровых, (есть статистическое различие между двумя выборками).

Здоровые

больные

проницаемость сосудов сетчатки

Порядковый номер

Ранг

проницаемость сосудов сетчатки

Порядковый номер

Ранг

0,5

1

1

1,2

7

6,5

0,7

2

2,5

1,4

8

9

0,7

3

2,5

1,6

13

12

1,0

4

4,5

1,7

14

15

1,0

5

4,5

1,7

15

15

1,2

6

6,5

1,8

17

17

1,4

9

9

2,2

18

18,5

1,4

10

9

2,3

20

20

1,6

11

12

2,4

21

21

1,6

12

12

6,4

22

22

1,7

16

15

19

23

23

2,2

19

18,5

23,6

24

24

















,

. Расчетная сумма совпадает с суммой рангов, что свидетельствует о правильности ранжирования.

Рассчитаем U-статистику



,

Критическое значение Uкрит найдем по таблице Манна-Уитни при n1 =12, n2=12 и α=0,05.



.

В нашем случае , следовательно, нулевая гипотеза отвергается и можно сделать вывод о достоверности различия проницаемости сосудов сетчатки у здоровых и у больных с ее поражением.


Различия между зависимыми группами.

Если есть необходимость сравнить две переменные, относящиеся к одной и той же выборке (например, биохимические показатели у больных с диагнозом гепатит А при поступлении в инфекционную клинику и перед выпиской их нее), то обычно используется t- критерий Стьюдента для связанных выборок. Альтернативными непараметрическими тестами являются: z – критерий знаков и Т – критерий Уилкоксона парных сравнений.



Критерий Уилкоксона (парный Т - критерий) для парных (связанных) совокупностей.

Применяется для оценки различий в случаях, когда члены сравниваемых выборок связаны попарно некоторыми общими условиями.



Т – критерий определяют следующим образом:

1. Находят разность значений изучаемого признака для каждой сравниваемой сопряженной пары (до и после эксперимента). Пары наблюдений, которым соответствует нулевое изменение, из дальнейшего анализа исключают.

2. Присваивают ранги полученным разностям по возрастанию их абсолютной величины (без учета знака). Рангами одинаковых величин являются средние тех рангов (мест), которые они должны занять в упорядоченном ряду.

3. Присваивают каждому рангу знак в соответствии с направлением изменения: если значение увеличилось – «+», если уменьшилось – «-».

4. Определяют суммы рангов, имеющих одинаковые знаки и берут наименьшую из них. Эта сумма и является критерием Уилкоксона.

5. Сравнивают полученную величину критерия Уилкоксона с критическим значением его в таблице. Если , то нет оснований отвергать нулевую гипотезу. Если , то нулевая гипотеза отвергается.


Пример. У 10 больных изучалось количество билирубина в желчи до и после введения антибиотиков. Определить существенность различий количества билирубина.

Н0: нет статистического различия между двумя выборками, (нет статистического различия в количестве билирубина в желчи до и после введения антибиотиков).

Н1: есть статистическое различие между двумя выборками, (есть статистическое различие в количестве билирубина в желчи до и после введения антибиотиков).


Больные

Количество билирубина

Разность

Ранги

до введения антибиотиков

после введения антибиотиков

А

68

110

+42

4

Б

83

101

+18

2

В

70

120

+50

5

Г

100

180

+80

8

Д

110

100

-10

1

Е

100

100

0




Ж

180

240

+60

6,5

З

60

120

+60

6,5

И

200

160

-40

3

К

210

300

+90

9

1) Сумма рангов значений с плюсовым изменением Т(+)=4+2+5+8+6,5+6,5+9=41, сумма рангов со значением минус Т(-)=1+3=4.

2) Оценивается меньшая из сумм (Т=4) при числе пар наблюдений, равном 9.

3) Оценочная таблица приводится в специальной литературе: по строчке для n=9 Т(α=0,05)= 6, для Т(α=0,01)=2. В нашем примере Т=4.

4) Следовательно, с вероятностью, большей 95% и меньшей 99%, можно утверждать о достоверном влиянии введения антибиотиков на увеличение билирубина в желчи.


Задания.

  1. t-критерий Стьюдента для независимых выборок

Препарат из группы антагонистов кальция, нифедипин, обладает способностью расширять сосуды, и его применяют при лечении ишемической болезни сердца. Измеряли диаметр коронарных артерий после приема нифедипина и плацебо и получили следующие две выборки данных диаметра коронарной артерии (в мм).

Плацебо

2,5

2,2

2,6

2,0

2,1

1,8

2,4

2,3

2,7

2,7




Нифедипин

2,5

1,7

1,5

2,5

1,4

1,9

2,3

2,0

2,6

2,3

2,2

Позволяют ли приведенные данные полагать, что нифедипин влияет на диаметр коронарных артерий?

2. t-критерий Стьюдента для независимых выборок

Стремясь отделить действие тетрагидроканнабинолов от действия дыма, исследователи изучили их действие при внутривенном введении. После ингаляционного введения бактерий крысам вводили спиртовой раствор тетрагидроканнабинолов, контрольной группе вводили этиловый спирт. В обеих группах было по 36 животных. После введения тетрагидроканнабинолов доля погибших бактерий составила в среднем 51,4%, в контрольной группе – 59,4%. Стандартные ошибки среднего составили соответственно 3,2% и 3,9%. Позволяют ли эти данные утверждать, что тетрагидроканнабинолы ослабляют антибактериальную защиту?

3 . t-критерий Стьюдента для зависимых выборок

Скорость выделения слюны у детей (мл/мин.):

До операции

0,18

0,19

0,14

0,22

0,15

0,17

После операции

0,2

0,22

0,16

0,26

0,15

0,18

Считая, что выборка распределена нормально, определите статистически значимое различие между средними выборок.

4. U-критерий Манна-Уитни

Исследуется эффективность препарата, позволяющего сбросить лишнюю массу больным, страдающим ожирением. При этом группе добровольцев предписана определенная диета. Через месяц подобного режима, соблюдения диеты и регулярного приема препарата фиксируется величина потерянной массы в килограммах. Для проведения эксперимента отобрана группа из 8 добровольцев, причем из них действительно получали исследуемый препарат (экспериментальная группа), а 5 довольствовались плацебо (контрольная группа).

Экспериментальная группа (потерянная масса в кг)

6,2

3,0

3,9







Контрольная группа (потерянная масса в кг)

4,0

-0,5

3,3

1,5

3,0

Проверить гипотезу о неэффективности препарата.

5. Т-критерий Уилкоксона

В результате проведения исследования были получены 2 вариационных ряда по толщине слоя эмали в микронах до и после воздействия кислоты:

До

0,16

0,129

0,135

0,15

0,125

0,13

После

0,195

0,178

0,166

0,16

0,11

0,12

Считая, что выборка не подчиняется нормальному закону распределения, определите статистически значимое различие между выборками.

ЛИТЕРАТУРА

1. А. Афифи, С. Эйзен. Статистический анализ. Подход с использованием ЭВМ/ М.: Мир, 1982. 488 с.

2. Боровиков, В. Statistica. Искусство анализа данных на компьютере: для профессионалов/ СПб.: Питер, 2001. 656 с.

3. Вентцель, Е. С. Теория вероятностей/ М.: Наука, 1969. 576 с.

4. Гмурман, В. Е. Руководство к решению задач по теории вероятностей и математической статистике/ М.: Высшая школа, 2001. 400 с.

5. Гмурман, В. Е. Теория вероятностей и математическая статистика/ М.: Высшая школа, 1972. 368 с.

6. Н. И. Инсарова, В. Г. Лещенко. Элементы теории вероятностей и математической статистики: учеб.-метод. пособие/ Минск: БГМУ, 2003. 66 с.

7. С. Н. Лапач, А. В. Чубенко, П. И. Бабич. Статистические методы в медико-биологических исследованиях с использованием Excel/ Киев: Морион, 2000. 319 с.

8. В. А. Медик, М. С. Токмачев. Руководство по статистике здоровья и здравоохранения/ М: Медицина, 2006. 528 с.

9. В. А. Медик, М. С. Токмачев, Б. Б. Фишман. Статистика в медицине и биологии: рук. в 2 т. Т. 1. Теоретическая статистика/ М.: Медицина, 2000. 455 с.

10. Ю. Н. Тюрин, А. А. Макаров. Статистический анализ данных на компьютере/ М.: Инфра-М, 1998. 528 с.

11. В. А. Фигурин, В. В. Оболонкин. Теория вероятностей и математическая статистика/ Минск: Новое знание, 2000. 206 с.



12. В. И. Юнкеров, С. Г. Григорьев. Математико-статистическая обработка данных медицинских исследований/ СПб.: ВМедА, 2002. 266 с.

Достарыңызбен бөлісу:
1   2   3
Loading...


©melimde.com 2020
әкімшілігінің қараңыз

    Басты бет
рсетілетін ызмет
Жалпы ережелер
ызмет стандарты
дістемелік кешені
бекіту туралы
туралы хабарландыру
біліктілік талаптары
кіміні аппараты
Конкурс туралы
жалпы біліктілік
ойылатын жалпы
мемлекеттік кімшілік
жалпы конкурс
білім беретін
Барлы конкурс
республикасы білім
ызмет регламенті
бойынша жиынты
ткізу туралы
конкурс атысушыларына
біліктілік талаптар
атысушыларына арнал
Республикасы кіметіні
идаларын бекіту
облысы кімдігіні
мемлекеттік ызмет
рсетілетін ызметтер
стандарттарын бекіту
Конкурс ткізу
дебиеті маманды
мемлекеттік мекемесі
Мектепке дейінгі
дістемелік сыныстар
дістемелік материалдар
ауданы кіміні
конкурс туралы
жалпы білім
рметті студент
облысы бойынша
мектепке дейінгі
мыссыз азаматтар
Мемлекеттік кірістер
білім беруді
дарламасыны титулды
Конкурс жариялайды
дістемелік кешен
мелетке толма
ызметтер стандарттарын
разрядты спортшы
аласы кіміні
директоры бдиев

Loading...