График P – P - P–P plot - Wikipedia

График вероятности-вероятности, характеристика качества data.png

В статистике График P – P (график вероятности-вероятности или же процент – процентный график или же График значения P) представляет собой вероятностный график для оценки того, насколько близко два наборы данных согласен, что строит два кумулятивные функции распределения друг против друга. Графики P-P широко используются для оценки перекос распределения.

В Q – Q график более широко используется, но оба они называются «графиком вероятности» и потенциально могут быть запутаны.

Определение

График P – P представляет собой два кумулятивные функции распределения (cdfs) друг против друга:[1]заданы два распределения вероятностей с cdfs "F" и "грамм", это сюжеты в качестве z колеблется от к Поскольку cdf имеет диапазон [0,1], домен этого параметрического графа равен а диапазон - это единичный квадрат

Таким образом, для ввода z вывод - пара чисел, дающая то, что процент из ж и что процент из грамм упасть на или ниже z.

Линия сравнения - это линия под углом 45 ° от (0,0) до (1,1) - распределения равны тогда и только тогда, когда график попадает на эту линию - любое отклонение указывает на разницу между распределениями.[2]

Пример

Например, если два распределения не перекрываются, скажем F ниже ГРАММ, тогда график P – P будет перемещаться слева направо вдоль нижней части квадрата - как z проходит через поддержку F, cdf из F изменяется от 0 до 1, а cdf грамм остается на 0 - а затем перемещается вверх по правой стороне квадрата - cdf F теперь 1, так как все точки F лежат ниже всех точек ГРАММ, а теперь cdf грамм переходит от 0 к 1 как z проходит через поддержку ГРАММ. (нужен график для этого абзаца)

Использовать

Как показано в приведенном выше примере, если два распределения разделены в пространстве, график P – P даст очень мало данных - он полезен только для сравнения распределений вероятностей, которые имеют близкое или равное расположение. Примечательно, что он пройдет через точку (1/2, 1/2) тогда и только тогда, когда два распределения имеют одинаковые медиана.

Графики P – P иногда ограничиваются сравнениями между двумя выборками, а не сравнением выборки с распределением теоретической модели.[3] Однако они имеют общее применение, особенно там, где не все наблюдения моделируются с использованием одного и того же распределения.

Однако он нашел применение при сравнении выборочного распределения из известен теоретическое распределение: дано п образцы, построение непрерывного теоретического cdf против эмпирического cdf даст ступеньку (шаг как z попадает в образец) и попадет в верхнюю часть квадрата, когда будет достигнута последняя точка данных. Вместо этого наносят только точки, изображая наблюдаемые kнаблюдаемые точки (в порядке: формально наблюдаемые точки kстатистика-го порядка) против k/(п + 1) квантиль теоретического распределения.[3] Этот выбор «позиции построения» (выбор квантиля теоретического распределения) вызвал меньше споров, чем выбор для графиков Q – Q. Полученное в результате качество совпадения линии 45 ° дает меру разницы между набором образцов и теоретическим распределением.

График P – P можно использовать в качестве графического дополнения к тестам соответствия распределений вероятностей,[4][5] с дополнительными линиями, включенными на график, чтобы указать либо конкретные области приемлемости, либо диапазон ожидаемого отклонения от линии 1: 1. Доступна улучшенная версия графика P – P, называемая графиком SP или S – P,[4][5] который использует преобразование, стабилизирующее дисперсию создать график, на котором вариации линии 1: 1 должны быть одинаковыми во всех местах.

Смотрите также

Рекомендации

Цитаты

  1. ^ Непараметрический статистический вывод к Джин Дикинсон Гиббонс, Субхабрата Чакраборти, 4-е издание, CRC Press, 2003 г., ISBN  978-0-8247-4052-8, п. 145
  2. ^ Деррик, B; Toher, D; Белый, П (2016). "Почему тест Уэлча устойчив к ошибкам первого типа". Количественные методы психологии. 12 (1): 30–38. Дои:10.20982 / tqmp.12.1.p030.
  3. ^ а б Проверка на нормальность, Генри С. Тод, CRC Press, 2002, ISBN  978-0-8247-9613-6, Раздел 2.2.3, Процентно-процентные графики, п. 23
  4. ^ а б Майкл Дж. Р. (1983) "Стабилизированный вероятностный график". Биометрика, 70(1), 11–17. JSTOR  2335939
  5. ^ а б Шорак, Г. Р., Веллнер, Дж. А. (1986) Эмпирические процессы с приложениями к статистике, Wiley. ISBN  0-471-86725-X стр. 248–250

Источники

  • Дэвидсон, Рассел; Маккиннон, Джеймс (январь 1998 г.). "Графические методы исследования размера и мощности проверки гипотез". Манчестерская школа. 66 (1): 1–26. CiteSeerX  10.1.1.57.4335. Дои:10.1111/1467-9957.00086.