Викиди є будь-яка точка більше або менше, ніж у 1,5 рази більше діапазону першого та третього квартилів (від кінця прямокутника), малює точку.
Якщо є значення, які знаходяться вище або нижче кінця вуса, вони наносяться на графік у вигляді точок. Ці точки часто називають викидами. Викид є більш екстремальним, ніж очікувана варіація.
Варіанти для прямокутної діаграми Викид є точка даних, відстань від інтерквартильного діапазону в 1,5 рази перевищує розмір інтерквартильного діапазону. Виберіть один із таких варіантів: Ігнорувати викиди.
Обрізка та winsorizing Це обидва корисні методи для видалення викидів на діаграмі без спотворення даних, проте вони мають власний набір переваг і недоліків. Обрізання зменшує розмір вибірки та дисперсію даних, що може вплинути на статистичні висновки та ефективність аналізу.
Запропонований Tukey (1977), boxplot є загальновживаним графічним підсумком даних, які забезпечує ще один метод виявлення викидів.
Викиди є екстремальні значення, які відрізняються від більшості інших точок даних у наборі даних. Вони можуть мати великий вплив на ваш статистичний аналіз і спотворити результати будь-яких перевірок гіпотез.
Обчисліть інтерквартильний діапазон для даних. Помножте інтерквартильний діапазон (IQR) на 1,5 (константа, яка використовується для визначення викидів). Додайте 1,5 x (IQR) до третього квартиля. Будь-яке число, що перевищує це, є ймовірним викидом.