Violin Plot Chart
Бесплатный онлайн‑генератор графиков «скрипка»
Что такое график «скрипка»?
График «скрипка» сочетает box plot и оценку плотности (kernel density estimate), чтобы показать полное распределение числовых данных по категориям. В отличие от одного box plot, ширина каждой «скрипки» показывает, где значения встречаются чаще всего — так проще заметить перекосы, несколько пиков и выбросы. Особенно полезен, когда нужно сравнить распределения двух или более групп бок о бок. Используйте его каждый раз, когда важна форма ваших данных, а не только медиана или диапазон.
Ключевые возможности
Оценка плотности по ядру (KDE)
Настраивайте ширину полосы KDE: она определяет, насколько гладкой или детальной будет форма каждой «скрипки». Так вы сможете подчеркнуть тонкие закономерности или, наоборот, показать общие тенденции.
Наложение внутреннего box plot
Включите встроенный box plot внутри каждой «скрипки», чтобы видеть медиану, квартили и «усы» рядом с полной формой распределения.
Отображение отдельных точек данных
По желанию показывайте каждое исходное значение внутри «скрипки», чтобы зрители видели реальные наблюдения за кривой распределения.
Сравнение нескольких групп
Размещайте несколько «скрипок» рядом с разными цветами, чтобы быстро сравнить распределения между группами.
Вертикальная и горизонтальная ориентация
Переключайтесь между вертикальной и горизонтальной разметкой, чтобы удобно вписать график в слайд, отчёт или дашборд — без перенастройки данных.
Лучше всего подходит для
Когда использовать
- Когда нужно сравнить распределения между двумя или более группами, а не только сводные статистики
- Когда данные могут быть бимодальными или мультимодальными и box plot скрывает пики
- Когда у вас достаточно точек данных (обычно 30+), чтобы оценка плотности была осмысленной
- Когда важны выбросы, но важна и общая форма распределения
- Когда гистограммы для каждой группы при боковом сравнении будут слишком перегруженными
Частые ошибки
- !Использование графика «скрипка» с очень маленькими выборками (менее 20 точек) — оценка плотности становится ненадёжной
- !Слишком низкая настройка ширины (bandwidth), из‑за чего формы получаются «колючими» и переобучаются на шум в данных
- !Слишком высокая настройка bandwidth, из‑за чего реальные бимодальные паттерны сглаживаются в один «горб»
- !Забывают показать размер выборки для каждой группы, и зрителям сложно оценить надёжность выводов
- !Используют почти одинаковые цвета для соседних «скрипок», из‑за чего группы плохо различимы
- !Не указывают подписи осей или единицы измерения, из‑за чего шкала значений становится непонятной