바이올린 플롯 차트
무료 온라인 바이올린 플롯 차트 제작기
바이올린 플롯 차트란?
바이올린 플롯 차트는 박스 플롯과 커널 밀도 추정을 결합해 범주별 수치 데이터의 전체 분포를 보여줍니다. 박스 플롯과 달리 각 바이올린의 너비가 값이 가장 집중된 위치를 나타내어 왜곡, 다중 봉우리, 이상치를 쉽게 파악할 수 있습니다. 특히 두 개 이상의 그룹 분포를 나란히 비교할 때 유용합니다. 중앙값이나 범위뿐 아니라 데이터 모양이 중요할 때 사용하세요.
주요 기능
1
커널 밀도 추정
조절 가능한 KDE 대역폭으로 각 바이올린 모양의 부드러움이나 세밀함을 조절해 미세한 패턴이나 넓은 추세를 강조할 수 있습니다.
2
내부 박스 플롯 오버레이
각 바이올린 안에 박스 플롯을 켜서 중앙값, 사분위수, 수염을 전체 분포 모양과 함께 표시할 수 있습니다.
3
개별 데이터 포인트 표시
원시 데이터 포인트를 바이올린 안에 표시해 분포 곡선 뒤 실제 관측값을 볼 수 있게 할 수 있습니다.
4
다중 그룹 비교
서로 다른 색상의 여러 바이올린을 나란히 배치해 그룹 간 분포를 한눈에 비교할 수 있습니다.
5
수직 및 수평 방향
데이터를 다시 포맷하지 않고 슬라이드, 보고서, 대시보드에 맞게 수직 또는 수평 레이아웃을 전환할 수 있습니다.
적합한 용도
학생 집단별 시험 점수 분포 비교
직책 또는 부서별 급여 범위 분석
치료 그룹별 임상 시험 측정값 분포 시각화
조건별 센서 또는 IoT 데이터 패턴 탐색
A/B 실험 결과 응답 시간 분포 비교
환경 측정값의 계절별 변동 표시
사용 시기
- 두 개 이상의 그룹 간 분포를 요약 통계뿐 아니라 비교할 때
- 데이터가 이중봉 또는 다중봉일 수 있어 박스 플롯으로는 봉우리를 숨길 때
- 밀도 추정이 의미 있으려면 보통 30개 이상의 데이터가 있을 때
- 이상치도 중요하지만 분포 전체 모양도 중요할 때
- 그룹별 히스토그램을 나란히 놓으면 너무 복잡할 때
자주 하는 실수
- !샘플 수가 매우 적을 때(20개 미만) 바이올린 플롯 사용 — 밀도 추정이 신뢰할 수 없음
- !대역폭을 너무 낮게 설정해 데이터 노이즈에 과적합된 뾰족한 모양 생성
- !대역폭을 너무 높게 설정해 실제 이중봉 패턴을 하나의 봉우리로 평활화
- !그룹별 샘플 크기를 표시하지 않아 신뢰도를 판단할 수 없게 함
- !인접한 바이올린에 거의 동일한 색상을 사용해 그룹 구분이 어려움
- !축 레이블이나 단위를 생략해 값 척도를 해석할 수 없게 함