小提琴图
免费在线小提琴图制作工具
什么是小提琴图?
小提琴图结合了箱线图和核密度估计,展示数值数据在不同类别中的完整分布。与单纯箱线图不同,小提琴的宽度显示数值集中区域,便于发现偏态、多峰和异常值。特别适合并排比较两个或多个组的分布。适用于关注数据形状而非仅中位数或范围的场景。
主要功能
1
核密度估计
可调节的KDE带宽控制小提琴形状的平滑度或细节,帮助突出细微模式或展示整体趋势。
2
内嵌箱线图覆盖
可切换显示每个小提琴内嵌的箱线图,展示中位数、四分位数和须,配合完整分布形状。
3
显示单个数据点
可选择在小提琴内渲染每个原始数据点,让观众看到分布曲线背后的实际观测值。
4
多组比较
将多个小提琴并排放置,使用不同颜色一目了然地比较各组分布。
5
纵向和横向布局
可切换纵向或横向布局,适配幻灯片、报告或仪表盘,无需重新格式化数据。
适用场景
比较不同学生群体的考试成绩分布
按职位或部门分析薪资范围
按治疗组可视化临床试验测量分布
探索不同条件下传感器或物联网读数模式
比较A/B测试中响应时间分布
展示环境测量的季节性变化
使用时机
- 需要比较两个或多个组的分布,而不仅仅是统计摘要时
- 数据可能呈双峰或多峰,箱线图无法显示这些峰值时
- 数据点足够多(通常30个以上),密度估计才有意义时
- 异常值重要且整体分布形状也需关注时
- 每组直方图并排显示会显得过于杂乱时
常见错误
- !样本量过小(少于20个点)时使用小提琴图,密度估计不可靠
- !带宽设置过低,导致形状尖锐,过拟合数据噪声
- !带宽设置过高,将真实的双峰模式平滑成单峰
- !未显示每组样本量,观众无法判断结果可靠性
- !相邻小提琴颜色过于相似,难以区分各组
- !缺少坐标轴标签或单位,导致数值刻度难以理解