バイオリンプロットチャート
無料オンラインバイオリンプロット作成
バイオリンプロットチャートとは
バイオリンプロットチャートは箱ひげ図とカーネル密度推定を組み合わせ、カテゴリごとの数値データの全分布を示します。箱ひげ図だけでは見えない値の集中度をバイオリンの幅で表し、歪みや複数ピーク、外れ値を簡単に把握可能です。特に複数グループの分布を並べて比較する際に有効で、中央値や範囲だけでなくデータの形状が重要な場合に使います。
主な特徴
1
カーネル密度推定
KDEの帯域幅を調整し、バイオリン形状の滑らかさや詳細度をコントロール。細かなパターンや大まかな傾向を強調可能。
2
内部ボックスプロット重ね表示
各バイオリン内に中央値、四分位数、ひげを示すボックスプロットを切り替えて表示可能。
3
個別データ点表示
分布曲線の背後にある実際の観測値を見せるため、各生データ点をバイオリン内に表示可能。
4
複数グループ比較
複数のバイオリンを並べて色分けし、グループ間の分布を一目で比較可能。
5
縦横両対応レイアウト
縦向き・横向きのレイアウトを切り替え、スライドやレポート、ダッシュボードに合わせてデータを再フォーマットせずに使える。
こんな用途に最適
学生グループ間のテストスコア分布比較
職種や部署ごとの給与範囲分析
治療群別の臨床試験測定分布の可視化
条件ごとのセンサーやIoTデータパターンの探索
A/Bテスト結果の応答時間分布比較
環境測定の季節変動の表示
使うべき場面
- 2つ以上のグループ間で分布を比較したいとき、単なる要約統計だけでなく
- データが二峰性や多峰性の可能性があり、箱ひげ図ではピークが隠れる場合
- 十分なデータ点(通常30点以上)があり、密度推定が意味を持つとき
- 外れ値も重要だが分布全体の形状も把握したいとき
- グループごとのヒストグラムを並べると煩雑になる場合
よくある間違い
- !非常に少ないサンプル数(20点未満)で使うと密度推定が不安定になる
- !帯域幅を低く設定しすぎてノイズに過剰適合したギザギザ形状になる
- !帯域幅を高く設定しすぎて本来の二峰性を滑らかにしすぎる
- !グループごとのサンプル数を表示せず信頼性が判断できない
- !隣接するバイオリンの色がほぼ同じでグループが判別しにくい
- !軸ラベルや単位を省略し値のスケールがわかりにくい