SAS-ヒストグラム

ヒストグラムは、さまざまな高さのバーを使用したデータのグラフィック表示です。データセット内のさまざまな数値を多くの範囲にグループ化します。また、連続変数の分布の確率の推定を表します。SASではPROC UNIVARIATE 以下のオプションでヒストグラムを作成するために使用されます。

構文

SASでヒストグラムを作成するための基本的な構文は次のとおりです。

PROC UNIVARAITE DATA = DATASET;
HISTOGRAM variables;
RUN;

以下は、使用されるパラメーターの説明です-

  • DATASET 使用されるデータセットの名前です。

  • variables ヒストグラムをプロットするために使用される値です。

単純なヒストグラム

変数の名前と値をグループ化するために考慮される範囲を指定することにより、単純なヒストグラムが作成されます。

以下の例では、可変馬力の最小値と最大値を考慮し、50の範囲を取ります。したがって、値は50のステップでグループを形成します。

proc univariate data = sashelp.cars;
   histogram horsepower
   / midpoints = 176 to 350 by 50;
run;

上記のコードを実行すると、次の出力が得られます。

カーブフィッティングのヒストグラム

追加のオプションを使用して、いくつかの分布曲線をヒストグラムに適合させることができます。

以下の例では、ESTとして言及されている平均値と標準偏差値を使用して分布曲線を近似します。このオプションは、パラメーターを使用して推定します。

proc univariate data = sashelp.cars noprint;
histogram horsepower
/ 
normal ( 
   mu = est
   sigma = est
   color = blue
   w = 2.5 
)
barlabel = percent
midpoints = 70 to 550 by 50;
run;

上記のコードを実行すると、次の出力が得られます。