数字のコレクションの範囲(数学者はこれを「データセット」と呼びます)は、データセットの最大数と最小数の差です。データセット内の数値がどの程度分散しているかがわかります。
特定のロードトリップでガスに費やした金額を計算したいとします。タンクで最も一般的に支払った価格、および平均価格と正確な中間の価格を把握すると便利です。しかし、範囲は最高価格と最低価格が何であったかを教えてくれます。範囲は、データセットのパラメーターを把握するために統計家によって一般的に使用されます。
範囲を見つけるのは簡単です。これを行うには、データセット内の最小の数値を最大の数値から減算するだけです。または、次の式を使用できます:範囲=最大値–最小値。
サンプルデータセットは次のとおりです。
5、14、29、34、59、68
このデータセットでは、心配する必要があるのは最小(5)と最大(68)だけです。このデータセットの範囲は、次の式に従って見つけることができます。
68-5 = 63
範囲は役立つ場合がありますが、外れ値も含めてすべての値が含まれるため、制限があります。たとえば、データセットに多数のクラスター化された数値が含まれていて、左側のフィールドにぶら下がっている数値(たとえば、4、5、8、12、23、162)が含まれている場合、範囲の計算はあまり役に立ちません。
一方、範囲は、データセット内の数値が実際にどの程度分散しているかを把握しようとしている場合に役立ちます。
今それは興味深いです
統計家は、一連の数値の標準偏差を大まかに推定する方法として範囲を使用します。