異常値検出

異常値検出は、以前のデータに関連して特定の指標がどのように変化したかを判定するための統計的手法です。

異常値検出は、Reports & Analytics の機能です。この機能を使用すると、「ノイズ」から「真のシグナル」を切り離して、それらのシグナルまたは変則性に関与する潜在的な要因を識別できます。つまり、変則性の検出を使用すると、重要な統計変動と重要でな統計変動を識別できます。さらに、信頼できる指標(KPI)の予測を取得できます。

注意:Analysis Workspace の新しい異常値検出と貢献度分析機能をご覧ください。

調査できる異常の例を次に示します。

次の表に、レポート API の異常値検出によって返される予測区間データを示します。

upper_bound

予測区間の上限の水準。この水準よりも上の値は異常と見なされます。

値がこの水準を下回る信頼度は 95 %です。

lower_bound

予測区間の下限の水準。この水準よりも下の値は異常と見なされます。

値がこの水準を上回る信頼度は 95 %です。

forecast

データ分析に基づいて予測される値。この値は、下限と上限の中間点でもあります。

異常値検出では、1 日あたりの予測区間データの計算、学習およびレポート作成のために、トレーニング期間が使用されます。このトレーニング期間は、通常状態と異常状態を識別し、学習したことをレポート期間に適用するための履歴的な期間です。設定に応じて、トレーニング期間は、表示またはレポート期間の開始時点から 30 日前、60 日前または 90 日前で構成されます。

データを計算するために、各指標の日次合計がトレーニング期間と比較されます。そのために、次のアルゴリズムが使用されます。

· ホルトウィンタース乗法(三重指数平滑法)

· ホルトウィンタース加法(三重指数平滑法)

· ホルトウィンタース補正(二重指数平滑法)

各アルゴリズムは、誤差の二乗和(SSE)が最小になるアルゴリズムを決定するために適用されます。次に、平均絶対誤差率(MAPE)および現在の標準誤差が計算され、モデルが統計的に妥当であることが確認されます。

これらのアルゴリズムは、将来の期間における指標の予測を表示するように拡張できます。

トレーニング期間は表示(レポート)期間の開始時点によって異なるので、同じ日付に対してレポートされたデータでも、それらが含まれる期間が異なれば、差が生じる可能性があります。

例えば、1 月 1 日から 14 日までのレポートを実行し、次に 1 月 7 日から 21 日までのレポートを実行した場合、この 2 種類のレポートの 1 月 7 日から 14 日までの同じ指標について、異なる予測データが表示される場合があります。これは、トレーニング期間の違いによります。

期間を表示

トレーニング期間 30 日

トレーニング期間 60 日 トレーニング期間 90 日

1 月 1 日から 14 日まで

11 月 27 日から 12 月 31 日まで

10 月 28 日から 12 月 31 日まで 9 月 28 日から 12 月 31 日まで

1 月 7 日から 21 日まで

12 月 4 日から 1 月 6 日まで

11 月 4 日から 1 月 6 日まで 10 月 5 日から 1 月 6 日まで

異常値検出を設定する方法および異常値検出レポートを実行する方法については、適切な資料を参照して、手順をご確認ください。

異常値検出は、レポート API でも利用できます。