異常値の検出

異常値検出は、統計的なモデリングを使用して、データ内の予期しないトレンドを自動的に見つけます。このモデルは、指標を分析して、値の 下限上限、および 予想される範囲 を決定します。予期しないスパイクまたは下落が発生した場合にレポートします。

調査できる異常の例を次に示します。

注意:異常値検出は、「日」の精度を選択した場合にのみ利用できます。

異常値検出の指標

異常値検出により、選択する各指標に次のような新しい指標が追加されます。

要素 説明
下限

予測区間の下限の水準。この水準よりも下の値は異常と見なされます。

値がこの水準を上回る信頼度は 95 %です。

期待値

データ分析に基づいて予測される値。この値は、下限と上限の中間点でもあります。

上限

予測区間の上限の水準。この水準よりも上の値は異常と見なされます。

値がこの水準を下回る信頼度は 95 %です。

Report Builder では、選択した指標にこれらの値が適用されます。例えば、ページビュー数の指標を選択して異常値検出を適用した場合、 ページビュー数の下限 という指標が使用されます。

異常値検出の計算方法

異常値検出では、1 日あたりの予測区間データの計算、学習およびレポート作成のために、トレーニング期間が使用されます。このトレーニング期間は、通常状態と異常状態を識別し、学習したことをレポート期間に適用するための履歴的な期間です。マーケティングレポートでは、30 日、60 日および 90 日のトレーニング期間を利用できます。Report Builder では、30 日を利用できます。

トレーニング期間は、選択したレポート期間と同一でない場合もあります。レポートグラフには、カレンダーで指定した日付範囲の期間が表示されます。

データを計算するために、各指標の日次合計がトレーニング期間と比較されます。そのために、次のアルゴリズムが使用されます。

各アルゴリズムは、誤差の二乗和(SSE)が最小になるアルゴリズムを決定するために適用されます。次に、平均絶対誤差率(MAPE)および現在の標準誤差が計算され、モデルが統計的に妥当であることが確認されます。

これらのアルゴリズムは、将来の期間における指標の予測を表示するように拡張できます。

トレーニング期間はレポート期間の開始時点によって異なるので、同じ日付に対してレポートされたデータでも、それらが含まれる期間が異なれば、差が生じる可能性があります。

例えば、1 月 1 日から 14 日までのレポートを実行し、次に 1 月 7 日から 21 日までのレポートを実行した場合、この 2 種類のレポートの 1 月 7 日から 14 日までの同じ指標について、異なる予測データが表示される場合があります。これは、トレーニング期間の違いによります。

レポート期間

トレーニング期間

1 月 1 日から 14 日まで

11 月 27 日から 12 月 31 日まで

1 月 7 日から 21 日まで

12 月 4 日から 1 月 6 日まで