リスクアドバイザリー

データ分析導入による内部監査の高度化(2)

2014.07.14
並木 智之
並木 智之
新日本有限責任監査法人
ITリスクアドバイザリー部 マネージャー
公認情報システム監査人、システム監査技術者、ITコーディネーター
当法人にて現在以下の業務を担当している。
  • データ分析導入による内部監査高度化支援
  • CAAT(コンピュータ利用監査技法)の研修コンテンツ作成および講師
  • 監査業務効率化ツールの仕様策定
  • IT統制に関する内部統制構築支援

※当稿の内容は先進的な取組みであり、筆者の個人的な見解が含まれています。

前回はデータ分析作業に入る前の準備作業について解説しました。今回はいよいよ、データ分析の実行について解説します。

7. データ分析の実行

監査基準委員会報告書520 A3において、「単純な比較の実施から高度な統計的手法を用いた複雑な分析の実施まで」とある通り、さまざまな手法が考えられます。具体的な手法については、ケース・バイ・ケースであるため、一般化が難しい領域ですが、ここではいくつか代表的な手法をご紹介します。

  • 増減分析
    2年、できれば3年以上の推移を折れ線グラフなどで表現します。例えばデータ区間を月単位として、例年と異なる動きのある月を探します。該当月について、何が原因であったかを検討します。EXCELのグラフ機能やCAAT専用ツールを使ってグラフを作成します。
  • 整合性確認
    確認したいデータと、関連はあるが別のソースから入手したデータを照合します。ACCESSのクエリー機能やCAAT専用ツールを使って分析します。
  • テキストデータマイニング
    分析したいテキストデータを単語に分解します。単語の頻度や単語間の関係を考慮し、分析したい単語を検討します。分析したい単語を含むことに加えて、金額など追加条件と組み合わせて、条件に合致するテキストデータを入手し、内容を吟味します。
  • 統計モデルを用いた分析
    シンプルな統計モデルから高度な統計モデルまで、さまざまな分析が可能となります。シンプルな例を二つ挙げます。
    ① 標準偏差の2倍から外れたデータを特定し、内容を吟味する方法
    ② データに一定の係数※3を乗じて、推定値を算出し、システム上のデータとその推定値とのかい離状況を確認する方法

高度な例として、複数の統計的手法を組み合わせた分析が挙げられます。

【複数の統計的手法を組み合わせた例】

購入明細データ費目間の相関について、散布図行列(図1)で確認した結果、材料費A・材料費Bと外注費の組合わせにおいて強い相関があった。そこで「明細データのうち、材料費Aと材料費Bに比較して、外注費の割合が相対的に高い案件はキックバックの可能性が高い」という仮説を立てた。従属変数を外注費、説明変数を材料費Aと材料費Bとして重回帰分析※4(図2)を行った。結果として、重決定 R2※5が90%を越え、非常に強い相関を示したため、重回帰式の予測値から大きく上振れした案件を外注費が割高とし、詳細調査対象候補とした。

図1 Rで作成した散布図行列の概念図

(下の図をクリックすると拡大します)

図2 Rで作成した重回帰分析の概念図

薄青色の平面は外注費を被説明変数、材料費A、材料費Bを説明変数とした重回帰平面

図2 Rで作成した重回帰分析の概念図

8. データ分析結果の検討

効果的な分析結果が得られた場合、当該手法を定期的にモニタリングするとよいでしょう。同じ手法を継続して行うのであれば、その分析手順の一部をEXCELのマクロ機能やCAAT専用ツールなどで自動化することで省力化・属人化の排除が期待できます。

【複数の統計的手法を組み合わせた場合の検討結果例】

従来、一定のしきい値未満の金額の案件は調査検討対象から外していた。しかし、しきい値未満の金額の案件の中に、統計的に外注費が割高であることを示す案件が含まれていることが分かった。
従来、外注費が割高であるかどうかについては、業務経験の豊富な専門家の意見を聞きながら検討していたが、統計的手法を用いることによって、客観的かつ網羅的な検証を行うことができた。

終わりに

「データ分析」の導入当初は幅広いスキル(統計・プログラミング・CAAT・ツール・監査・不正)を要しますが、分析手続きの方針が固まれば処理を自動化することで効率的な実施が期待できます。データ分析導入による内部監査の高度化を検討する価値は大きいでしょう。

  • ※3係数は、EXCELや統計専用ツール(SPSS、SAS、Rなど)を使って、算出します。
  • ※4従属変数(外注費)と複数の説明変数(材料費A・B)の間に式を当てはめ、従属変数が説明変数によってどれくらい説明できるのかを定量的に分析することで、従属変数を予測する分析手法です。
  • ※5全データの何%を説明変数で説明できているかを示します。

【関連リンク】


情報量は適当ですか?

文章はわかりやすいですか?

参考になりましたか?