統計の読み方(2)_処理編

前回記事からの続き

統計の読み方(1)_入力編

図1

今回は、「処理」のプロセスを見ていく。

処理(都合のいいデータの選択、データの境界の恣意的な設定)

つぎは、集めたデータを処理する段階だ。

この段階では、都合のいいデータを選択し、都合の悪いものは排除するという誘惑が発生する。

統計データを集める場合、作業者は何らかの「仮説」を持っている場合がほとんどだ。
その仮説を証明するために統計データを作るのだが、仮説に反するデータが出ると、どうしても「これは例外」と思いたくなり、実際にそのデータを排除してしまう。

また、データの境界線を恣意的に設定できるのも、気をつけなければいけない。
たとえば年代別のデータを分析するとしよう。
10歳刻みでやるのか、5歳刻みなのか、25歳〜34歳(アラサー)といった区切りなのか・・・・
境界線をどうするかで、データの見え方ががらりと変わるだろう。

関連記事

  1. 最も怖いもの

  2. 売上は結果

  3. 歯車

    ビジネスアイデアをかたち(モデル)にするお手伝い

  4. 手間がかかるほど愛おしい(イケア効果)

  5. ウェブミーティング、対応できます

  6. システムの問題から逃げるな

最近の記事

  1. 本棚
  2. 2026.01.22

    オーバー
  3. 2026.01.16

    古書を読む
  4. 2026.01.14

    税負担化
  5. 2026.01.13

    全知全能

読書記録(ブクログ)