統計の読み方(2)_処理編

前回記事からの続き

統計の読み方(1)_入力編

図1

今回は、「処理」のプロセスを見ていく。

処理(都合のいいデータの選択、データの境界の恣意的な設定)

つぎは、集めたデータを処理する段階だ。

この段階では、都合のいいデータを選択し、都合の悪いものは排除するという誘惑が発生する。

統計データを集める場合、作業者は何らかの「仮説」を持っている場合がほとんどだ。
その仮説を証明するために統計データを作るのだが、仮説に反するデータが出ると、どうしても「これは例外」と思いたくなり、実際にそのデータを排除してしまう。

また、データの境界線を恣意的に設定できるのも、気をつけなければいけない。
たとえば年代別のデータを分析するとしよう。
10歳刻みでやるのか、5歳刻みなのか、25歳〜34歳(アラサー)といった区切りなのか・・・・
境界線をどうするかで、データの見え方ががらりと変わるだろう。

関連記事

  1. 事情も知らないで

  2. 数字、数学、パズル

    その可能性、数字で言ってみて

  3. 植物の成長

    小規模事業者持続化補助金 採択発表

  4. チェックリスト

    テストをしよう

  5. 歯車

    経営学はフリーズドライ製品。お湯で戻すテクニックが問われる

  6. 儲かっていませんが、儲け方を教えます

最近の記事

  1. 2026.03.12

    紹介の連鎖
  2. 2026.03.09

    AI配偶者
  3. 2026.03.06

    京都も古典も
  4. 2026.03.05

    出せない

読書記録(ブクログ)