母比率の区間推定
何となく使えるようにする統計シリーズ第三弾
数学的にあいまいな表現が多々あります。
以下のような問題を考える。
ある大都市のうち、金魚を飼っている世帯数を調査する。
無作為に選び出した1500世帯のうち、300世帯が金魚を飼っていた。
このとき、この都市で金魚を飼っている世帯の95%信頼区間を求めよ。
母集団は十分大きいので、金魚を飼っている世帯数xは二項分布に従うと考えてよい。
よって世帯数xの期待と分散は
となる。
ここで標本比率 を用いると、その期待値は
分散は
と表せる。
ここでnが大きいとき、二項分布に関する中心極限定理より、次のzが近似的に標準正規分布に従う。
となる。
これは二次不等式で解くのが面倒。
nが十分大きいので、最左辺と最右辺の を で置き換えて、
が信頼区間となる。
この問題では
よって、求める信頼区間は
となる。