(一)調查總體
本調查的目標總體有兩個,一是全香港有住宅電話的6~84歲常住居民並説中文者(包括廣東話、普通話及其他方言,即與CNNIC的總體定義相同);另一個總體是在上述總體中18~74歲的成年人(與2000~2004年間調查參照的WIP總體定義相同)。前者用於與CNNIC調查結果相比較、後者則與2000~2004年間調查結果相比較。
(二)抽樣方法
樣本量:為與CNNIC分省樣本量相倣,本調查最後成功調查了1187人,在95%的置信度下,該樣本的抽樣誤差2.8%。
抽樣方法:本調查沿用前四次所採用的“隨機電話號碼撥號”(RDD)的抽樣方法。首先通過電腦程式産生出10000余個隨機電話號碼,撥通查明為住宅電話後,要求在本戶6~84歲的常住並説中文的成員中訪問一名生日最近者。如被抽中的電話無人接、抽中的被訪者不在家或不便接受訪問,訪問員在不同的日期與不同的時段先後五次回撥。
調查成功率:按美國輿論研究協會 (AAPOR) 的成功率公式三 (RR3) 計算 (詳見AAPOR 網址:http://www.aapor.org/default.asp?page=survey_methods/standards_and_best_practices/standard_definitions#response),本調查的成功率為33%,與2000~2004年度調查結果(分別為38%、35%、36%、33%和41%)相倣。
(三)加權方法:在統計分析之前,以香港2005年6月人口統計資料中性別與年齡的交叉分佈為基數、對樣本作了加權處理,使得樣本與對應總體的性別與年齡的結構相同。
(四)數據預處理:在上述報告中使用了一系列平均數,如每人平均上網時間、電郵賬號數、收發電郵數等。眾所週知,一組數據中如出現個別極大或極小的異常值,會明顯影響該組數據平均數的取值。按慣例在計算上述平均數前,先剔除了原始數據中的異常值(定義為大於或小于平均數的三個標準差)。如此修正過的平均數,比原始數據的平均數減小10%~50%不等,但更接近總體的實際情況。(摘自CNNIC第17次中國網際網路絡發展狀況統計報告)
|