首先了解基本統計知識(大約5分鐘),接着選擇正確的研究方法進行結果解讀;與此同時,了解一些問卷研究的思路使得研究更加順手。與此同時,掌握一些數據清理的技能更好,比如對異常數據處理。

01. 基礎知識
(1)數據類型識別
數據共分為兩類,定量和定類數據:
術語說明舉例定量數據數字大小具有比較意義您對天貓的滿意度情況(非常不滿意,比較不滿意,中立,比較滿意,非常滿意)定類數據數字大小代表分類性別(男和女),專業(文科、理科、工科)
(2)P值的意義
p 值是統計學名詞,其用於測量數據間的規律情況把握程度。如果p 值小於0.01即說明某件事情的發生至少有99%的把握,如果p 值小於0.05(並且大於0.01)則說明某件事情的發生至少有95%的把握。
研究人員想研究不同性別人群的購買意願是否有明顯的差異,如果對應的p 值小於0.05,則說明呈現出0.05水平的顯著性差異,即說明不同性別人群的購買意願有着明顯的差異,而且對此類差異至少有95%的把握,絕大多數研究均希望p 值小於0.05,即說明有影響,有關係,或者有差異等。
(3)量表
量表答項類似於“非常同意”、“同意”、“不一定”、“不同意”、“非常不同意”,也或者“非常滿意”、“比較滿意”、“中立”、“比較不滿意”,“非常不滿意”等。大多數統計方法均只能針對量表。量表是一種非常典型的定量數據,當然個別情況時也可以將其看成定類(即認可態度不同的幾類群體,但這種時候非常少)。
02. 分析方法選擇使用
在確認好數據類型後,接着便可選擇正確的研究方法。如下說明:
參考資料:https://spssau.com/helps/basics/concept.html
SPSSAU建議:先描述想研究什麼用一句話描述。話裡面拆成X和Y:然後結合X與Y的數據類型,選擇對應的方法。

比如性別/專業等為定類數據,那麼基本情況分析部分,直接使用頻數分析即可;
如果數據中有量表態度題,那麼基本情況分析時,可計算量表題的平均值,了解樣本的平均態度情況;
進一步想深入分析差異關係,如果是定類和定類關係,比如‘性別’和‘是否吸煙’的關係,那麼可使用交叉(卡方)分析;如果是定類和定量關係,比如‘性別’和‘身高’的關係,那麼可使用方差分析;
進一步想深入分析影響關係,即X對於Y的影響,如果Y是定量數據(比如身高),那麼可使用線性回歸。如果說Y是定類數據(比如是否願意購買電影票,購買哪種類型的電影票),那麼就需要使用Logit回歸分析,比如Y為是否願意(yes和no兩項),那麼就使用二元Logit回歸,如果是多個類別(比如購買‘愛情類’,‘喜劇類’,‘恐怖類’),那麼此時使用多分類Logit回歸即可。
如果數據中有量表數據即態度題,那麼通常需要使用測量數據的真實性和量表設計的有效性,可使用信度和效度分析。
如果數據中有多選題(多選題是一種特殊的定類數據,其分析應該以‘某個多選題的所有選項作為整體’一次性分析),可使用SPSSAU問卷研究裡面的‘多選題’,‘單選-多選’,‘多選-多選’,‘多選-單選’。分別分析多選題各項的選擇比例,也或者單選題和多選題的差異關係,也或者多選題和多選題的差異關係,也或者多選題和單選題的差異關係。
03. 問卷思路剖析
問卷思路上一般分成三個部分,分別是基本情況分析,差異關係研究和影響關係研究。
- 首先是對問卷數據做基本的描述分析,結合數據類型,選擇使用頻數分析,或者描述分析即可;
- 接着研究差異關係情況,結合數據類型選擇使用交叉卡方分析,或者方差分析即可;
- 接着研究影響關係情況,即X對於Y的影響,結合Y的數據類型,選擇使用線性回歸或者Logit回歸即可。

參考資料如下:https://spssau.com/helps/basics/framemodule.html
(1)基本情況分析
分析方法:頻數分析/描述分析
- 了解樣本特徵情況,基本認知情況,基本態度情況
- 比如個體基本特徵(性別,年齡,學歷,專業)等基本分布情況如何;比如對於疫情的認知情況或態度情況如何?
(2)探索規律(差異關係)
分析方法:交叉卡方分析/方差分析
- 深入分析差異情況,找出數據規律
- 比如分析不同性別/學歷/專業群體,他們對於疫情認知態度差異情況如何?
(3)探索規律(影響關係)
分析方法:線性回歸/Logit回歸
- 深入分析更進一步的影響關係情況,找出數據規律
- 比如分析疫情認知態度情況 對 ‘疫情期間是否外出就讀’的影響關係情況?
(4)其它
如果數據有量表題,那麼可以測量數據的真實性和量表題設計的有效性。(僅針對量表題)
分析方法:信度分析/效度分析
- 探究數據的真實性和量表題設計的有效性
- 比如使用量表題詢問‘消費升級’的態度情況,那麼回收數據是否真實,且是否真的測量了‘消費升級’這個概念。
04.數據清理技能
數據分析前,有可能需要對數據進行清理,比如某個標題需要修改下,也比如數據中有大篇幅沒有填寫,也或者很多亂答(都選擇同一個答案),那麼此時需要做‘無效樣本’處理。
與此同時,數據分析的時候,比如想把學歷‘小學/初中/高中/大學/研究生’共5個類別,現在想組合成3個類別,分別是‘高中及以下/大學/研究生’,那麼此時需要使用數據編碼功能。
以上就是本次分享的內容啦。如果你有什麼疑難問題,可以在評論區告訴我們。
原創文章,作者:投稿專員,如若轉載,請註明出處:https://www.506064.com/zh-hant/n/218927.html