怎麼評估統計顯著性

1、如下圖，比較兩組數據之間的差異性。 2、爲Excel添加分析工具的加載項插件，步驟如下：（1）點擊office按鈕，彈出excel選項，選擇加載項中的轉到。（2）勾選分析工具庫。 3、分析步驟如下：（1）選擇數據區域，點擊數據，選擇其中分析裏面

本文我們將從以下幾個部分來詳細介紹如何評估統計顯著性：設計實驗、計算標準方差、確定顯著性、14 參考

檢驗假設需要以統計分析爲依據。統計顯著性是用p值來計算的，這個值告訴我們在特定命題，或者說零假設爲真的情況下，得到預計結果的概率。如果p值小於通常爲0.05的顯著性水平值，那麼實驗者可以認爲零假設是錯誤的，並接受備擇假設。你可以使用簡單的t檢驗來計算p值，並確定數據集中兩個不同組之間的差異顯著性。部分 1設計實驗

檢測圖像的顯著性,通常評估時都會用到P-R曲線(準確率-召回率),F-值,ROC曲線等等。 50 這些曲線一般都用MATLAB畫,想問一下,怎麼畫呢?有沒有代碼之類的。

第1步：定義假設。

顯著性水平就是那個sig值，不都是0麼，怎麼會沒有達到顯著水平0.01啊，應該都顯著的埃

評估統計顯著性的第一步是確定你想回答的問題，並提出你的假設。這個假設涉及到你的實驗數據和人羣中可能出現的差異。對於任何實驗而言，必須既有零假設，又有備擇假設。一般來說，你會比較兩個組，看它們是否相同。

模型的擬合度是用R和R方來表示的，一般大於0.4就可以了；自變量的顯著性是根據各個自變量係數後面的Sig值判斷的，如果小於0.05可以說在95%的顯著性水平下顯著，小於0.01就可以說在99%的顯著性水平下顯著了。如果沒有給出係數表，是看不到顯著性

零假設H0通常表示兩個數據集之間沒有差異。例如：課前預習教材的學生期末成績不會更好。

而備擇假設Ha與零假設相反，它是你試圖用實驗數據支持的命題。例如：課前預習教材的學生期末成績會更好。

檢測圖像的顯著性,通常評估時都會用到P-R曲線(準確率-召回率),F-值,ROC曲線等等。 50 這些曲線一般都用MATLAB畫,想問一下,怎麼畫呢?有沒有代碼之類的。

第2步：設置顯著性水平，以確定數據被視爲顯著時所需的異常程度。

顯著性水平就是那個sig值，不都是0麼，怎麼會沒有達到顯著水平0.01啊，應該都顯著的埃

顯著性水平也被稱爲α，它是你爲了確定顯著性而設置的閾值。如果你的p值小於等於設定的顯著性水平，數據就被認爲具有統計顯著性。

一般來說，顯著性水平α通常被設置成0.05，換而言之，在你的數據中偶爾觀察到差異的概率僅爲5%。

置信水平越高時，p值越小，結果也越顯著。

檢測圖像的顯著性,通常評估時都會用到P-R曲線(準確率-召回率),F-值,ROC曲線等等。 50 這些曲線一般都用MATLAB畫,想問一下,怎麼畫呢?有沒有代碼之類的。

如果你想讓自己的數據具有較高的置信水平，可以把p值設到0.01以下。在製造業中，檢查產品缺陷通常會用到較小的p值。因爲每個零部件都必須達到很高的置信水平，使之能夠按照預期發揮作用。

對於假設驅動型實驗，0.05的顯著性水平是可以接受的。

第3步：確定使用單側檢驗還是雙側檢驗。

t檢驗的適用條件之一是你的數據呈正態分佈。正態分佈的數據會形成鐘形曲線，大部分樣本位於中間。t檢驗是一種數學檢驗，可以確定你的數據在曲線“尾部”是否落在正態分部以外，是在曲線以上還是以下。

單側檢驗比雙側檢驗更強大，因爲它在一個方向檢驗關係的潛力，比如控制組以上，而雙側檢驗在兩個方向檢關係的潛力，比如控制組以上或以下。

如果你不確定自己的數據是在控制組以上還是以下，那就使用雙側檢驗。這樣你就能檢驗任一方向的顯著性。

如果你知道數據會朝哪個方向發展，請使用單側檢驗。在前文給出的例子中，你預計學生的成績會提高，所以你可以用單側檢驗。

第4步：使用功效分析來確定樣本量。

檢驗功效指的是在特定的樣本量下，觀察到預期結果的概率。功效或β的常見閾值是80%。缺乏一些初步數據時，功效分析可能有點棘手，因爲你需要一些關於每組之間平均值及其標準方差的信息。你可以使用網上的功效分析計算器，來確定自己數據的最佳樣本量。

開展大型、全面的研究時，研究人員通常會做一個小型的先導型研究，以獲得功效分析所需的信息，並確定其樣本量。

如果沒有辦法做複雜的先導型研究，你可以閱讀文獻和其他人做過的研究，據此來估計可能的平均值。在確定樣本量時，這是一個很好的着手點。

部分 2計算標準方差

第1步：確定標準方差公式。

標準方差是衡量數據分佈情況的指標。它向你提供了樣本中各數據點的相似性信息，有助於確定數據是否顯著。乍一看，你可能覺得公式有點複雜，但是以下步驟會引導你完成計算過程。其公式是s = √∑((xi – ?)2/(N – 1))。

s是標準方差。

∑指對收集的所有樣本值求和。

xi表示你數據的各單獨值。

?是每組數據的平均值。

N是樣本總數。

第2步：計算每組樣本的平均值。

要想計算標準方差，你必須先計算每組樣本的平均值。平均值用希臘字母?表示。它的計算方法很簡單，只需將每個值相加，再除以樣本總數即可。

例如，爲了計算課前預習教材的學生組的平均成績，讓我們來看一些數據。爲了簡便起見，我們會使用包含5個值的數據集：90、91、85、83和94。

將所有樣本相加求和：90 + 91 + 85 + 83 + 94 = 443。

用和除以樣本數N = 5：443/5 = 88.6。

這組學生的平均成績是88.6。

第3步：用每個樣本減去平均值。

計算的下一步涉及到公式的(xi – ?)部分。你需要用每個樣本減去剛剛計算得出的平均值。在我們的例子中，你必須做五次減法。

(90 – 88.6)、(91- 88.6)、(85 – 88.6)、(83 – 88.6)和(94 – 88.6)。

計算所得的結果是1.4、2.4、-3.6、-5.6和5.4。

第4步：將這些數字平方後再相加。

這時，你需要計算剛剛得出的每個數字的平方。這一步還會處理掉所有負號。如果在此步驟之後或計算結束時有負號，說明你可能忘了算這一步。

在我們的例題中，那五個數字的平方是1.96、5.76、12.96、31.36和29.16。

將這些平方值相加，得到：1.96 + 5.76 + 12.96 + 31.36 + 29.16 = 81.2。

第5步：除以樣本總數減一。

公式除以N-1，是因爲你沒有計算所有人的成績，要進行修正，你只是在所有學生中取了一個樣本，來進行估算。

做減法：N – 1 = 5 – 1 = 4

做除法：81.2/4 = 20.3

第6步：取平方根。

除以樣本數減一後，取最終數字的平方根。這是計算標準方差的最後一步。有一些統計學應用程序可以在你輸入原始數據後，幫你計算標準方差。

在我們的例題中，課前預習的學生期末成績的標準方差是：s =√20.3 = 4.51。

部分 3確定顯著性

第1步：計算2個樣本組之間的差額。

至此爲止，例題只處理了一個樣本組。如果想比較兩個樣本組，你顯然需要兩組的數據。計算第二組樣本的標準方差，並使用該數值來計算2個實驗組之間的差額。差額公式爲sd = √((s1/N1) + (s2/N2))。

sd是兩組之間的差額。

s1是第1組的標準方差，而N1是第1組的樣本量。

s2是第2組的標準方差，而N2是第2組的樣本量。

例如，假設第2組數據，即課前沒有預習的學生的數據樣本量是5，而標準方差是5.81。差額爲：

sd = √((s1)2/N1) + ((s2)2/N2))

sd = √(((4.51)2/5) + ((5.81)2/5)) = √((20.34/5) + (33.76/5)) = √(4.07 + 6.75) = √10.82 = 3.29。

第2步：計算數據的t分數。

t分數可以將數據轉化爲能夠與其他數據進行比較的形式。你可以使用t分數來做t檢驗，計算兩組之間存在顯著差異的可能性。t分數的公式是t = (?1 – ?2)/sd。

?1是第一組的平均值。

?2是第二組的平均值。

sd是樣本之間的差額。

你應該使用較大的平均值作爲?1，以免t值變成負數。

例如，假設第2組沒有預習的學生的樣本平均值是80。則t分數爲：t = (?1 – ?2)/sd = (88.6 – 80)/3.29 = 2.61。

第3步：確定樣本的自由度。

使用t分數時，自由度的數值是用樣本量確定的。將兩組的樣本數相加，然後減2。在我們的例子中，自由度(d.f.)是8，因爲第1組有5個樣本，而第2組也有5個樣本，(5 + 5) – 2 = 8。

第4步：使用t表格來評估顯著性。

你可以在標準的統計學書籍或網上找到t分數和自由度表格。查找包含數據自由度的行，找到與t分數對應的p值。

當自由度爲8，t值爲2.61時，單側檢驗的p值介於0.01和0.025之間。由於我們將顯著性水平設置爲小於等於0.05，所以我們的數值具有統計顯著性。得到這一數據後，我們可以拒絕零假設，接受備擇假設：課前預習教材的學生會取得更好的期末成績。

第5步：考慮後續研究。

許多研究人員會使用少量的數據，做一個小規模的先導型研究，以幫助自己瞭解如何設計一個規模更大的研究。使用更多的數據，做另一項研究，有助於提高你對結論的信心。

後續研究可以幫助你確定自己的結論是否包含I型錯誤或II型錯誤。前者指在沒有差異的情況下觀察到差異，或錯誤的拒絕零假設，而後者指在有差異時未觀察到差異，或錯誤的接受零假設。

小提示

統計學是一個龐大而複雜的學科。你可以學習高中、大學或更高級別的統計推斷課程，幫助自己理解統計顯著性。

警告

這種分析針對的是t檢驗，後者檢驗的是兩個正態分佈人羣之間的差異。根據數據集複雜程度的不同，你可能得使用不同的統計學檢驗方法。

參考

http://blog.minitab.com/blog/adventures-in-statistics/how-to-correctly-interpret-p-values

https://statistics.laerd.com/statistical-guides/hypothesis-testing-3.php

http://www.stat.yale.edu/Courses/1997-98/101/sigtest.htm

https://web.csulb.edu/~msaintg/ppa696/696stsig.htm#INTERPRET THE Chi

https://stats.idre.ucla.edu/other/mult-pkg/faq/general/faq-what-are-the-differences-between-one-tailed-and-two-tailed-tests/

http://powerandsamplesize.com/Calculators/Compare-2-Means/2-Sample-1-Sided

https://www.mathsisfun.com/data/standard-deviation-formulas.html

http://archive.bio.ed.ac.uk/jdeacon/statistics/tress4a.html

http://www.kean.edu/~fosborne/bstat/07b2means.html

http://www.sjsu.edu/59820fa5b3ce1e/58861ea3abd706c6/6c970da48fc80ec5fe35/4b.table.pdf

https://statistics.laerd.com/statistical-guides/hypothesis-testing-3.php

https://www.stat.berkeley.edu/~hhuang/STAT141/Lecture-FDR.pdf

顯示更多... (5)

擴展閱讀，以下內容您可能還感興趣。

如何分析迴歸模型的擬合度和顯著性

模型的擬合度是用R和R方來表示的，一般大於0.4就可以了；自變量的顯著性是根據各個自變量係數後面的Sig值判斷的，如果小於0.05可以說在95%的顯著性水平下顯著，小於0.01就可以說在99%的顯著性水平下顯著了。如果沒有給出係數表，是看不到顯著性如何的。

迴歸分析(regression analysis)是研究一個變量（被解釋變量）關於另一個（些）變量（解釋變量）的具體依賴關係的計算方法和理論。從一組樣本數據出發，確定變量之間的數學關係式對這些關係式的可信程度進行各種統計檢驗，並從影響某一特定變量的諸多變量中找出哪些變量的影響顯著，哪些不顯著。利用所求的關係式，根據一個或幾個變量的取值來預測或控制另一個特定變量的取值，並給出這種預測或控制的精確程度。

其用意：在於通過後者的已知或設定值，去估計和（或）預測前者的（總體）均值。

拓展資料：

迴歸模型（regression model）對統計關係進行定量描述的一種數學模型。如多元線性迴歸的數學模型可以表示爲y=β0+β1*x+εi，式中，β0，β1，…，βp是p+1個待估計的參數，εi是相互獨立且服從同一正態分佈N(0,σ2)的隨機變量，y是隨機變量；x可以是隨機變量，也可以是非隨機變量,βi稱爲迴歸係數，表徵自變量對因變量影響的程度。

（資料來源：百度百科：迴歸模型）

如何比較兩組數據之間的差異性

1、如下圖，比較兩組數據之間的差異性。

2、爲Excel添加分析工具的加載項插件，步驟如下：

（1）點擊office按鈕，彈出excel選項，選擇加載項中的轉到。

（2）勾選分析工具庫。

3、分析步驟如下：

（1）選擇數據區域，點擊數據，選擇其中分析裏面的數據分析。

（2）選擇單因素方差分析。

4、設置分析參數

5、查看分析結果

擴展資料

相關分析研究的是兩個變量的相關性,但你研究的兩個變量必須是有關聯的,如果你把歷年人口總量和你歷年的身高做相關性分析,分析結果會呈現顯著地相關,但它沒有實際的意義,因爲人口總量和你的身高都是逐步增加的,從數據上來說是有一致性,但他們沒有現實意義。

當數據之間具有了顯著性差異，就說明參與比對的數據不是來自於同一總體（Population），而是來自於具有差異的兩個不同總體，這種差異可能因參與比對的數據是來自不同實驗對象的，比如一些一般能力測驗中，大學學歷被試組的成績與小學學歷被試組會有顯著性差異。也可能來自於實驗處理對實驗對象造成了根本性狀改變，因而前測後測的數據會有顯著性差異。

請問有人知道顯著性評估方法NSS扥代碼嗎？

顯著性水平就是那個sig值，不都是0麼，怎麼會沒有達到顯著水平0.01啊，應該都顯著的啊。

如何分析迴歸模型的擬合度和顯著性

其用意：在於通過後者的已知或設定值，去估計和（或）預測前者的（總體）均值。

拓展資料：

（資料來源：百度百科：迴歸模型）