1、如下圖,比較兩組數(shù)據(jù)之間的差異性。 2、為Excel添加分析工具的加載項(xiàng)插件,步驟如下: (1)點(diǎn)擊office按鈕,彈出excel選項(xiàng),選擇加載項(xiàng)中的轉(zhuǎn)到。 (2)勾選分析工具庫。 3、分析步驟如下: (1)選擇數(shù)據(jù)區(qū)域,點(diǎn)擊數(shù)據(jù),選擇其中分析里面
本文我們將從以下幾個(gè)部分來詳細(xì)介紹如何評估統(tǒng)計(jì)顯著性:設(shè)計(jì)實(shí)驗(yàn)、計(jì)算標(biāo)準(zhǔn)方差、確定顯著性、14 參考
檢驗(yàn)假設(shè)需要以統(tǒng)計(jì)分析為依據(jù)。統(tǒng)計(jì)顯著性是用p值來計(jì)算的,這個(gè)值告訴我們在特定命題,或者說零假設(shè)為真的情況下,得到預(yù)計(jì)結(jié)果的概率。如果p值小于通常為0.05的顯著性水平值,那么實(shí)驗(yàn)者可以認(rèn)為零假設(shè)是錯(cuò)誤的,并接受備擇假設(shè)。你可以使用簡單的t檢驗(yàn)來計(jì)算p值,并確定數(shù)據(jù)集中兩個(gè)不同組之間的差異顯著性。部分 1設(shè)計(jì)實(shí)驗(yàn)
檢測圖像的顯著性,通常評估時(shí)都會用到P-R曲線(準(zhǔn)確率-召回率),F-值,ROC曲線等等。 50 這些曲線一般都用MATLAB畫,想問一下,怎么畫呢?有沒有代碼之類的。
第1步:定義假設(shè)。
顯著性水平就是那個(gè)sig值,不都是0么,怎么會沒有達(dá)到顯著水平0.01啊,應(yīng)該都顯著的埃
評估統(tǒng)計(jì)顯著性的第一步是確定你想回答的問題,并提出你的假設(shè)。這個(gè)假設(shè)涉及到你的實(shí)驗(yàn)數(shù)據(jù)和人群中可能出現(xiàn)的差異。對于任何實(shí)驗(yàn)而言,必須既有零假設(shè),又有備擇假設(shè)。一般來說,你會比較兩個(gè)組,看它們是否相同。
模型的擬合度是用R和R方來表示的,一般大于0.4就可以了;自變量的顯著性是根據(jù)各個(gè)自變量系數(shù)后面的Sig值判斷的,如果小于0.05可以說在95%的顯著性水平下顯著,小于0.01就可以說在99%的顯著性水平下顯著了。如果沒有給出系數(shù)表,是看不到顯著性
零假設(shè)H0通常表示兩個(gè)數(shù)據(jù)集之間沒有差異。例如:課前預(yù)習(xí)教材的學(xué)生期末成績不會更好。
1、如下圖,比較兩組數(shù)據(jù)之間的差異性。 2、為Excel添加分析工具的加載項(xiàng)插件,步驟如下: (1)點(diǎn)擊office按鈕,彈出excel選項(xiàng),選擇加載項(xiàng)中的轉(zhuǎn)到。 (2)勾選分析工具庫。 3、分析步驟如下: (1)選擇數(shù)據(jù)區(qū)域,點(diǎn)擊數(shù)據(jù),選擇其中分析里面
而備擇假設(shè)Ha與零假設(shè)相反,它是你試圖用實(shí)驗(yàn)數(shù)據(jù)支持的命題。例如:課前預(yù)習(xí)教材的學(xué)生期末成績會更好。
檢測圖像的顯著性,通常評估時(shí)都會用到P-R曲線(準(zhǔn)確率-召回率),F-值,ROC曲線等等。 50 這些曲線一般都用MATLAB畫,想問一下,怎么畫呢?有沒有代碼之類的。
第2步:設(shè)置顯著性水平,以確定數(shù)據(jù)被視為顯著時(shí)所需的異常程度。
顯著性水平就是那個(gè)sig值,不都是0么,怎么會沒有達(dá)到顯著水平0.01啊,應(yīng)該都顯著的埃
顯著性水平也被稱為α,它是你為了確定顯著性而設(shè)置的閾值。如果你的p值小于等于設(shè)定的顯著性水平,數(shù)據(jù)就被認(rèn)為具有統(tǒng)計(jì)顯著性。
模型的擬合度是用R和R方來表示的,一般大于0.4就可以了;自變量的顯著性是根據(jù)各個(gè)自變量系數(shù)后面的Sig值判斷的,如果小于0.05可以說在95%的顯著性水平下顯著,小于0.01就可以說在99%的顯著性水平下顯著了。如果沒有給出系數(shù)表,是看不到顯著性
一般來說,顯著性水平α通常被設(shè)置成0.05,換而言之,在你的數(shù)據(jù)中偶爾觀察到差異的概率僅為5%。
1、如下圖,比較兩組數(shù)據(jù)之間的差異性。 2、為Excel添加分析工具的加載項(xiàng)插件,步驟如下: (1)點(diǎn)擊office按鈕,彈出excel選項(xiàng),選擇加載項(xiàng)中的轉(zhuǎn)到。 (2)勾選分析工具庫。 3、分析步驟如下: (1)選擇數(shù)據(jù)區(qū)域,點(diǎn)擊數(shù)據(jù),選擇其中分析里面
置信水平越高時(shí),p值越小,結(jié)果也越顯著。
檢測圖像的顯著性,通常評估時(shí)都會用到P-R曲線(準(zhǔn)確率-召回率),F-值,ROC曲線等等。 50 這些曲線一般都用MATLAB畫,想問一下,怎么畫呢?有沒有代碼之類的。
如果你想讓自己的數(shù)據(jù)具有較高的置信水平,可以把p值設(shè)到0.01以下。在制造業(yè)中,檢查產(chǎn)品缺陷通常會用到較小的p值。因?yàn)槊總€(gè)零部件都必須達(dá)到很高的置信水平,使之能夠按照預(yù)期發(fā)揮作用。
對于假設(shè)驅(qū)動(dòng)型實(shí)驗(yàn),0.05的顯著性水平是可以接受的。
第3步:確定使用單側(cè)檢驗(yàn)還是雙側(cè)檢驗(yàn)。
t檢驗(yàn)的適用條件之一是你的數(shù)據(jù)呈正態(tài)分布。正態(tài)分布的數(shù)據(jù)會形成鐘形曲線,大部分樣本位于中間。t檢驗(yàn)是一種數(shù)學(xué)檢驗(yàn),可以確定你的數(shù)據(jù)在曲線“尾部”是否落在正態(tài)分部以外,是在曲線以上還是以下。
單側(cè)檢驗(yàn)比雙側(cè)檢驗(yàn)更強(qiáng)大,因?yàn)樗谝粋€(gè)方向檢驗(yàn)關(guān)系的潛力,比如控制組以上,而雙側(cè)檢驗(yàn)在兩個(gè)方向檢關(guān)系的潛力,比如控制組以上或以下。
如果你不確定自己的數(shù)據(jù)是在控制組以上還是以下,那就使用雙側(cè)檢驗(yàn)。這樣你就能檢驗(yàn)任一方向的顯著性。
如果你知道數(shù)據(jù)會朝哪個(gè)方向發(fā)展,請使用單側(cè)檢驗(yàn)。在前文給出的例子中,你預(yù)計(jì)學(xué)生的成績會提高,所以你可以用單側(cè)檢驗(yàn)。
第4步:使用功效分析來確定樣本量。
檢驗(yàn)功效指的是在特定的樣本量下,觀察到預(yù)期結(jié)果的概率。功效或β的常見閾值是80%。缺乏一些初步數(shù)據(jù)時(shí),功效分析可能有點(diǎn)棘手,因?yàn)槟阈枰恍╆P(guān)于每組之間平均值及其標(biāo)準(zhǔn)方差的信息。你可以使用網(wǎng)上的功效分析計(jì)算器,來確定自己數(shù)據(jù)的最佳樣本量。
開展大型、全面的研究時(shí),研究人員通常會做一個(gè)小型的先導(dǎo)型研究,以獲得功效分析所需的信息,并確定其樣本量。
如果沒有辦法做復(fù)雜的先導(dǎo)型研究,你可以閱讀文獻(xiàn)和其他人做過的研究,據(jù)此來估計(jì)可能的平均值。在確定樣本量時(shí),這是一個(gè)很好的著手點(diǎn)。
部分 2計(jì)算標(biāo)準(zhǔn)方差
第1步:確定標(biāo)準(zhǔn)方差公式。
標(biāo)準(zhǔn)方差是衡量數(shù)據(jù)分布情況的指標(biāo)。它向你提供了樣本中各數(shù)據(jù)點(diǎn)的相似性信息,有助于確定數(shù)據(jù)是否顯著。乍一看,你可能覺得公式有點(diǎn)復(fù)雜,但是以下步驟會引導(dǎo)你完成計(jì)算過程。其公式是s = √∑((xi – ?)2/(N – 1))。
s是標(biāo)準(zhǔn)方差。
∑指對收集的所有樣本值求和。
xi表示你數(shù)據(jù)的各單獨(dú)值。
?是每組數(shù)據(jù)的平均值。
N是樣本總數(shù)。
第2步:計(jì)算每組樣本的平均值。
要想計(jì)算標(biāo)準(zhǔn)方差,你必須先計(jì)算每組樣本的平均值。平均值用希臘字母?表示。它的計(jì)算方法很簡單,只需將每個(gè)值相加,再除以樣本總數(shù)即可。
例如,為了計(jì)算課前預(yù)習(xí)教材的學(xué)生組的平均成績,讓我們來看一些數(shù)據(jù)。為了簡便起見,我們會使用包含5個(gè)值的數(shù)據(jù)集:90、91、85、83和94。
將所有樣本相加求和:90 + 91 + 85 + 83 + 94 = 443。
用和除以樣本數(shù)N = 5:443/5 = 88.6。
這組學(xué)生的平均成績是88.6。
第3步:用每個(gè)樣本減去平均值。
計(jì)算的下一步涉及到公式的(xi – ?)部分。你需要用每個(gè)樣本減去剛剛計(jì)算得出的平均值。在我們的例子中,你必須做五次減法。
(90 – 88.6)、(91- 88.6)、(85 – 88.6)、(83 – 88.6)和(94 – 88.6)。
計(jì)算所得的結(jié)果是1.4、2.4、-3.6、-5.6和5.4。
第4步:將這些數(shù)字平方后再相加。
這時(shí),你需要計(jì)算剛剛得出的每個(gè)數(shù)字的平方。這一步還會處理掉所有負(fù)號。如果在此步驟之后或計(jì)算結(jié)束時(shí)有負(fù)號,說明你可能忘了算這一步。
在我們的例題中,那五個(gè)數(shù)字的平方是1.96、5.76、12.96、31.36和29.16。
將這些平方值相加,得到:1.96 + 5.76 + 12.96 + 31.36 + 29.16 = 81.2。
第5步:除以樣本總數(shù)減一。
公式除以N-1,是因?yàn)槟銢]有計(jì)算所有人的成績,要進(jìn)行修正,你只是在所有學(xué)生中取了一個(gè)樣本,來進(jìn)行估算。
做減法:N – 1 = 5 – 1 = 4
做除法:81.2/4 = 20.3
第6步:取平方根。
除以樣本數(shù)減一后,取最終數(shù)字的平方根。這是計(jì)算標(biāo)準(zhǔn)方差的最后一步。有一些統(tǒng)計(jì)學(xué)應(yīng)用程序可以在你輸入原始數(shù)據(jù)后,幫你計(jì)算標(biāo)準(zhǔn)方差。
在我們的例題中,課前預(yù)習(xí)的學(xué)生期末成績的標(biāo)準(zhǔn)方差是:s =√20.3 = 4.51。
部分 3確定顯著性
第1步:計(jì)算2個(gè)樣本組之間的差額。
至此為止,例題只處理了一個(gè)樣本組。如果想比較兩個(gè)樣本組,你顯然需要兩組的數(shù)據(jù)。計(jì)算第二組樣本的標(biāo)準(zhǔn)方差,并使用該數(shù)值來計(jì)算2個(gè)實(shí)驗(yàn)組之間的差額。差額公式為sd = √((s1/N1) + (s2/N2))。
sd是兩組之間的差額。
s1是第1組的標(biāo)準(zhǔn)方差,而N1是第1組的樣本量。
s2是第2組的標(biāo)準(zhǔn)方差,而N2是第2組的樣本量。
例如,假設(shè)第2組數(shù)據(jù),即課前沒有預(yù)習(xí)的學(xué)生的數(shù)據(jù)樣本量是5,而標(biāo)準(zhǔn)方差是5.81。差額為:
sd = √((s1)2/N1) + ((s2)2/N2))
sd = √(((4.51)2/5) + ((5.81)2/5)) = √((20.34/5) + (33.76/5)) = √(4.07 + 6.75) = √10.82 = 3.29。
第2步:計(jì)算數(shù)據(jù)的t分?jǐn)?shù)。
t分?jǐn)?shù)可以將數(shù)據(jù)轉(zhuǎn)化為能夠與其他數(shù)據(jù)進(jìn)行比較的形式。你可以使用t分?jǐn)?shù)來做t檢驗(yàn),計(jì)算兩組之間存在顯著差異的可能性。t分?jǐn)?shù)的公式是t = (?1 – ?2)/sd。
?1是第一組的平均值。
?2是第二組的平均值。
sd是樣本之間的差額。
你應(yīng)該使用較大的平均值作為?1,以免t值變成負(fù)數(shù)。
例如,假設(shè)第2組沒有預(yù)習(xí)的學(xué)生的樣本平均值是80。則t分?jǐn)?shù)為:t = (?1 – ?2)/sd = (88.6 – 80)/3.29 = 2.61。
第3步:確定樣本的自由度。
使用t分?jǐn)?shù)時(shí),自由度的數(shù)值是用樣本量確定的。將兩組的樣本數(shù)相加,然后減2。在我們的例子中,自由度(d.f.)是8,因?yàn)榈?組有5個(gè)樣本,而第2組也有5個(gè)樣本,(5 + 5) – 2 = 8。
第4步:使用t表格來評估顯著性。
你可以在標(biāo)準(zhǔn)的統(tǒng)計(jì)學(xué)書籍或網(wǎng)上找到t分?jǐn)?shù)和自由度表格。查找包含數(shù)據(jù)自由度的行,找到與t分?jǐn)?shù)對應(yīng)的p值。
當(dāng)自由度為8,t值為2.61時(shí),單側(cè)檢驗(yàn)的p值介于0.01和0.025之間。由于我們將顯著性水平設(shè)置為小于等于0.05,所以我們的數(shù)值具有統(tǒng)計(jì)顯著性。得到這一數(shù)據(jù)后,我們可以拒絕零假設(shè),接受備擇假設(shè):課前預(yù)習(xí)教材的學(xué)生會取得更好的期末成績。
第5步:考慮后續(xù)研究。
許多研究人員會使用少量的數(shù)據(jù),做一個(gè)小規(guī)模的先導(dǎo)型研究,以幫助自己了解如何設(shè)計(jì)一個(gè)規(guī)模更大的研究。使用更多的數(shù)據(jù),做另一項(xiàng)研究,有助于提高你對結(jié)論的信心。
后續(xù)研究可以幫助你確定自己的結(jié)論是否包含I型錯(cuò)誤或II型錯(cuò)誤。前者指在沒有差異的情況下觀察到差異,或錯(cuò)誤的拒絕零假設(shè),而后者指在有差異時(shí)未觀察到差異,或錯(cuò)誤的接受零假設(shè)。
小提示
統(tǒng)計(jì)學(xué)是一個(gè)龐大而復(fù)雜的學(xué)科。你可以學(xué)習(xí)高中、大學(xué)或更高級別的統(tǒng)計(jì)推斷課程,幫助自己理解統(tǒng)計(jì)顯著性。
警告
這種分析針對的是t檢驗(yàn),后者檢驗(yàn)的是兩個(gè)正態(tài)分布人群之間的差異。根據(jù)數(shù)據(jù)集復(fù)雜程度的不同,你可能得使用不同的統(tǒng)計(jì)學(xué)檢驗(yàn)方法。
參考
http://blog.minitab.com/blog/adventures-in-statistics/how-to-correctly-interpret-p-values
https://statistics.laerd.com/statistical-guides/hypothesis-testing-3.php
http://www.stat.yale.edu/Courses/1997-98/101/sigtest.htm
https://web.csulb.edu/~msaintg/ppa696/696stsig.htm#INTERPRET THE Chi
https://stats.idre.ucla.edu/other/mult-pkg/faq/general/faq-what-are-the-differences-between-one-tailed-and-two-tailed-tests/
http://powerandsamplesize.com/Calculators/Compare-2-Means/2-Sample-1-Sided
https://www.mathsisfun.com/data/standard-deviation-formulas.html
https://www.mathsisfun.com/data/standard-deviation-formulas.html
http://archive.bio.ed.ac.uk/jdeacon/statistics/tress4a.html
http://archive.bio.ed.ac.uk/jdeacon/statistics/tress4a.html
http://www.kean.edu/~fosborne/bstat/07b2means.html
http://www.sjsu.edu/faculty/gerstman/StatPrimer/t-table.pdf
https://statistics.laerd.com/statistical-guides/hypothesis-testing-3.php
https://www.stat.berkeley.edu/~hhuang/STAT141/Lecture-FDR.pdf
顯示 更多... (5)
擴(kuò)展閱讀,以下內(nèi)容您可能還感興趣。
如何分析回歸模型的擬合度和顯著性
模型的擬合度是用R和R方來表示的,一般大于0.4就可以了;自變量的顯著性是根據(jù)各個(gè)自變量系數(shù)后面的Sig值判斷的,如果小于0.05可以說在95%的顯著性水平下顯著,小于0.01就可以說在99%的顯著性水平下顯著了。如果沒有給出系數(shù)表,是看不到顯著性如何的。
回歸分析(regression analysis)是研究一個(gè)變量(被解釋變量)關(guān)于另一個(gè)(些)變量(解釋變量)的具體依賴關(guān)系的計(jì)算方法和理論。 從一組樣本數(shù)據(jù)出發(fā),確定變量之間的數(shù)學(xué)關(guān)系式對這些關(guān)系式的可信程度進(jìn)行各種統(tǒng)計(jì)檢驗(yàn),并從影響某一特定變量的諸多變量中找出哪些變量的影響顯著,哪些不顯著。利用所求的關(guān)系式,根據(jù)一個(gè)或幾個(gè)變量的取值來預(yù)測或控制另一個(gè)特定變量的取值,并給出這種預(yù)測或控制的精確程度。
其用意:在于通過后者的已知或設(shè)定值,去估計(jì)和(或)預(yù)測前者的(總體)均值。
拓展資料:
回歸模型(regression model)對統(tǒng)計(jì)關(guān)系進(jìn)行定量描述的一種數(shù)學(xué)模型。如多元線性回歸的數(shù)學(xué)模型可以表示為y=β0+β1*x+εi,式中,β0,β1,…,βp是p+1個(gè)待估計(jì)的參數(shù),εi是相互獨(dú)立且服從同一正態(tài)分布N(0,σ2)的隨機(jī)變量,y是隨機(jī)變量;x可以是隨機(jī)變量,也可以是非隨機(jī)變量,βi稱為回歸系數(shù),表征自變量對因變量影響的程度。
(資料來源:百度百科:回歸模型)
如何比較兩組數(shù)據(jù)之間的差異性
1、如下圖,比較兩組數(shù)據(jù)之間的差異性。
2、為Excel添加分析工具的加載項(xiàng)插件,步驟如下:
(1)點(diǎn)擊office按鈕,彈出excel選項(xiàng),選擇加載項(xiàng)中的轉(zhuǎn)到。
(2)勾選分析工具庫。
3、分析步驟如下:
(1)選擇數(shù)據(jù)區(qū)域,點(diǎn)擊數(shù)據(jù),選擇其中分析里面的數(shù)據(jù)分析。
(2)選擇單因素方差分析。
4、設(shè)置分析參數(shù)
5、查看分析結(jié)果
擴(kuò)展資料
相關(guān)分析研究的是兩個(gè)變量的相關(guān)性,但你研究的兩個(gè)變量必須是有關(guān)聯(lián)的,如果你把歷年人口總量和你歷年的身高做相關(guān)性分析,分析結(jié)果會呈現(xiàn)顯著地相關(guān),但它沒有實(shí)際的意義,因?yàn)槿丝诳偭亢湍愕纳砀叨际侵鸩皆黾拥?從數(shù)據(jù)上來說是有一致性,但他們沒有現(xiàn)實(shí)意義。
當(dāng)數(shù)據(jù)之間具有了顯著性差異,就說明參與比對的數(shù)據(jù)不是來自于同一總體(Population),而是來自于具有差異的兩個(gè)不同總體,這種差異可能因參與比對的數(shù)據(jù)是來自不同實(shí)驗(yàn)對象的,比如一些一般能力測驗(yàn)中,大學(xué)學(xué)歷被試組的成績與小學(xué)學(xué)歷被試組會有顯著性差異。也可能來自于實(shí)驗(yàn)處理對實(shí)驗(yàn)對象造成了根本性狀改變,因而前測后測的數(shù)據(jù)會有顯著性差異。
請問有人知道顯著性評估方法NSS扥代碼嗎?
顯著性水平就是那個(gè)sig值,不都是0么,怎么會沒有達(dá)到顯著水平0.01啊,應(yīng)該都顯著的啊。
如何分析回歸模型的擬合度和顯著性
模型的擬合度是用R和R方來表示的,一般大于0.4就可以了;自變量的顯著性是根據(jù)各個(gè)自變量系數(shù)后面的Sig值判斷的,如果小于0.05可以說在95%的顯著性水平下顯著,小于0.01就可以說在99%的顯著性水平下顯著了。如果沒有給出系數(shù)表,是看不到顯著性如何的。
回歸分析(regression analysis)是研究一個(gè)變量(被解釋變量)關(guān)于另一個(gè)(些)變量(解釋變量)的具體依賴關(guān)系的計(jì)算方法和理論。 從一組樣本數(shù)據(jù)出發(fā),確定變量之間的數(shù)學(xué)關(guān)系式對這些關(guān)系式的可信程度進(jìn)行各種統(tǒng)計(jì)檢驗(yàn),并從影響某一特定變量的諸多變量中找出哪些變量的影響顯著,哪些不顯著。利用所求的關(guān)系式,根據(jù)一個(gè)或幾個(gè)變量的取值來預(yù)測或控制另一個(gè)特定變量的取值,并給出這種預(yù)測或控制的精確程度。
其用意:在于通過后者的已知或設(shè)定值,去估計(jì)和(或)預(yù)測前者的(總體)均值。
拓展資料:
回歸模型(regression model)對統(tǒng)計(jì)關(guān)系進(jìn)行定量描述的一種數(shù)學(xué)模型。如多元線性回歸的數(shù)學(xué)模型可以表示為y=β0+β1*x+εi,式中,β0,β1,…,βp是p+1個(gè)待估計(jì)的參數(shù),εi是相互獨(dú)立且服從同一正態(tài)分布N(0,σ2)的隨機(jī)變量,y是隨機(jī)變量;x可以是隨機(jī)變量,也可以是非隨機(jī)變量,βi稱為回歸系數(shù),表征自變量對因變量影響的程度。
(資料來源:百度百科:回歸模型)