• <em id="6vhwh"><rt id="6vhwh"></rt></em>

    <style id="6vhwh"></style>

    <style id="6vhwh"></style>
    1. <style id="6vhwh"></style>
        <sub id="6vhwh"><p id="6vhwh"></p></sub>
        <p id="6vhwh"></p>
          1. 国产亚洲欧洲av综合一区二区三区 ,色爱综合另类图片av,亚洲av免费成人在线,久久热在线视频精品视频,成在人线av无码免费,国产精品一区二区久久毛片,亚洲精品成人片在线观看精品字幕 ,久久亚洲精品成人av秋霞

            相關系數(shù)分析(相關系數(shù)分析具體分為)

            更新時間:2023-03-02 11:01:08 閱讀: 評論:0

            介紹兩種最為常用的相關系數(shù):皮爾遜person相關系數(shù)和斯皮爾曼spearman等等級相關系數(shù)。他們可以用來衡量兩個變量之間的相關性的大小,根據(jù)數(shù)據(jù)滿足不同的條件,我們要選擇不同的相關系數(shù)進行計算和分析。(建模論文中最容易用錯的方法)

            1、總體和樣本

            總體——所要考察對象的全部個體叫做總體.

            我們總是希望得到總體數(shù)據(jù)的一些特征(例如均值方差等)

            樣本——從總體中所抽取的一部分個體叫做總體的一個樣本.

            計算這些抽取的樣本的統(tǒng)計量來估計總體的統(tǒng)計量:

            例如使用樣本均值、樣本標準差來估計總體的均值(平均水平)和總體的標準差(偏離程度)。 例子: 我國10年進行一-次的人口普查得到的數(shù)據(jù)就是總體數(shù)據(jù)。 大家自己在QQ群發(fā)問卷叫同學幫忙填寫得到的數(shù)據(jù)就是樣本數(shù)據(jù)。

            2、總體皮爾遜Person相關系數(shù)

            回顧《概率論與數(shù)理統(tǒng)計》中的數(shù)理統(tǒng)計部分: 如果兩組數(shù)據(jù)和是總體數(shù)據(jù)(例如普查結果)

            那么總體均值:

            總體協(xié)方差:

            直觀理解協(xié)方差:如果X、Y變化方向相同,即當X大于(小于)其均值時,Y也大于(小于)其均值,在這兩種情況下,乘積為正。如果X、Y的變化方向一直保持相同,則協(xié)方差為正;同理,如果X、 Y變化方向一直相反,則協(xié)方差為負;如果X、Y變化方向之間相互無規(guī)律,即分子中有的項為正,有的項為負,那么累加后正負抵消。

            注意:假設X,Y變化方向一直相同,說明它們存在很強的正相關或負相關,但是協(xié)方差的大小和兩個變量的量綱有關,因此不適合做比較。

            總體皮爾遜相關系數(shù)就是在總體協(xié)方差的基礎上消去量綱的影響

            2.1 總體皮爾遜相關系數(shù)計算

            如果兩組數(shù)據(jù)和是總體數(shù)據(jù)(例如普查結果)

            那么總體均值:

            總體協(xié)方差:

            所以,定義總體皮爾遜Person相關系數(shù)為:

            其中,就是對X、Y的標準差

            我們知道就是用來標準化數(shù)據(jù)的,因此皮爾遜相關系數(shù)可以看作是剔除了兩個變量量綱的影響,即X和Y標準化之后的協(xié)方差。

            而且可以證明

            3、樣本皮爾遜Person相關系數(shù)

            如果兩組數(shù)據(jù)和是樣本數(shù)據(jù)(例如調查得到的數(shù)據(jù))

            那么樣本均值:

            樣本協(xié)方差:

            所以,定義樣本皮爾遜Person相關系數(shù)為:

            其中,就是對X、Y的樣本標準差

            4、相關性可視化

            從圖中我們可以看出,散點圖為一條直線,即y與x的關系可以描述為y=kx+b,相關性為1或-1,而越小于1的絕對值,相關性1越不顯著,散點圖越離散

            實際上皮爾遜相關系數(shù)反應的是線性系數(shù)

            5、關于皮爾遜相關系數(shù)的理解誤區(qū)

            上面四個圖的皮爾遜相關系數(shù)均為0.816

            但是,可以發(fā)現(xiàn)第二幅圖(橫向)明顯是一個拋物線的這種相關性,直線很難刻畫它,第三幅圖出現(xiàn)了一個異常值,離散于其他的點,假如去掉這個離群點,相關系數(shù)可能會更大,因為其他的點還是服從于這條直線的;第四幅圖也出現(xiàn)了一個異常值,但是這個異常值對整體結果影響特別大,假如去掉這個異常值,x和y之間的相關系數(shù)應該是0。

            也就是說異常值對皮爾遜相關系數(shù)的影響是很大的,我們也不能單純靠皮爾遜相關系數(shù)來理解數(shù)據(jù)。

            再來看一張圖,冰激凌銷售量和氣溫之間的關系

            冰激凌銷售量和氣溫之間的關系

            這個數(shù)據(jù)計算出來的皮爾遜相關系數(shù)為0,但我們不能說x和y之間沒有關系,它們大致是服從于一個拋物線的。

            因此這里需要特別注意:

            這里的相關系數(shù)只是用來衡量兩個變量線性相關程度的指標;也就是說,你必須先確認這兩個變量是線性相關的,然后這個相關系數(shù)才能告訴你他倆相關程度如何。

            (1)因此得先畫散點圖,說明這兩個變量之間是線性的,說明有線性關系

            (2)然后再來計算皮爾遜相關系數(shù)來刻畫相關程度

            5.1總結:

            (1)非線性相關也會導致線性相關系數(shù)很大

            (2)離群點對相關系數(shù)的影響很大,

            (3)如果兩個變量的相關系數(shù)很大也不能說明兩者相關,可能是受到了異常值的影響。

            (4)相關系數(shù)計算結果為0,只能說不是線性相關,但說不定會有更復雜的相關關系(非線性相關)。

            5.2再來強調一下:

            (1) 如果兩個變量本身就是線性的關系,那么皮爾遜相關系數(shù)絕對值大的就是相關性強,小的就是相關性弱;

            (2)在不確定兩個變量是什么關系的情況下,即使算出皮爾遜相關系數(shù),發(fā)現(xiàn)很大,也不能說明那兩個變量線性相關,甚至不能說他們相關,我們一定要畫出散點圖來看才行。

            6、對相關系數(shù)大小的解釋

            相關性

            正數(shù)

            無相關性

            -0.09~0.0

            0.0~0.09

            弱相關性

            -0.3~0.1

            0.1~0.3

            中相關性

            -0.5~0.3

            0.3~0.5

            強相關性

            -0.5~1

            0.5~1

            上表所定的標準是主觀性和不嚴格的,對相關系數(shù)的解釋是依賴于具體的應用背景和目的的。上表只做參考

            事實上,比起相關系數(shù)的大小,我們更加關注的是顯著性(假設檢驗)

            7.描述性統(tǒng)計

            計算系數(shù)之前需要做一些描述性統(tǒng)計,如下

            matlab常用描述性統(tǒng)計函數(shù)

            對各列數(shù)據(jù)計算一一些統(tǒng)計量,一般使用上面加粗的那幾個

            可以將下面的描述性統(tǒng)計表格放到論文中:

            身高

            體重

            肺活量

            50米跑

            立定跳遠

            坐位體前屈

            最小值

            135

            16

            1450

            7.8

            52

            0.5

            最大值

            171

            65

            3272

            15

            205

            17.5

            均值

            156.0033841

            46.78341794

            2333.233503

            10.79201354

            166.8257191

            9.496615905

            中位數(shù)

            157

            47

            2391

            10.7

            167

            9.6

            偏度

            -0.295393671

            -0.360686808

            -0.285228204

            0.709545507

            -0.836873414

            -0.224969278

            峰度

            2.742704116

            9.43558535

            2.751974067

            3.299413754

            8.431328913

            2.755030069

            標準差

            7.389409879

            5.031473399

            350.4361539

            1.310872852

            16.81358657

            2.938186121

            8、對皮爾遜相關系數(shù)進行假設檢驗

            借助假設檢驗,我們對相關系數(shù)進行顯著性檢驗:

            第一步:提出原假設H0和備擇假設H1 (兩個假設是截然相反的哦)

            假設我們計算出了一個皮爾遜相關系數(shù)r,我們]想檢驗它是否顯著的異于0.那么我們可以這樣設定原假設和備擇假設: H0:r = 0,H1:r≠0

            第二步:在原假設成立的條件下,利用我們要檢驗的量構造出一個符合某個分布的統(tǒng)計量

            (注1:統(tǒng)計量相當于我們要檢驗的量的一個函數(shù),里面不能有其他的隨機變量) (注2:這里的分布一般有四種:標準正態(tài)分布、t分布、分布和F分布)

            對于皮爾遜和關系數(shù)r而言,在滿足一定條件下,我們可以構造統(tǒng)計量:(言外之意就是首先要進行條件檢驗)

            其中n就是樣本量,是一個常量,這個分布是自由度為n-2的標準正態(tài)分布

            第三步:將我們要檢驗的這個值帶入這個統(tǒng)計量中,可以得到一個特定的值(檢驗值)。假設我們現(xiàn)在計算出來的相關系數(shù)為0.5,樣本為30,那么我們可以得到第四步:由于我們知道統(tǒng)計量的分布情況,因此我們可以畫出該分布的概率密度函數(shù)pdf,并給定一個置信水平,根據(jù)這個置信水平查表找到臨界值,并畫出檢驗統(tǒng)計量的接受域和拒絕域。

            例如,我們知道上述統(tǒng)計量服從自由度為28的t分布,其概率密度函數(shù)圖形如下:

            自由度為28的t分布概率密度函數(shù)圖形

            代碼:

            x = -4:0.4:4; y = tpdf(x, 28); plot(x,y,'-') grid on % 加上網(wǎng)格線第四步:由于我們知道統(tǒng)計量的分布情況,因此我們可以畫出該分布的概率密度函數(shù)pdf,并給定一個置信水平,根據(jù)這個置信水平查表找到臨界值,并畫出檢驗統(tǒng)計量的接受域和拒絕域。

            常見的置信水平有三個:90%, 95%和99%, 其中95%是三者中最為常用的。

            因為我們這里是雙側檢驗,所以我們需要找出能覆蓋0.95概率的部分

            t分布表: https://wenku.baidu.com/view/d94dbd116bd97f192279e94a.html,這個表里的是單側檢驗,所以我們需要找到概率為0.975,自由度為28的臨界值

            查表可知,對應的臨界值為2.048,因此我們可以做出接受域和拒絕域。

            第五步:看我們計算出來的檢驗值是落在了拒絕域還是接受域,并下結論。因為我們得到的t* = 3.05505 > 2.048,因此我們可以下結論:在95%的置信水平上,我們拒絕原假設H0:r = 0,因此r是顯著的不為0的。

            在第四步需要去查表,其實我們還有一種不需要查表的方法:P值判斷法:

            P值判斷法剛剛的例子是雙側檢驗,所以對于P值的計算和單側檢驗略有不同:

            P_value = (1 - tcdf(3.05505, 28))*2 % 雙側檢驗P值 最終計算結果為 0.0049% P_value = 1 - tcdf(3.05505, 28) 單側檢驗P值P值 = 0.0049<0.05,即在95%的置信水平上拒絕原假設在本例中,拒絕原假設就表示顯著的異于0.

            p<0.01,在99%的置信水平上拒絕原假設

            p>0.01,在99%的置信水平上無法拒絕原假設

            p<0.05,在95%的置信水平上拒絕原假設

            p>0.05,在95%的置信水平上無法拒絕原假設

            p<0.10,在90%的置信水平上拒絕原假設

            p>0.10,在90%的置信水平上無法拒絕原假設

            補充:代表什么意思?(顯著性標記)

            0.5就代表不顯著

            0.5^*就代表在90%的置信水平上顯著(也就是拒絕原假設),依次類推

            0.1~0.05之間*,0.05-0.01之間**,<0.01***

            ***P<0.01,**P<0.05,*P<0.10

            9、皮爾遜相關系數(shù)假設檢驗的條件第一,實驗數(shù)據(jù)通常假設是成對的來自于正態(tài)分布的總體。因為我們在求皮爾遜相關性系數(shù)以后,通常還會用t檢驗之類的方法來進行皮爾遜相關性系數(shù)檢驗,而t檢驗是基于數(shù)據(jù)呈正態(tài)分布的假設的。第二,實驗數(shù)據(jù)之間的差距不能太大。皮爾遜相關性系數(shù)受異常值的影響比較大。第三:每組樣本之間是獨立抽樣的。構造t統(tǒng)計量時需要用到。

            因此,數(shù)據(jù)來自于正態(tài)分布是需要驗證的,而后兩個條件是默認滿足的。

            那么又該如何檢驗數(shù)據(jù)是否是正態(tài)分布?

            10、檢驗數(shù)據(jù)是否是正態(tài)分布10.1 JB檢驗 大樣本n>30

            雅克-貝拉檢驗(Jarque -Bera test)

            對于一個隨機變量,假設其偏度為S,峰度為K,那么我們可以構造JB統(tǒng)計量:

            可以證明,如果{X_i}是正態(tài)分布,那么在大樣本情況下JB~( 自由度為2的卡方分布)

            注:正態(tài)分布的偏度為0,峰度為3

            那么進行假設檢驗的步驟如下:

            H0:該隨機變量服從正態(tài)分,H1:該隨機變量不服從正態(tài)分布然后計算該變量的偏度和峰度,得到檢驗值JB*,并計算出其對應的p值將p值與0.05比較,如果小于0.05則可拒絕原假設,否則我們不能拒絕原假設。

            偏度和峰度

            matlab實現(xiàn)JB檢驗:

            MATLAB中進行JB檢驗的語法: [h,p] = jbtest(x,alpha) 當輸出h等于1時,表示拒絕原假設(不滿足正態(tài)分布); h等于0則代表不能拒絕原假設(滿足正態(tài)分布)。

            alpha就是顯著性水平,一般取0.05,此時置信水平為1-0.05=0.95

            x就是我們要檢驗的隨機變量,注意這里的x只能是向量。

            10.2 Shapiro-wilk檢驗 小樣本

            檢驗步驟:

            H0:該隨機變量服從正態(tài)分,H1:該隨機變量不服從正態(tài)分布然后計算威爾克統(tǒng)計量,并計算出其對應的p值將p值與0.05比較,如果小于0.05則可拒絕原假設,否則我們不能拒絕原假設10.3 Q-Q圖——不推薦使用

            在統(tǒng)計學中,Q-Q圖(Q代表 分位數(shù)Quantile)是一種通過比較兩個概率分布的分位數(shù)對這兩個概率分布進行比較的概率圖方法。

            首先選定分位數(shù)的對應概率區(qū)間集合,在此概率區(qū)間上,點(x,y)對應于第一個分布的一個分位數(shù)x和第二個分布在和x相同概率區(qū)間上相同的分位數(shù)。 ?

            這里,我們選擇正態(tài)分布和要檢驗的隨機變量,并對其做出Q-Q圖,可想而知,如果要檢驗的隨機變量是正態(tài)分布,那么Q-Q圖就是一條直線。 ?

            要利用Q-Q圖鑒別樣本數(shù)據(jù)是否近似于正態(tài)分布,只需看Q-Q圖上的點是否近似地在一條直線附近。(要求數(shù)據(jù)量非常大,遠大于30)

            本文發(fā)布于:2023-02-28 21:06:00,感謝您對本站的認可!

            本文鏈接:http://www.newhan.cn/zhishi/a/1677726068103499.html

            版權聲明:本站內(nèi)容均來自互聯(lián)網(wǎng),僅供演示用,請勿用于商業(yè)和其他非法用途。如果侵犯了您的權益請與我們聯(lián)系,我們將在24小時內(nèi)刪除。

            本文word下載地址:相關系數(shù)分析(相關系數(shù)分析具體分為).doc

            本文 PDF 下載地址:相關系數(shù)分析(相關系數(shù)分析具體分為).pdf

            標簽:系數(shù)
            相關文章
            留言與評論(共有 0 條評論)
               
            驗證碼:
            推薦文章
            排行榜
            Copyright ?2019-2022 Comsenz Inc.Powered by ? 實用文體寫作網(wǎng)旗下知識大全大全欄目是一個全百科類寶庫! 優(yōu)秀范文|法律文書|專利查詢|
            主站蜘蛛池模板: 国产国产久热这里只有精品| 一个人看的www片高清在线| 亚洲精品无amm毛片| 激情综合色区网激情五月| 精品乱码一区二区三四五区| 日韩av片无码一区二区不卡| 亚洲欧美在线综合一区二区三区| 美女无遮挡免费视频网站| 久久精品国产再热青青青| 97久久综合亚洲色hezyo| 国产av丝袜熟女一二三| 国产精品人成视频免| 国产综合久久久久久鬼色| 99久久国产综合精品女图图等你| 欧美性猛片aaaaaaa做受| 中文字幕乱码中文乱码毛片| 97超级碰碰碰免费公开视频| 国产精品毛片一区二区| 无码人妻丰满熟妇区丶| 日韩视频一区二区三区视频| 亚洲av美女在线播放啊| 依依成人精品视频在线观看| 成人污视频| 国产精品乱码久久久久久小说| 黄色亚洲一区二区在线观看| 国产福利社区一区二区| 亚洲成人av综合一区| 中文字幕自拍偷拍福利视频| 日韩欧美国产另类| 黄色三级亚洲男人的天堂| 亚洲开心婷婷中文字幕| 免费观看欧美猛交视频黑人| 国产成人欧美日韩在线电影| 亚洲中文字幕无码爆乳| 国产三级自拍视频在线| 欧美xxxxhd高清| 九九热精品视频免费在线| 亚洲国产成人无码AV在线影院L| 久久久久青草线蕉亚洲| 欧美色图久久| 亚洲午夜成人精品电影在线观看|