統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)之基礎(chǔ)概念與知識(shí)點(diǎn)

時(shí)間：2024-10-03 21:10:10 統(tǒng)計(jì)師

　　統(tǒng)計(jì)學(xué)是通過(guò)搜索、整理、分析數(shù)據(jù)等手段，以達(dá)到推斷所測(cè)對(duì)象的本質(zhì)，甚至預(yù)測(cè)對(duì)象未來(lái)的一門綜合性科學(xué)。其中用到了大量的數(shù)學(xué)及其它學(xué)科的專業(yè)知識(shí)，它的使用范圍幾乎覆蓋了社會(huì)科學(xué)和自然科學(xué)的各個(gè)領(lǐng)域。下面是yjbys小編為大家?guī)?lái)的統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)，歡迎閱讀。

統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)之基礎(chǔ)概念與知識(shí)點(diǎn)

　　統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)

　　總體：是根據(jù)研究目的確定的同質(zhì)的觀察單位的全體，更確切的說(shuō)，是同質(zhì)的所有觀察單位某種觀察值(變量值)的集合�？煞譃橛邢蘅傮w和無(wú)限總體。總體中的所有單位都能夠標(biāo)識(shí)者為有限總體，反之為無(wú)限總體。

　　樣本：從總體中隨機(jī)抽取部分觀察單位，其實(shí)測(cè)值的集合稱為樣本。

　　隨機(jī)抽樣：是指按照隨機(jī)化的原則，從總體中抽取部分觀察單位的過(guò)程。隨機(jī)抽樣是樣本具有代表性的保證。

　　隨機(jī)化原則：總體中每一個(gè)觀察單位都有同等的機(jī)會(huì)被選入到樣本中。

　　抽樣誤差：由于個(gè)體差異的存在，即使在同一整體中隨機(jī)抽取若干樣本，各樣本的統(tǒng)計(jì)量往往不等，統(tǒng)計(jì)量與參數(shù)也會(huì)有所不同。這種因抽樣研究引起的差異稱抽樣誤差。

　　同質(zhì)：一個(gè)總體中有許多個(gè)體，它們之所以共同成為人們研究的對(duì)象，必定存在共性，所謂一些個(gè)體處于同一總體，就是指他們大同小異，具有同質(zhì)性。

　　變異：在自然狀態(tài)下，個(gè)體間測(cè)量結(jié)果的差異稱為變異。變異是生物醫(yī)學(xué)研究領(lǐng)域普遍存在的現(xiàn)象。嚴(yán)格的說(shuō)，在自然狀態(tài)下，任何兩個(gè)患者或研究群體間都存在差異，表現(xiàn)為各種生理測(cè)量值的參差不齊。

　　變量：確定總體之后，研究者對(duì)每個(gè)觀察單位的某項(xiàng)特征進(jìn)行測(cè)量和觀察，這種特征稱為變量。

　　變量值：對(duì)變量的測(cè)得值稱為變量值，或者觀察值。它可以是定量的，也可以是定性的。

　　定量資料：又稱數(shù)值變量。其變量值是定量的，表現(xiàn)為數(shù)值的大小，一般有度量衡單位。

　　分類資料：也稱定性資料，其觀察值是定性的，表現(xiàn)為互不相容的類別或者屬性。有無(wú)序分類和有序分類兩種情況。

　　統(tǒng)計(jì)描述：用統(tǒng)計(jì)指標(biāo)、統(tǒng)計(jì)圖、統(tǒng)計(jì)表等方法，對(duì)資料的數(shù)量特征及分布規(guī)律進(jìn)行客觀的描述和表達(dá)。

　　統(tǒng)計(jì)推斷：在一定的置信度和概率保證下，用樣本信息推斷總體特征：①參數(shù)

　　估計(jì)：用樣本的指標(biāo)去推斷總體相應(yīng)的指標(biāo);②假設(shè)檢驗(yàn)：由樣本的差異推斷總體之間是否可能存在的差異。

　　計(jì)量資料：對(duì)每個(gè)觀察單位用定量的方法測(cè)定某項(xiàng)指標(biāo)量的大小，所得的資料稱為計(jì)量資料。計(jì)量資料亦稱定量資料、測(cè)量資料。其變量值是定量的，表現(xiàn)為數(shù)值大小，一般有度量衡單位。

　　計(jì)數(shù)資料：將觀察單位按某種屬性或類別分組，所得的觀察單位數(shù)稱為計(jì)數(shù)資料。計(jì)數(shù)資料亦稱定性資料或分類資料。其觀察值是定性的，表現(xiàn)為互不相容的類別或?qū)傩浴?/p>

　　等級(jí)資料：將觀察單位按測(cè)量結(jié)果的某種屬性的不同程度分組，所得各組的觀察單位數(shù)，稱為等級(jí)資料。

　　概率：又稱幾率，是度量某一隨機(jī)事件A發(fā)生可能性大小的一個(gè)數(shù)值，記為P(A)，P(A)越大，說(shuō)明A事件發(fā)生的可能性越大。

　　頻率：在相同的條件下，獨(dú)立重復(fù)做n次試驗(yàn)，事件A出現(xiàn)了m次，則比值m/n稱為隨機(jī)事件A在n次試驗(yàn)中出現(xiàn)的頻率。當(dāng)試驗(yàn)重復(fù)很多次時(shí)P(A)=m/n。

　　隨機(jī)誤差：又稱偶然誤差，是指排除了系統(tǒng)誤差后尚存的誤差。它受多種因素的影響，使觀察值不按方向性和系統(tǒng)性而隨機(jī)的變化。誤差變量一般服從正態(tài)分布。隨機(jī)誤差可以通過(guò)統(tǒng)計(jì)處理來(lái)估計(jì)。

　　系統(tǒng)誤差：是指由于儀器未校正、測(cè)量者感官的某種偏差、醫(yī)生掌握療效標(biāo)準(zhǔn)偏高或偏低等原因，使觀察值不是分散在真值的兩側(cè)，而是有方向性、系統(tǒng)性或周期性地偏離真值。系統(tǒng)誤差可以通過(guò)實(shí)驗(yàn)設(shè)計(jì)和完善技術(shù)措施來(lái)消除或使之減少。

　　隨機(jī)變量：指變量的值無(wú)法預(yù)先確定僅以一定的可能性(概率)取值的量。隨機(jī)變量的具體內(nèi)容雖然是各式各樣的，但共同的特點(diǎn)是不能用一個(gè)常數(shù)來(lái)表示，而且，理論上講，每個(gè)變量的取值服從特定的概率分布。

　　參數(shù)：是指總體的統(tǒng)計(jì)指標(biāo)，如：總體均數(shù)、總體率等�？傮w參數(shù)是固定的常數(shù)。多數(shù)情況下，總體參數(shù)是不易知道的，但可通過(guò)隨機(jī)抽樣抽取有代表性的樣本，用算得的樣本統(tǒng)計(jì)量估計(jì)未知的總體參數(shù)。

　　統(tǒng)計(jì)量：是指樣本的統(tǒng)計(jì)指標(biāo)，如樣本均數(shù)、樣本率等。樣本統(tǒng)計(jì)量可用來(lái)估計(jì)總體參數(shù)�？傮w參數(shù)是固定的常數(shù)，統(tǒng)計(jì)量是在總體參數(shù)附近波動(dòng)的隨機(jī)變量。

　　算術(shù)均數(shù)：描述一組數(shù)據(jù)在數(shù)量上的平均水平�？傮w均數(shù)用μ表示，樣本均數(shù)用X表示。

　　幾何均數(shù)：用以描述對(duì)數(shù)正態(tài)分布或數(shù)據(jù)呈倍數(shù)變化資料的水平。記為G。

　　中位數(shù)：將一組觀察值由小到大排列，n為奇數(shù)時(shí)取位次居中的變量值;為偶數(shù)時(shí)，取位次居中的兩個(gè)變量的平均值。反映一批觀察值在位次上的平均水平。

　　極差：亦稱全距，即最大值與最小值之差，用于資料的粗略分析，其計(jì)算簡(jiǎn)便但穩(wěn)定性較差。

　　百分位數(shù)：是將n個(gè)觀察值從小到大依次排列，再把它們的位次依次轉(zhuǎn)化為百分位。百分位數(shù)的另一個(gè)重要用途是確定醫(yī)學(xué)參考值范圍。

　　四分位數(shù)間距：是由第三四分位數(shù)和第一四分位數(shù)相減計(jì)算而得，常與中位數(shù)一起使用，描述偏態(tài)分布資料的分布特征，較極差穩(wěn)定。

　　方差：方差表示一組數(shù)據(jù)的平均離散水平，由離均差的平方和除以樣本個(gè)數(shù)得到。

　　標(biāo)準(zhǔn)差：是樣本平均數(shù)的平均距離，用來(lái)考察樣本數(shù)據(jù)分散程度的大小。

　　變異系數(shù)：用于觀察指標(biāo)單位不同或均數(shù)相差較大時(shí)兩組資料變異程度的比較。用CV表示。計(jì)算：CV=標(biāo)準(zhǔn)差/均數(shù)×100%

　　可信區(qū)間：是按預(yù)先給定的概率1-α所確定的包含未知總體參數(shù)的一個(gè)范圍。從固定樣本含量的已知總體中進(jìn)行重復(fù)隨機(jī)抽樣試驗(yàn)，根據(jù)每個(gè)樣本可算得一個(gè)可信區(qū)間，則平均有1-α的可信區(qū)間包含了總體參數(shù)，而不是總體參數(shù)落在該范圍的可能性為1-α。

　　參數(shù)估計(jì)：指用樣本指標(biāo)值(統(tǒng)計(jì)量)估計(jì)總體指標(biāo)值(參數(shù))。

　　假設(shè)檢驗(yàn)中P的含義：指從H0規(guī)定的總體隨機(jī)抽得等于及大于(或等于及小于)現(xiàn)有樣本獲得的檢驗(yàn)統(tǒng)計(jì)量值的概率。

　　假設(shè)檢驗(yàn)：亦稱顯著性檢驗(yàn)，其基本思想是先對(duì)總體的參數(shù)或分布做出某種假設(shè)，如設(shè)總體均數(shù)為一定值，兩總體均數(shù)相等，總體服從正態(tài)分布或兩分布相同等，然后根據(jù)樣本信息選用適當(dāng)?shù)姆椒�，推斷此假設(shè)應(yīng)當(dāng)拒絕或不拒絕。

　　I型錯(cuò)誤：指拒絕了實(shí)際上成立的H0，這類“棄真”的錯(cuò)誤稱為I型錯(cuò)誤，其概率大小用α表示。

　　II型錯(cuò)誤：指接受了實(shí)際上不成立的H0，這類“存?zhèn)?rdquo;的誤稱為II型錯(cuò)誤，其概率大小用β表示。

　　正態(tài)性檢驗(yàn)：用均數(shù)和標(biāo)準(zhǔn)差描述資料的分布特征，對(duì)例數(shù)n較小的樣本進(jìn)行t檢驗(yàn)時(shí)，首先要求樣本取自正態(tài)分布的總體。

　　檢驗(yàn)效能：1-β稱為檢驗(yàn)效能，它是指當(dāng)兩總體確有差別，按規(guī)定的檢驗(yàn)水準(zhǔn)α所能發(fā)現(xiàn)該差異的能力。

　　率：又稱頻率指標(biāo)，說(shuō)明一定時(shí)期內(nèi)某現(xiàn)象發(fā)生的頻率或強(qiáng)度。計(jì)算公式為：率=發(fā)生某現(xiàn)象的觀察單位數(shù)/可能發(fā)生某現(xiàn)象的觀察單位總數(shù)×100%，表示方式有：百分率(%)、千分率(‰)等。

　　構(gòu)成比：又稱構(gòu)成指標(biāo)，說(shuō)明某一事物內(nèi)部各組成部分所占的比重或分布。計(jì)算公式為：構(gòu)成比=某一組成部分的觀察單位數(shù)/同一事物各組成部分的觀察單位總數(shù)×100%，表示方式有：百分?jǐn)?shù)等。

　　比：又稱相對(duì)比，是A、B兩個(gè)有關(guān)指標(biāo)之比，說(shuō)明A是B的若干倍或百分之幾。計(jì)算公式為：A/B，表示方式有：倍數(shù)或分?jǐn)?shù)等。

　　非參數(shù)統(tǒng)計(jì)：針對(duì)某些資料的總體分布難以用某種函數(shù)式來(lái)表達(dá)，或者資料的總體分布的函數(shù)式是未知的，只知道總體分布是連續(xù)型的或離散型的，用于解決這類問(wèn)題的一種不依賴總體分布的具體形式的統(tǒng)計(jì)分析方法。

　　參數(shù)統(tǒng)計(jì)：通常要求樣本來(lái)自總體分布型是已知的(如正態(tài)分布)，在這種假設(shè)的基礎(chǔ)上，對(duì)總體參數(shù)(如總體均數(shù))進(jìn)行估計(jì)和檢驗(yàn)，稱為參數(shù)統(tǒng)計(jì)。

　　秩次：變量值按照從小到大順序所編的秩序號(hào)稱為秩次。

　　秩和：各組秩次的合計(jì)稱為秩和，是非參數(shù)檢驗(yàn)的基本統(tǒng)計(jì)量。

　　直線回歸：建立一個(gè)描述應(yīng)變量依自變量變化而變化的直線方程，并要求各點(diǎn)與該直線縱向距離的平方和為最小。直線回歸是回歸分析中最基本、最簡(jiǎn)單的一種，故又稱簡(jiǎn)單回歸。

　　回歸系數(shù)：即直線的斜率，在直線回歸方程中用b表示，b的統(tǒng)計(jì)意義為X每增(或減)一個(gè)單位時(shí)，Y平均改變b個(gè)單位。

　　相關(guān)系數(shù)r：用以描述兩個(gè)隨機(jī)變量之間線性相關(guān)關(guān)系的密切程度與相關(guān)方向的統(tǒng)計(jì)指標(biāo)。

　　t檢驗(yàn)：常用于整體標(biāo)準(zhǔn)差未知且樣本含量較小時(shí)樣本均數(shù)與總體均數(shù)的比較，應(yīng)用條件為n≤50，樣本來(lái)自正態(tài)分布的總體，兩樣本均數(shù)比較時(shí)要求兩樣本總體方差相等。

　　u檢驗(yàn)：用檢驗(yàn)統(tǒng)計(jì)量u來(lái)命名的，用于樣本含量n足夠大，或n雖小但總體標(biāo)準(zhǔn)差已知的樣本均數(shù)與總體均數(shù)的比較、成組設(shè)計(jì)兩樣本均數(shù)的比較。

　　觀察性研究：是指在沒(méi)有任何干預(yù)措施的條件下，客觀的觀察和記錄研究對(duì)象的現(xiàn)狀及其相關(guān)特征。

　　病例對(duì)照研究：是一種分析流行病學(xué)研究方法，主要應(yīng)用于探索疾病的危險(xiǎn)因素和病因。病例對(duì)照研究方法是對(duì)臨床醫(yī)療和各種基礎(chǔ)研究中形成的病因假設(shè)，進(jìn)行初步驗(yàn)證。是選擇一組患某病的病人，再選擇一組不患該病的對(duì)象，比較兩組人群之間在疾病發(fā)生之前有關(guān)可疑因素的暴露情況，如果兩組的暴露率卻有差別，則可認(rèn)為所研究疾病與因素之間存在著關(guān)聯(lián)。

　　隊(duì)列研究：又稱前瞻性研究，是將特定的人群分為暴露于某因素與非暴露于某因素的兩種人群或不同暴露水平的幾個(gè)亞群，追蹤觀察其各自的結(jié)局，比較兩組或各組某結(jié)局的發(fā)生率，從而判定暴露因素與結(jié)局有無(wú)因果關(guān)聯(lián)及關(guān)聯(lián)程度大小的一種觀察性研究方法。

　　完全隨機(jī)設(shè)計(jì)：又稱簡(jiǎn)單隨機(jī)分組設(shè)計(jì)，是采用完全隨機(jī)化分組方法將同質(zhì)的實(shí)驗(yàn)單位分配到各處理組，各組分別接受不同的處理。各組樣本含量可以相等，稱平衡設(shè)計(jì);也可不等，稱非平衡設(shè)計(jì)。

　　配對(duì)設(shè)計(jì)：是將實(shí)驗(yàn)單位按一定條件配成對(duì)子，再將每對(duì)中的兩個(gè)實(shí)驗(yàn)單位隨機(jī)分配到不同處理組。

　　隨機(jī)區(qū)組設(shè)計(jì)：是將實(shí)驗(yàn)單位組設(shè)計(jì)或配伍組設(shè)計(jì)，實(shí)際上是配對(duì)設(shè)計(jì)的擴(kuò)展，是先將實(shí)驗(yàn)單位按性質(zhì)相同或相近者組成區(qū)組，再分別將各區(qū)組內(nèi)的實(shí)驗(yàn)單位隨機(jī)分配到各處理組或?qū)φ战M。

　　析因設(shè)計(jì)：為安排析因?qū)嶒?yàn)的設(shè)計(jì)，是將兩個(gè)或兩個(gè)以上處理因素的各水平進(jìn)行組合，對(duì)各種可能的組合都進(jìn)行實(shí)驗(yàn)，又稱完全交叉分組實(shí)驗(yàn)設(shè)計(jì)。

　　方差分析：也叫F檢驗(yàn)，是統(tǒng)計(jì)檢驗(yàn)的一種，其基本思想是：按研究目的和設(shè)計(jì)類型，將總變異中的離均差平方和和自由度分別分解成相應(yīng)的若干部分，然后求得各相應(yīng)部分的變異;由于其中的組內(nèi)變異主要反應(yīng)個(gè)體差異或抽樣誤差，其他各部分的變異與之比較得出統(tǒng)計(jì)量F值，根據(jù)F值得大小確定P值，并作出推斷。

　　秩和檢驗(yàn)：即先將數(shù)值變量從小到大，或等級(jí)從弱到強(qiáng)轉(zhuǎn)換成秩后，再計(jì)算檢驗(yàn)統(tǒng)計(jì)量的一種方法。

　　流行病學(xué)：研究人群中疾病與健康狀況的分布及其影響因素，并研究防制疾病及促進(jìn)健康的策略和措施的科學(xué)，是研究人群中事件或者結(jié)局的分布及其影響因素，并研究防止或者促進(jìn)其發(fā)生的策略和措施的科學(xué)。

　　暴露：暴露是指研究對(duì)象(人)曾經(jīng)接觸(或不接觸)某因素，或者具備某些特征，或者處于某種狀態(tài)，這些研究者所關(guān)心的因素、特征、或狀態(tài)即為暴露因素;暴露是指可能影響研究對(duì)象最后成為(病例或非病例研究者關(guān)心的結(jié)局=)某種結(jié)局的機(jī)會(huì)。

　　臨床試驗(yàn)：以臨床患者的為研究對(duì)象，采用隨機(jī)原則將其分為試驗(yàn)組與對(duì)照組，試驗(yàn)組人為地給予某種干預(yù)措施，即某種新藥或某種療法，而對(duì)照組不給予研究的新藥或給傳統(tǒng)的醫(yī)療措施或給安慰劑，經(jīng)過(guò)一段時(shí)間的觀察后，評(píng)價(jià)實(shí)驗(yàn)藥物的效果或不良反應(yīng)。

　　病因：那些能使人群發(fā)病概率增加的因素，就可以認(rèn)為是疾病的病因，其中某個(gè)或多個(gè)不存在時(shí)，人群疾病發(fā)生頻率就會(huì)下降。

　　危險(xiǎn)因素：在復(fù)雜病因所致疾病或未明確病因時(shí)，相關(guān)致病因素常被稱為危險(xiǎn)因素。

　　診斷試驗(yàn)：是指運(yùn)用物理學(xué)的、生物化學(xué)的、血清免疫學(xué)的檢查，臨床檢查和醫(yī)療器械檢查對(duì)病人的疾病和健康狀況做出診斷的試驗(yàn)。

　　機(jī)遇：又稱隨機(jī)誤差，是由于多種不能控制及不能預(yù)測(cè)的因素引起的一類表現(xiàn)不恒定、隨機(jī)變化的誤差。

　　偏倚：又稱系統(tǒng)誤差，是指研究過(guò)程中，一些已知活可控制的因素引起的使研究結(jié)果或理論系統(tǒng)抵偏離真實(shí)情況。

【統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)之基礎(chǔ)概念與知識(shí)點(diǎn)】相關(guān)文章：

統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)匯總06-27

社區(qū)工作基礎(chǔ)知識(shí)概念10-02

java必備基礎(chǔ)知識(shí)點(diǎn)06-01

Java基礎(chǔ)知識(shí)點(diǎn)歸納08-22

音樂(lè)基礎(chǔ)知識(shí)之河北民歌07-09

英語(yǔ)語(yǔ)法基礎(chǔ)知識(shí)點(diǎn)09-03

美術(shù)色彩基礎(chǔ)知識(shí)冷暖色調(diào)的概念07-05

計(jì)算機(jī)二級(jí)考試之C++基礎(chǔ)知識(shí)點(diǎn)08-05

大學(xué)計(jì)算機(jī)基礎(chǔ)知識(shí)點(diǎn)09-25

2017證券從業(yè)價(jià)格基礎(chǔ)知識(shí)點(diǎn)07-01

色www,五月婷婷深爱五月,午夜国产一级片,色噜噜综合,国产大胸无码视频,清纯美女被操黄网站在线观看,波多野结衣av高清一区二区三区

統(tǒng)計(jì)學(xué)基礎(chǔ)知識(shí)之基礎(chǔ)概念與知識(shí)點(diǎn)