111專技高考公衛師

生物統計學


申論題

擬答

$ \bar{X}=120, S_X^2 = 821.7778 \Rightarrow SS_X $ $= (10-1) \times 821.7778 = 7396 $;

$ \bar{Y}=90, S_Y^2 = 1327.3333 \Rightarrow SS_Y $ $= (10-1) \times 1327.3333 = 11946 $

$ \sum XY =116296 $

$ \Rightarrow SS_{XY} = 116296 -10 \times 120 \times 90 $ $= 8296$

$ \hat{ \beta }_1 = \cfrac {SS_{XY}}{SS_X} = \cfrac {8296}{7396} =1.1217 $

$ \hat{ \beta _0} = \bar{Y}- \hat{ \beta }_1 \bar{ X }$ $ = 90-1.1217 \times 120 = -44.6025 $

所以迴歸方程式為$ \hat{Y}= -44.6025+1.1217X $

$ R^2 =r^2= \cfrac {8296^2}{7396 \times 11946 } = 77.90\%$
以空氣汙染物之濃度預測呼吸道疾病之急診人數,解釋度為77.9%
擬答
$SST= \sum \sum (\bar{X_{i.}} - \bar{X_{..}})^2$

$= \sum n_i (\bar{X_{i.}} - \bar{X_{..}})^2$

$= 11 \times (23-27)^2 +11\times (27-27)^2 $ $+11 \times (31-27)^2 $ $ =352$

$SSE= \sum \sum (X_{ij}- \bar{X}_{i.})^2$

$ = \sum (n_i -1)S_i^2 $
$ = (11-1)\times 12^2 $
$ + (11-1)\times 10^2 $
$ + (11-1)\times 8^2 $
$ = 3080$

$SSTO = SST + SSE = 3432 $
ANOVA表
 SSdfMSF
年齡層35221761.714
誤差308030102.667 
總和343232 

$H_0$:三個年齡層之症狀緩解時間無差異
$H_1$:三個年齡層之症狀緩解時間有差異
$a=0.05$
$ F^* = 1.1714 \notin C $,不拒絕 $H_0$
$ C= \left\{ F^* > F_{0.95,2,30} = 3.32 \right\}$
沒有顯著證據說三個年齡層之症狀緩解時間有差異
擬答
$H_0$:三種不同廠牌疫苗對兒童產生副作用相同
$H_1$:三種不同廠牌疫苗對兒童產生副作用不同
可將資料整理如下:斜線的左上方為觀察次數,右下角為期望次數


$a=0.05$, $ df=(3-1)\times (2-1)=2$
$ χ^{2^*} = \sum \cfrac {(O_i - E_i)^2}{E_i} =2.89 \notin C $


$ C: \left\{ χ^{2^*} > χ^2 _{0.95,2 = 5.99 }\right\}

不拒絕 $H_0$
沒有顯著證據說三種不同廠牌疫苗對兒童產生副作用不同
>

選擇題

(C) 1某醫學中心為了研究以β類澱粉蛋白質(amyloidβ42)作為阿茲海默症(Alzheimer's disease)的生物指標是否適合,特針對某縣市居民進行調查(已知阿茲海默症盛行率為0.02)。該醫學中心由此縣市中找了300 位阿茲海默症患者及700 位健康者進行測試,所得結果如下表。從此縣市隨機抽取一民眾,若β類澱粉蛋白質呈陽性反應,試問其得阿茲海默症的機率【$ Pr(D^+ | T^+)$ 】最接近數值為何?
檢驗結果阿茲海默症患者$(D^+)$健康者$(D^-$)合計
陽性$(T^+)$280112392
陰性$(T^-)$20588608
合計307001000
  1. 0.872
  2. 0.998
  3. 0.106
  4. 0.632
(C) 2自由度為1 的卡方分布機率密度函數,右尾5%的X 軸臨界值(閾值),與下列何者臨界值相同?
  1. 標準常態分配的右尾2.5%
  2. 標準常態分配的右尾5%
  3. 標準常態分配的右尾2.5%之平方值
  4. 標準常態分配的右尾5%之平方值
(B) 3石虎為瀕臨絕種之野生動物,主要棲息環境為淺山地區。由於近年來淺山地區受到人類大量開發,石虎在道路上遭到車輛輾斃之事件【稱為路殺(road kill)】時有所聞。已知每次路殺的發生是獨立的、路殺發生次數也不受限。若臺灣某路段每年發生路殺的平均次數為48,若令Y 表示該路段每月發生路殺的次數,則 Y 分布之變異數為何?
  1. 48
  2. 4
  3. 12
  4. 6
(D) 4下列影響信賴區間寬度的重要因素何者錯誤?
  1. 樣本數大小
  2. 第一類型誤差
  3. 樣本標準差
  4. 樣本平均值
(A) 5想了解一個新藥物跟安慰劑對血壓的控制能力,下列何種統計方法較不受年齡性別等干擾因子的影響?
  1. Paired t-test
  2. Mann-Whitney U test
  3. Two sample t-test
  4. ANOVA
(C) 6一項健康飲食的衛生教育介入研究中,分別測量實驗組及對照組在衛生教育介入前後了解健康飲食的知識分數,若要探討實驗組的衛教介入前後知識分數是否有改變,請問下列敘述何者正確?
  1. 母數方法要用單一樣本Student's t 檢定,無母數方法要用Wilcoxon rank-sum 檢定
  2. 母數方法要用兩組獨立樣本Student's t 檢定,無母數方法要用Wilcoxon rank-sum 檢定
  3. 母數方法要用成對樣本Student's t 檢定,無母數方法要用Wilcoxon signed-rank 檢定
  4. 母數方法要用成對樣本Student's t 檢定,無母數方法要用Wilcoxon rank-sum 檢定
(A) 7在一先驅研究中,11 位患有子宮癌和11 位未患有子宮癌之婦女被詢問是否曾經服用雌激素。將患有該癌症和未患有該癌症之婦女依年齡、體重、胎次配對。結果如下:
對數患有子宮癌患有子宮癌
1曾經服用雌激素未曾經服用雌激素
2未曾經服用雌激素未曾經服用雌激素
3曾經服用雌激素曾經服用雌激素
4曾經服用雌激素曾經服用雌激素
5曾經服用雌激素未曾經服用雌激素
6未曾經服用雌激素未曾經服用雌激素
7曾經服用雌激素未曾經服用雌激素
8曾經服用雌激素未曾經服用雌激素
9未曾經服用雌激素曾經服用雌激素
10未曾經服用雌激素曾經服用雌激素
11曾經服用雌激素未曾經服用雌激素
試問本研究欲了解 婦女患有子宮癌與曾經服用雌激素是否有關,可用何種統計方法作檢定?
  1. McNemar's 檢定
  2. 簡單直線迴歸分析
  3. ANOVA 檢定
  4. 卡方檢定
(A) 8單因子變異數分析表如下,請問X 之值為何?
變異量來源自由度平方和均方F 值
組間217692X16
組內5128091551 
總和5345783 
  1. 8846
  2. 17692
  3. 5897
  4. 347
(B) 9研究者欲了解服用避孕藥丸後對SBP 的值是否會有影響,今有15 位婦女進入此研究,此15位婦女從未服用過避孕藥,研究者在給服藥之前,先測得每位婦女的SBP 值,給服藥兩週後再測得婦女的SBP 值,以茲比較,所得的資料如下表。試檢定服用避孕藥對SBP 值是否有影響,下列何種方法適用?
婦女代號$(i)$服藥前SBP服藥後SBP
1115128
2112115
3107106
4119128
5115122
6138145
7126132
8105109
910102
10115117
11105118
12102115
13111106
14113124
15115119
  1. 兩組獨立樣本t 檢定
  2. 成對樣本t 檢定
  3. 兩組獨立樣本Z 檢定
  4. 單一樣本Z 檢定
(A) 10若使用變異數分析並以0.05 的型一誤差(type I error rate)比較某一所高中的5 個班級(A, B, C, D, E)的國文成績,檢定結果是達統計上顯著性差異,因此如果想要進一步進行所有兩兩班級國文成績的多重比較,使用Bonferroni 法則,此時型一誤差應該要調整成下列那個數值?
  1. 0.005
  2. 0.01
  3. 0.025
  4. 0.0025
(D) 11分析40 位12~17 歲青少年的年齡(Age,歲)與身高(公分)的關聯性分析,得到下表,下列敘述何者錯誤?
VariableEstimateLower bound of 95% CIUpper bound of 95% CI
Intercept97.0371.74122.33
Age(歲)4.182.376.00
Male
(男生=1, 女生=0)
6.10.8611.49
$R^2=0.45$
  1. 決定係數是0.45
  2. 校正性別後,年齡每增加1 歲身高增加4.18 公分
  3. 校正年齡後,男生比女生高6.17 公分
  4. 校正年齡後,女生比男生矮,但未達顯著性差異
(C) 12下列資料為二株新冠病毒在蝙蝠體內存活天數,此資料屬小樣本且兩個母群體不符合常態分布,若要以此資料檢定二株新冠病毒在蝙蝠體內存活天數是否有統計上顯著差異,請問應該使用何種檢定方法?
存活天數(days)
H 型N 型
5346
565
658
6059
7877
87117
102120
117123
120134
121156
 160
  1. Signed test
  2. Wilcoxon signed-rank test
  3. Wilcoxon rank sum test
  4. Kruskal-Wallis test
(B) 13一個病例對照研究結果如下表。原始研究的樣本數為70 人,假設樣本數變成10 倍,共700人,請問下列何者最可能變大?
 DiseaseNo Disease
Exposre05
No Exposure2035
  1. 勝算比(Odds Ratio)
  2. 檢定統計量(Test statistic)
  3. P 值(P-value)
  4. 95%信賴區間(95% confidence interval)
(A) 14若比較肺癌病人的診斷細胞型態之Karnofsky Performance Status(KPS)得到單因子變異數分析表結果如下,以0.05 的型一誤差(type I error rate)來判定,請問下列敘述何者正確?
變異量來源自由度平方和F 值P 值
組間33740.4831246.832.97040.0341
組內13757505.474419.75  
總和14061245.957  
  1. 此分析資料應該有4 種細胞型態及141 筆資料,這幾種細胞型態的KPS 平均值不完全相等
  2. 此分析資料應該有4 種細胞型態及141 筆資料,這幾種細胞型態的KPS 變異數不完全相等
  3. 此分析資料應該有4 種細胞型態及140 筆資料,這幾種細胞型態的KPS 平均值不完全相等
  4. 此分析資料應該有4 種細胞型態及140 筆資料,這幾種細胞型態的KPS 變異數不完全相等
(A) 15某大醫院的醫師正從事於頭痛與高血壓的關聯性研究,他發現273 位患有高血壓的勞工中,共有26 位常常有頭痛的情形,而1046 位未罹患高血壓的勞工中,有44 位常常有頭痛的情形,今欲以此資料推論頭痛與高血壓是否有關聯,則下列檢定方法何者正確?
  1. 卡方檢定
  2. ANOVA 檢定
  3. 獨立樣本t 檢定
  4. 配對t 檢定
(B) 16分析2 × 2 列聯表資料時,下列何種情況不適合使用卡方檢定?
  1. 某個細格的觀察次數小於5
  2. 某個細格的期望次數小於5
  3. 某個細格的觀察次數小於10
  4. 某個細格的期望次數小於10
(B) 17假設隨機變數X 代表病人服用抗病毒藥品的天數,此母群體呈右偏分布,其平均值為μ且標準差為σ,如果依據中央極限定理,則下列何者在樣本數增加時會接近常態分布?
  1. 隨機樣本$ X_i$
  2. 樣本平均值 $\bar{X}$
  3. 樣本變異數 $ \sum(X_i - \bar{X})^2 / (n-1)$
  4. 標準化隨機樣本 $ (X_i - \mu) / \sigma $
(A) 18針對某個樣本數為20 的樣本,所計算的標準差(standard deviation)與標準誤(standard error),下列敘述何者正確?
  1. 標準差=標準誤 $ \times \sqrt{20 }$
  2. 標準誤=標準差 $ \times \sqrt{20} $
  3. 標準差=標準誤 $ \times 20 $
  4. 標準誤=標準差 $ \times 20 $
(B) 19若針對某一社區居民隨機抽樣300 人,此樣本之平均年齡為55 歲,已知其平均年齡顯著不同於64 歲,假設社區居民的年齡呈常態分布,則下列何者比較可能是平均年齡的雙尾95%信賴區間?
  1. (57, 71)
  2. (48, 62)
  3. (54, 74)
  4. (45, 65)
(A) 20根據COVID-19 全球疫情地圖,得知臺灣疫苗接種覆蓋率86.79%,如果隨機在臺灣抽取一萬人,計算此樣本的疫苗接種覆蓋率,此樣本觀察到接種疫苗人數的變異數為下列何者?
  1. 1146
  2. 1321
  3. 7532
  4. 8679
(C) 21針對統計檢定力(statistical power,1-$ \beta $ )的敘述,下列何者較正確?
  1. 當虛無假設為真的,卻推翻虛無假設的機率
  2. 當虛無假設是真的,卻沒有推翻虛無假設的機率
  3. 當對立假設是真的,卻推翻虛無假設的機率
  4. 當對立假設是真的,卻沒有推翻虛無假設的機率
(A) 22某個研究罹患癌症的危險因子分析結果如下表所示,以0.05 的型一誤差(type I error rate)來判定,下列敘述何者錯誤?
  勝算比odds ratio95%信賴區間
GenderMale
female
0.94
1.00
(0.64,1.37)
Age
(years)
age<40
40 <= age < 60
60 <= age
1.00
1.52
2.21

(0.96, 2.41)
(1.28, 3.80)
  1. 男性罹患癌症的危險性較女性高
  2. 40 至60 歲的人相較於40 歲以下罹患癌症的危險性未達統計上顯著性
  3. 年紀60 歲以上者相較於40 歲以下罹患癌症的危險性較高
  4. 這個表格的結果是使用羅吉斯迴歸(logistic regression)計算而得
(D) 23一項探討醫學檢驗值與胰臟癌關係的病例對照研究,研究過程中收集了飯前血糖、飯後血糖、糖化血色素及總膽固醇,若想要了解有或沒有胰臟癌之相關醫學檢驗值互相校正後,何項相關醫學檢驗值較有顯著意義,下列何種統計方法最合適?
  1. 簡單線性迴歸
  2. 複線性迴歸
  3. 簡單羅吉斯迴歸
  4. 複羅吉斯迴歸
(D) 24一組100 人的隨機樣本,進行暴露(X)與疾病(Y)的關係研究,變數設定以及研究結果整理為下列2 × 2 的列聯表,如果以羅吉斯迴歸分析之後,截距 的估計值為何?
 有病(Y = 1)沒病(Y = 0)
有暴露(X = 1)1020
無暴露(X = 0)4030
  1. 10/40
  2. 20/30
  3. log(10/20)
  4. log(40/30)
(B) 25利用羅吉斯迴歸分析有無用藥(Treatment, yes vs. no)對於疾病的治癒效果(Cure, yes vs. no),發現在男性族群中,有用藥物治療的病患勝算(odds),是安慰劑病患勝算的2 倍,但是女性族群中,勝算比降為1.2 倍。請問這個研究中,對於性別變數的敘述何者最適切?
  1. 性別變數是干擾因子(confounder)
  2. 性別變數修飾了藥物與治癒的關係(effect modifier)
  3. 性別變數只是共變數(covariate)
  4. 性別變數可以預測疾病
(D) 26想研究高中生男女的體脂肪有無差異,隨機收集了年齡相近的13 位男生與11 位女生,描述統計如下所示。欲以two sample t-test 檢定,若假設兩組變異數相等,此變異數(pooled variance)的估計值最接近之數值為何?
組別樣本數(n)平均數($\bar{x}$ )標準差(s)
女同學11225
男同學13157
  1. 35
  2. 36
  3. 37
  4. 38
(B) 27分析40 位12~17 歲青少年的年齡(Age)與身高(公分)的關聯性分析,得到下表,下列敘述何者正確?
VariableEstimateLower bound of 95% CIUpper bound of 95% CI
Intercept96.8270.09123.56
Age4.442.546.34
  1. 皮爾森相關係數(Pearson correlation coefficient)是0.37,迴歸係數(regression coefficient)是4.44
  2. 皮爾森相關係數是0.61,迴歸係數是4.44
  3. 皮爾森相關係數是0.61,迴歸係數是96.82
  4. 身高有37%可以被年齡所解釋,迴歸係數是96.82
(D) 28分析年齡(age)、性別(gender)、教育程度(educ)與美國總統選舉(vote)的相關性,這些變數的數值編碼(coding)與分析結果如下。請問男性對比女性選民(Male vs. Female),投給Trump(vote = 1 vs. 0)的勝算比為何?
vote
 0 = ' Clinton '
 1 = ' Trump ' ;
gender
 1 = ' Male '
 2 = ' Female ' ;
educ
 1 = ' HS Not Completed '
 2 = ' Completed HS '
 3 = ' College < 4 Years '
 4 = ' College 4 Year Degree '
 5 = ' Advanced Degree ' ;
Analysis of Maximum Likelihood Estimates
Parameter DFEstimateStandardErrorWaldChi-SquarePr > ChiSq
Intercept 10.27540.19591.97590.1598
genderFemale1-0.35590.084117.8915<.0001
genderMale00---
age 10.01310.0024628.3128<.0001
educ 1-0.25180.038742.3355<.0001
  1. 0.3559
  2. -0.3559
  3. $ e^{-0.3559}$
  4. $ e^{0.3559}$
(D) 29某個治療肺癌病人的臨床試驗比較試驗用藥(test drug)和標準治療(standard treatment)兩組病人的存活狀況,分析結果如圖所示,下列敘述何者錯誤?
  1. 此存活曲線是由Kaplan-Meier 估計值(estimates)所繪製而成
  2. 試驗用藥(test drug)比標準治療(standard treatment)的存活狀況好
  3. 試驗用藥(test drug)的中位數存活時間在180 天以上
  4. 標準治療(standard treatment)的中位數存活時間在150 天以上
(C) 30在進行比較實驗組與對照組之衛教介入前後知識分數的改變量平均值時,統計分析軟體提供了下列的結果,以0.05 的型一誤差(type I error rate)來判定:檢定兩組變異數是否有差異的F 檢定:p-value = 0.010Equal variance 之t 檢定:p-value = 0.001Unequal variance 之t 檢定:p-value = 0.212請問下列敘述何者正確?
  1. 實驗組和對照組的改變量平均值達顯著性差異,此檢定的p 值是0.010
  2. 實驗組和對照組的改變量平均值達顯著性差異,此檢定的p 值是0.001
  3. 實驗組和對照組的改變量平均值沒有達顯著性差異,此檢定的p 值是0.212
  4. 實驗組和對照組的改變量平均值沒有達顯著性差異,此檢定的p 值是0.001
(D) 31在執行存活分析時需要定義每筆個案的資料之追蹤結果是屬於事件(event)資料,還是設限(censor)資料,某一結腸直腸癌的標靶藥品治療研究,病人在試驗結束後所登錄的追蹤結果分別是:A=存活,B=死於肺癌,C=死於結腸直腸癌,D=死於肺癌及結腸直腸癌以外的其他癌症,E=死於非癌症的其他原因,因此在計算各種死亡率時,下列敘述何者錯誤?
  1. 計算癌症存活率時,BCD 設定成事件資料,AE 設定成設限資料
  2. 計算結腸直腸癌存活率時,C 設定成事件資料,ABDE 設定成設限資料
  3. 計算總存活率時,BCDE 設定成事件資料,A 設定成設限資料
  4. 計算肺癌存活率時,BC 設定成事件資料,ADE 設定成設限資料
(C) 32一個研究要分析6 所大學的資料,想探討一年級新生的BMI 數值是否相等,於是在每一間大學隨機抽取100 人進行試驗,最終選定變異數分析ANOVA 作為分析工具。此方法的檢定統計量為下列何者(F 是累積機率密度函數,α 是顯著水準)?
  1. $F_{0.05}(5,594)$
  2. $F_{0.05}(5,599)$
  3. $F_{0.95}(5,594)$
  4. $F_{0.95}(5,599)$
(B) 33一個預測變數有3 個類別,暴露等級分別為輕度、中度、重度。此變數在線性迴歸分析中,欲以虛擬變數的方式分析,請問要生成幾個虛擬變數?
  1. 1
  2. 2
  3. 3
  4. 4
(A) 34若A 和B 兩事件發生機率已知分別為P(A)= 0.4;P(B) = 0.6;P(A|B) = 0.4,試求P(A∪B)為何?
  1. 0.76
  2. 1.00
  3. 0.24
  4. 0.20
(A) 35一個研究探討新發現的兩個發炎指數之間的相關性,已知其中一個發炎指數為指數分配,另一個為F 分配F(5, 2),下列何種統計方法最適用於此研究?
  1. Spearman correlation coefficient
  2. Pearson correlation coefficient
  3. Signed rank test
  4. Mann-Whitney U test
(B) 36Cox proportional hazards model 如下,其中Age 的單位為歲(years) $ h_i(t) = h_0 (t) \times e^{0.1 \times Age +0.2 \times BMI + 0.3 \times Male}$
對於相同BMI 值的男性,請問30 歲的人對比20 歲(Age = 30 vs. Age = 20)的風險(hazard)的比值是多少?
  1. 0.1
  2. $e^1$
  3. $e^{0.1}$
  4. $10 \times e^{0.1}$
(B) 37假設A為血壓器測量顯示有高血壓症狀, 則為血壓器測量顯示正常值(無高血壓症狀),B為測試者有高血壓, 則為正常測試者(血壓值正常),請問此血壓器的特異度(specificity)是下列那一個條件機率?
  1. $P(A|B)$
  2. $P(\bar{A}| \bar{B})$
  3. $P(B|A)$
  4. $P(\bar{B}| \bar{A})$
(B) 38某項研究調查罹患口腔癌的危險因子,經由羅吉斯迴歸計算出抽菸與嚼食檳榔的勝算比和95%信賴區間,分別為抽菸1.5 (0.9~2.5)及嚼食檳榔2.5 (1.5~4.1),若兩個危險因子各自以0.05的型一誤差(type I error rate)來判定,則下列敘述何者正確?
  1. 抽菸與嚼食檳榔都是達統計上顯著性的危險因子
  2. 僅嚼食檳榔是達統計上顯著性的危險因子
  3. 僅抽菸是達統計上顯著性的危險因子
  4. 抽菸與嚼食檳榔都沒有達統計上顯著性
(A) 39某位老師研究2000 位新生兒,結果發現新生兒出生體重(y,以公克為單位)可能與媽媽生產年齡(x,連續變數,以歲為單位)有關,該老師決定採用simple linear regression 以x 來預測發生 y 的可能性,可得到迴歸方程為$ y= \hat{a}+ \hat{\beta}_x $ 。已知 $\hat{\beta} < 0 $ 且其 $p < 0.05$,請問下列敘述何者正確?
  1. 當媽媽生產年齡愈大,其新生兒出生體重愈輕
  2. 當媽媽生產年齡愈大,其新生兒出生體重愈重
  3. 無法判定媽媽生產年齡與其新生兒出生體重的關係
  4. 媽媽生產年齡與其新生兒出生體重無關
(C) 40如圖所示,A 和B 圖的X 軸與Y 軸的範圍相同,下列有關A 和B 圖的比較敘述何者錯誤?
  1. 決定係數與相關係數都是B 較高
  2. 相關係數是B 較高,迴歸係數是A 較高
  3. 迴歸係數與相關係數都是B 較高
  4. A 的決定係數較低,但迴歸係數比B高

※本站所有內容皆為志光教育科技集團版權所有,未經同意請勿任意複製、轉載、發行或刊他處。


TOP