整理下几个概念:
- Risk/Absolute Risk (AR)
- Relative risk (RR)
- Absolute Risk Reduction (ARR) 或 Absolute Risk Difference (ARD)
- Relative Risk Reduction (RRR) 或 Relative Risk Difference (RRD)
- Number Needed to Treat (NNT)
- Odds Ratio (OR)
>上图来自于http://www.statstutor.ac.uk/resources/uploaded/stcp-rothwell-risk.pdf
Risk/Absolute Risk (AR)
AR计算事件发生的risk:AR = a / (a+b)
,比如发病风险,即暴露组/非暴露组发生的事件人数除以该组的总人数
对于AR的wilson置信区间CI,可使用DescTools
包的BinomCI
函数来计算
DescTools::BinomCI(x = a, n = a + b, conf.level = 0.95, method = "wilson")
Relative risk (RR)
RR计算event在组A中比组B中发生的可能性(risk)有多大:RR = (a/(a+b)) / (c/(c+d))
即在队列试验中,RR等于暴露组发病风险除以非暴露组发病风险;在随机对照试验中,RR等于处理组发病风险除以对照组发病风险
对于RR的置信区间CI,由于其不是对称的,因此可先对其log转化 (取对数后符合正态假设),然后通过以下公式计算可计算其标准误:
se <- sqrt(1/a - 1/(a+c) + 1/b - 1/(b+d))
然后其CI为:
[exp(log(rr) - 1.96*se), exp(log(rr) + 1.96*se)]
Relative risk与hazard ratio的差别:
- HR即风险函数比,是生存分析资料中用于估计因为某种因素的存在而使死亡/缓解/复发等风险改变的倍数
- HR还考虑了时间因素,换言之,包含了时间效应的RR就是HR
- 从终点时间的角度来看,RR考虑了终点事件的差异,而HR不仅考虑了终点事件的有无,还考虑了到达终点所用的时间及截尾数据
如何解读RR的值
- 如果 RR 或比值比 (odds ratio, OR)=1,或者可信区间 (confidence interval, CI) =1,则治疗组与对照组无显著差异。
- 如果 RR > 1 且 CI 不包括1,治疗组中发生事件的可能性显著大于对照组。
- 如果 RR < 1 且 CI 不包括1,治疗组中发生事件的可能性显著小于对照组。
Absolute Risk Difference/Reduction (ARD/ARR)
ARR计算事件发生的absolute risk在不同组之间的差值(降低):ARR = |a/(a+b) - c/(c+d)|
;
Relative Risk Difference/Reduction (RRD/RRR)
RRR计算事件发生的relative risk在不同组之间的差值(降低):RRR = (a/(a+b) - c(c+d)) / (a/(a+b))
,公式换算下,即RRR = 1 - RR
(其中RR<1
)
如:当相对风险RR等于80%时,则相对风险降低为20%,意味着与对照组相比,治疗组出现事件的相对风险降低了20%
Number Needed to Treat (NNT)
NNT计算某治疗方法处理多少人后才会有一个人获得治愈,NNT = 1 / ARR
NNT是指在评价治疗或预防疾病措施的研究中,用某种方法(药物、疫苗等)处理某人群(疾病、健康人群等)时,获得1例有利结局或者防止1例不良结局时,所需要的人数
若NNT=1/0.1=10
时,意味着需要有10例患者接受治疗后,会有1例患者免于死亡
如:患者在未治疗下发生卒中的AR为25%,治疗后的AR跌至20%,那么ARR=25%-20%=5%
,RRR=(25%-20%)/25%= 20%
,NNT=1/0.05 = 20
Odds Ratio (OR)
在回顾性研究(如病例对照研究)中,研究对象是已经患病的“病例组”和未患病的“对照组”,研究者回顾性地调查病例组和对照组的暴露情况,因此无法计算发病率等指标;所以要评价暴露和疾病是否存在关联,以及这个关联的强度有多大时,就不能直接计算RR了。比值比(Odds Ratio, OR)作为RR的一个替代指标,在回顾性研究中可以评价暴露因素和疾病的关联强度。
比值比(Odds Ratio)= (病例组的暴露比值(a/c)) ÷ (对照组的暴露比值(b/d)) = ad/bc,即OR = (a*d)/(b*c)
一般OR值计算会只用一些R的函数,并且顺便得到其置信区间CI值,但是也可以通过公式手动计算(类似于RR),如:
计算其标准误:
se <- sqrt(1/a + 1/b +1/c + 1/d)
然后其CI为:
[exp(log(OR) - 1.96*se), exp(log(OR) + 1.96*se)]
Summary
以上指标有时候单个看无法很好的解释研究问题,可通过具体的实例加深理解,并从多个角度来看待数据的结果;可参考:
参考资料:
http://sphweb.bumc.bu.edu/otlt/MPH-Modules/BS/BS704_Confidence_Intervals/BS704_Confidence_Intervals8.html
http://yufree.github.io/blogcn/2014/02/18/2by2-table.html
https://a-little-book-of-r-for-biomedical-statistics.readthedocs.io/en/latest/src/biomedicalstats.html
https://stat.ethz.ch/pipermail/r-help/2006-November/117182.html
https://www.nps.org.au/australian-prescriber/articles/interpreting-risks-and-ratios-in-therapy-trials
http://www.statstutor.ac.uk/resources/uploaded/stcp-rothwell-risk.pdf
本文出自于http://www.bioinfo-scrounger.com转载请注明出处