云题海 - 专业文章范例文档资料分享平台

当前位置:首页 > 第3讲基因-环境交互作用研究概况

第3讲基因-环境交互作用研究概况

  • 62 次阅读
  • 3 次下载
  • 2025/7/1 22:17:22

传因素或者遗传与环境交互作用时,它并不是最佳的研究方法。首先是人群分层偏倚。该方法的潜在问题是当病例和对照遗传背景不同时,会由于这一混杂因素而不能对遗传作用或者遗传与环境交互作用做出正确估计。当除遗传因素外的其他因素(例如,环境因素或者其他基因)导致患病,且这些因素在各个亚人群中分布也不同时,则有可能由于遗传因素与其他因素的相关而得到遗传与疾病之间的虚假关联结果。二是所需样本量大。评估交互作用所需的样本量一般是评估相同大小主效应所需样本量的4倍。因此很难用于暴露率低或罕见基因的疾病,因为过小的暴露率会使所需样本量过大,以致无法实施。三是对照组基因信息较难得到(生物样本采集困难)。

2、病例-病例研究

又称为单纯病例研究或病例系列研究。此研究方法与传统的病例对照类似,也是按是否携带易感基因将病例分为两组,有易感基因组成为新的病例组,而未携带易感基因者则为新的对照组,分析方法有计算 OR值和可信限或用多因素回归模型控制混杂。病例-病例研究的最大优点在于不需要―无病的人‖来做对照, 使研究易于实施。很多学者也从单纯病例研究设计、样本大小、检验效能等进行了相关分析与研究,认为单纯病例研究可以作为分析基因与环境交互作用的一个较好的选择。Piegorsch[7]等从理论可行性上对病例-病例研究进行了分析,认为当人群中基因(G)与环境因素(E)相互独立,且所研究疾病发病率很低时,以病例为基础进行交互作用分析从理论是可行的,即使没有对照组也可以估计G与E之间的交互作用,并且结果精确度要优于传统的病例对照研究。Yang[8]等比较了同等条件下单纯病例研究与病例对照研究所需要的样本大小及检验效率,发现前者可大大节省样本含量,并且估计精度高,检验效能高。

病例-病例研究的一个重要前提就是所研究基因和环境因素要相互独立,但在实际研究中很难判断所研究的两个因素是否相互独立。因此,这个前提条件是否成立以及如何检验是目前争论和研究的一个焦点。如果不满足这个条件,研究结果就会带有偏倚,并且偏倚大小与关联程度成正相关。Albert [9]等通过模拟检验发现单纯病例研究结果与独立性假设密切相关。如果基因与环境之间存在关联,即使是很小的关联,I类错误将被放大,导致虚假联系。他们认为,只有相当的经验数据表明基因和环境因素满足独立性要求时,单纯病例研究才是一种有效的研究方法;如果没有这种证据时,对于单纯病例研究结果(估计值、可信限等)的解释要谨慎。对于独立性的检验,有学者在研究环境危险因素与基因之间的交互作用时,同时收集病例和对照信息,在对照人群中确认二者相互独立,再进行单纯病例研究。

3、病例父母对照研究

病例父母对照研究用病例的父母作为对照组, 寻找与疾病发病有关的遗传标志或与其相邻位点上连锁不平衡的等位基因, 评估环境致病因素与基因型之间的交互作用。根据病例组和对照组之间相对风险的计算方法不同,病例父母对照研究模型分为三类:基于基因型的单体型相对风险分析( GHRR)、基于单体型的单体型相对风险分析(HHRR)、 传递/不平衡检验( TDT )。在交互作用研究中应用较多的是TDT,研究者将病例按照环境因素情况进行分

- 5 -

层,分析易感基因传递频率的差异,从而分析环境致病因素与基因型之间的交互作用[10]。

在研究基因、环境与肿瘤的关系时,如果所研究疾病与种族、民族、血统有关,对照的选择就尤为重要,否则就会导致偏倚或混杂[11]。病例父母对照设计可以克服遗传因素中种族差异的混杂作用,减少由于遗传人群结构(包括人群分层和混杂)所造成的偏倚[12],这正是传统病例对照研究所不能解决的问题。此外,在使用这种设计中,病例的父母亲比随机对照有更高的参与率。病例父母亲对照设计可以较好地来研究遗传和环境的交互作用,而且所需的样本含量较小。模拟检验显示[10]病例父母亲对照研究比传统的病例对照研究的效率要高,尤其当易感等位基因外显率罕见和环境危险因素对未携带易感基因的患者作用较大的时候。

病例父母对照研究有两个前提条件,否则会产生偏倚。首先必须服从孟德尔遗传规律,遗传效应的评价基于观测值与符合孟德尔遗传规律时的期望值之间的偏差,这是病例父母对照研究的理论基础。其次是当双亲具有不同基因型时,子女的暴露状态与其候选位点的基因型是相互独立的。该方法的缺点是当双亲的基因型与影响生育的疾病有关时,对照组不能代表所研究的人群。其次,该方法不能评估环境暴露的独立效应,只能估计暴露者与非暴露者基因型是否存在差别。第三是TDT法区分不出由于连锁不平衡造成的关联与标记基因本身即疾病易感性所造成的关联。

4、病例同胞对照研究

该设计也是以家系为对照的一种病例对照研究,以患者及其未患病同胞为研究对象,将同胞作为对照,通过比较同胞的等位基因或者基因型,来检测遗传标志是否与疾病位点基因关联或者连锁及基因与环境是否有交互作用[13]。与病例父母对照一样,该设计也可以有效地避免人群分层混杂现象。其次是资料容易获得,对于肿瘤等晚期发作的疾病来说,测定患者父母的基因型非常困难,有时候甚至是不可能的。因此,用患者同胞的信息来推断患者父母的基因型,而且同胞比父母对照更易于获得相关调查资料。病例和未患病同胞的基因来源于相同的亲代,二者之间等位基因频率的差别要小于随机人群中抽取的发病和未发病者之间的差别。因此,实施过程中容易出现匹配过度。没有同胞或不能获得同胞信息的病例不能纳入研究,容易损失信息。

四、研究方法

基因与环境因素的交互作用在方法学上取得了很大的进展,但也存在着需要进一步解决的问题和重点关注的领域,一是由于易感基因携带率、环境因素暴露率等比较低,研究所需要的样本量大,目前相关病例与对照研究的平均样本量为150~300例。有学者认为,比较准确的研究基因因素的主效应,样本量要达到500~2000例,需要扩大样本量[14]。二是为了全面评估基因和环境因素的效应,应当对相加模型和相乘模型条件下的效应情况都进行研究,分析其主效应和交互效应,这也对样本量大小提出了要求,并对研究方法提出了要求。三是有关方法检验效率和检验效能的研究很少。从分析方法上看,有叉生分析、多因素Logistic回归模型、多因子降维法和基于复合连锁不平衡的交互作用分析方法。

- 6 -

(一)叉生分析法

叉生分析[3]是遗传流行病学研究中分析基因-环境交互作用的最基本的方法之一,群体病例对照研究、病例父母亲对照研究、病例同胞对照研究、队列研究设计类型的资料均可用叉生分析方法分析基因与环境之间的交互作用。

表2所示的是2*4叉生分析是基因与环境因素相互作用研究中的基本研究单元,它表示基因(G)、环境因素(E)均为二分类变量而组成的4种可能的组合表。同时暴露于两因素相对于同时不暴露于两因素的危险性 (比值比,OR )记为 ORge (简记为A);单独暴露于基因或环境因素的危险性分别记为ORg、ORe (分别简记为B、C);两因素均未暴露的病例和对照组作为共同参比组,OR = 1。

表2 基因(G)与环境因素(E)因素作用的2*4叉生分析

基因 (G) + + – –

表中基因与环境联合作用的效应不仅包括两者分别作用的效应,还可能包括基因与环境作用的叠加,也可能呈现基因与环境作用的相乘效应。通过不同的模型,可以判别基于不同模型的两因素间交互作用是否存在及其大小。

那么在叉生分析中,交互作用又是怎样被度量呢?由于交互作用的存在与否,与所选择的模型密切相关,根据Rothman[4]提出的基于相加模型计算交互作用的指标,有以下几种:

1.交互作用指数 (the synergy index,S) S =(A-1)/[(B - 1) + (C - 1)]

意义:当S=1时,无交互作用;S≠1时,基因(G)与环境(E)存在相加模型交互作用;S>1时,两因子间有正交互作用;S<1时,两因子间有负交互作用;S的绝对值越大,基因(G)与环境(E)之间的交互作用越强。

2.交互作用归因比 (attributable proportion of interaction,AP) AP =[A-(B + C-1)]/A

意义:AP 表示总效应中有多大比例归因于基因(G)与环境(E)之间的交互作用。AP的绝

- 7 -

环境因素

(E)

+ – + –

病例组 a c e g

对照组 b d f h

OR值 ORge =A= ah/bg ORe =B= ch/dg ORe =C= eh/fg

1

意义

G、E联合作用效应 G单独作用效应 G单独作用效应 共同对照

对值越大,基因(G)与环境( E)之间的交互作用越强。

3.纯交互作用归因比AP* AP*=[A-(B + C-1)]/(A-1)

意义:AP*表示由基因 ( G )与环境(E)两因素引起的效应中归因于二者交互作用的比例。 4.交互作用超额相对危险度 ( relative excess risk of interaction , RERI) RER I= A-(B + C-1)

意义:表示基因(G)与环境(E)两因素联合作用与其单独作用之和的差值,同时也表示交互作用与基因(G)与环境(E)两因素以外的因素作用之间的关系,如果未知因子作用很大,则所研究的交互作用就变得十分次要而没有意义。这里,RERI即为基于相加模型的两因素交互作用值。RERI的绝对值越大,基因(G)与环境(E)之间的交互作用越强。

从上述四项指标可以看出,上述公式均是以基因 (G)与环境(E)的相加模型的交互作用为前提的。

叉生分析的优势与局限:(1)叉生分析表作为病例对照研究中基本的流行病学分析方法,具有信息量丰富、计算直观等优点。通过叉生分析表,不仅分别获得基因和环境因素各自的主效应,还获得基于不同模型(相加或相乘模型)的交互作用效应。(2)由于2*4叉生分析表只能分析单个基因(G)与单个环境因子(E),且二者均为二分类变量时的交互作用,它无法分析每个因子是多分类或多个因素间的交互作用。(3)在研究基因(G)与环境因子(E)之间的交互作用时,若存在混杂因素的影响,则交互作用的测量结果将会被歪曲。此时, 需要控制混杂因素后再进行叉生分析,以反映交互作用的真实强度。

(二)数据模型

从数据分析方法上看,有四类数据挖掘方法可以用于交互作用的研究:(1)降维法,主要有多因子降维法MDR、logistic回归、多元自适应回归样条等; (2)基于树的方法,主要是指递归划分算法,包括分类回归树和随机森林random forest等;(3)模式识别法,包括神经网络、支持向量机;(4)贝叶斯法;贝叶斯上位效应关联图谱等。

1.Logistic回归模型

Logistic回归模型是病例对照研究中分析遗传统计方法。在Logistic回归模型中,自变量通过logistic函数与二分类结局变量(如疾病状态)联系起来。非条件Logistic回归用于成组的病例对照研究;条件Logistic回归则用于配对的病例对照研究。

Logistic回归的优点有:(1)分析某个自变量的效应时,可以同时控制多个协变量的影响;(2)可以处理自变量对因变量的非线性效应;(3)可以在模型中引入交互作用项;(4)回归系数的可解释性。

- 8 -

搜索更多关于: 第3讲基因-环境交互作用研究概况 的文档
  • 收藏
  • 违规举报
  • 版权认领
下载文档10.00 元 加入VIP免费下载
推荐下载
本文作者:...

共分享92篇相关文档

文档简介:

传因素或者遗传与环境交互作用时,它并不是最佳的研究方法。首先是人群分层偏倚。该方法的潜在问题是当病例和对照遗传背景不同时,会由于这一混杂因素而不能对遗传作用或者遗传与环境交互作用做出正确估计。当除遗传因素外的其他因素(例如,环境因素或者其他基因)导致患病,且这些因素在各个亚人群中分布也不同时,则有可能由于遗传因素与其他因素的相关而得到遗传与疾病之间的虚假关联结果。二是所需样本量大。评估交互作用所需的样本量一般是评估相同大小主效应所需样本量的4倍。因此很难用于暴露率低或罕见基因的疾病,因为过小的暴露率会使所需样本量过大,以致无法实施。三是对照组基因信息较难得到(生物样本采集困难)。 2、病例-病例研究 又称为单纯病例研究或病例系列研究。此研究方法与传统的病例对照类似,也是按是否携带易感基因将病例分为两组,有易感基因组成为新的病例组,而未携带易感基因者则为新的

× 游客快捷下载通道(下载后可以自由复制和排版)
单篇付费下载
限时特价:10 元/份 原价:20元
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信:fanwen365 QQ:370150219
Copyright © 云题海 All Rights Reserved. 苏ICP备16052595号-3 网站地图 客服QQ:370150219 邮箱:370150219@qq.com