- 分子流行病学和分子进化流行病学
- 徐德忠
- 7359字
- 2021-12-18 02:48:31
第四节 生物学标志在分子流行病学中的应用
一、分子流行病学研究常用的生物学标志
生物学标志可以是简单的分子,如核酸、代谢物、碳水化合物(如葡萄糖)、类固醇等;稍复杂些的生物学标志有多肽和蛋白质,如胰岛素、血红蛋白A和C、前列腺特异性抗原以及C-反应蛋白;更复杂的生物学标志可以是某种类型的细胞,如血小板或不同亚型的T细胞。分子流行病学常用的生物学标志有:
1.基因作为生物学标志 DNA损伤、SNPs、单体型分析。
2.蛋白质作为生物学标志 蛋白质组学。
3.线粒体DNA突变和缺失。
4. RNA和转录组学作为生物学标志。
5.代谢组学生物学标志 代谢产物的位置、代谢产物的正常和异常浓度。
6.糖组学 复杂糖类(或聚糖)结构和功能。
7.其他 疾病的细胞,干细胞,癌症干细胞生物学标志,内皮糖蛋白作为干细胞的功能性生物学标志、自身抗体作为自身免疫性疾病的生物学标志等。
二、生物学标志在分子流行病学中的应用
从群体水平探讨生物学标志的分布及其与疾病及健康的关系和影响因素,进而研究预防控制疾病、促进健康的宏观策略与具体措施,是新时期流行病学理论研究和社会实践的特征,是分子流行病学内涵所在。分子流行病学作为流行病学发展的分支,就其从群体水平阐明生物学标志的流行病学意义的思想已经深刻地影响着预防医学的各分支学科、临床医学研究和实践的各个领域、基础医学研究的方法学更新等方方面面,确实称得起是一种革命性的变革,而生物学标志在分子流行病学的应用同样凸显了流行病学本身的学术内涵和方法学价值,与各学科交叉融合发展的学术成果、应用价值及对医学和健康事业推动的潜在力量。
1.暴露的精确测量
流行病学所指的暴露是接触某种因素或具有某种特征,暴露因素种类繁多,对于物理、化学、生物、社会以及人口学特征等因素暴露,分子流行病学将其分为外暴露、内暴露和生物有效剂量暴露。在体内生物材料中检测到外源性的化学物质或其代谢产物,这就已经比在调查中询问或环境监测到的暴露精确得多,使暴露错分的可能性大大减少。例如,液相色谱质谱检测尿中羟基萘和3-羟基菲作为评价焦炉工外暴露等级,较好反映多环芳烃的内暴露剂量水平。如果发现这种化学物质等价地结合到DNA或蛋白质上形成了加合物,则可提供直接的已作用到靶组织的准确测量,因此这被称之为特定暴露的“指纹”。从传统流行病学调查中发现吃霉变食物可引起肝细胞性肝癌,这是从群体食物调查和粮食检测黄曲霉素得出的关联性,是对外暴露可能性的判断,但某个个体是否暴露于黄曲霉素?黄曲霉素是否真正进入体内?是否对靶组织引起致病变作用?只有靠生物学标志(DNA-黄曲霉素加合物)的测量才可准确回答这个问题。因此,对因果联系已经确定的疾病,体内剂量与生物学有效剂量的检测,可应用于群体或个体对暴露的监测。美国大型的子宫颈癌筛查临床研究-ATHENA研究(有47 208例妇女参加,持续5年)发现,细胞学检查漏诊的高级别宫颈上皮内瘤变(cervical intraepithelial neoplasia, CIN,即CINⅡ、Ⅲ)中,有1/3为HPV16型和/或HPV18型阳性。细胞学检查阴性但HPV16型阳性的妇女,发现CIN及以上病变的风险为13.6%,即平均约8个人中就有1个人被细胞学检查漏诊。细胞学检查阴性但HPV18型阳性的妇女,发现CINⅡ及以上病变的风险为7%。细胞学检查为ASCUS、高危型HPV阳性者发生CINⅡ及以上病变的风险,与HPV16和/或18型阳性但细胞学检查阴性者的风险相当,应立即进行阴道镜检查,所以在筛查中结合HPV16、18型基因分型,可以更好地进行风险分层管理。
2.致病因子效应的早期和精准判定传统
流行病学强调疾病的二级预防为早发现、早诊断、早治疗,此“三早”多数是通过脏器影像学及功能的判断,而分子流行病学应用生物学标志不但进行暴露的精确测量,而且能精准测量暴露的效应,即测量疾病启动、发生、发展过程相关的早期生物效应标志、结构和/或功能改变标志和临床疾病标志,这种效应标志的测量使发现疾病的关口前移,对于揭示致病机制、早期发现疾病及逆转早期生物学效应或预测疾病的发生具有重要意义。随着生物学技术日新月异的发展,以组学为特征的生物学标志不断出现,反映暴露的生物学效应标志不断完善。例如,BaP是多环芳烃中污染最广且致癌性最强的一类环境污染物,经体内细胞色素P450酶等的作用,BaP生成最终代谢产物BPDE, BPDE和DNA共价结合,形成稳定的DNA加合物。加合物既可以作为接触标志物,反映多环芳烃在靶部位的效应剂量,又可以作为效应标志物,反映DNA的损伤程度。因此,以DNA加合物作为生物学标志,可研究个体的多环芳烃暴露、代谢酶和核酸修复酶的基因型与个体患癌风险的关系,对建立健康风险评估、保护人群健康具有重要意义。
3.群体及个体易感性的分析
易感性是一个非常宽泛的概念,传统流行病学认为易感性是发生某种疾病的可能性,但如何明确个体和群体的易感性,手段是非常有限的。分子流行病学进行易感性研究,是通过易感性生物学标志探讨群体和个体如何通过遗传易感性(或获得性易感性)影响有害因素进入机体后到疾病发生全过程的,如群体中的某个特征的亚群可能对某种有害物质的代谢能力较差,烟草的代谢能力有非常大的差别就是一个很好的例子,这也就能够部分解释为什么同是吸烟者,有些人一生吸烟或重度吸烟不患肺癌。目前,疾病易感性研究主要关注遗传易感性,即由个体遗传背景差异所导致的不同个体对同一疾病易感程度或治疗反应的强弱。高危险易感基因,如携带 BRCA1和 BRCA2基因突变的个体终生发生乳腺癌的概率为40%~80%,相对危险度较高。但这类标志物在人群中通常比较罕见,一般小于1%,对总体人群发病的归因危险度也比较低。低危险易感基因的生物学标志单独对疾病的贡献往往很小,相对危险度一般小于1.5,外显率较低,主要通过多个变异或者与环境因素的协同作用增加个体对疾病的易感性,但人群分布的频率较高,一般大于5%,故人群归因危险度较高,如代谢酶基因(Ⅰ相和Ⅱ相)、DNA修复基因和细胞周期调控基因。高危险易感基因和低危险易感基因比较见表2-9。
表2-9 高危险易感基因和低危险易感基因的特征比较
以上分别叙述了暴露生物学标志、效应生物学标志、易感性生物学标志在分子流行病学中的应用,下面介绍其综合应用的几个主要方面。
4.病因学研究
通过生物学标志的研究,可以逐渐了解暴露因素,致病因子引起靶组织与细胞的基因和蛋白质改变的进程,甚至造成疾病发生的机制。我们可以认为,分子流行病学之所以能揭开暴露至疾病发生之间黑匣子,主要有赖于对各种生物学标志的研究。自20世纪50年代,人乳头瘤病毒(human papilloma virus, HPV)被推测能诱发宫颈癌之后,大量流行病学和分子生物学研究证实了高危型HPV感染是发生CIN及宫颈癌的必要病因。研究集中于HPV致癌机制及针对HPV相关癌症的防治疫苗中的重要靶基因。目前已经得到鉴定的HPV DNA有百余种,其中低危型(HPV6、11、30等)可引起尖锐湿疣、扁平湿疣等良性病变,高危型(HPV16、18、31、58等)主要导致CIN和宫颈癌。流行病学显示,约99%CIN和宫颈癌是由高危型HPV持续感染所致,其中2/3患者与HPV16、18的持续感染相关,HPV16型多发展为宫颈鳞癌,而HPV18型与宫颈腺癌密切相关。E6蛋白可能在其恶性转化中扮演重要角色,主要通过抑制p53与DNA结合,导致p53蛋白降解失活;水解Bax、Bcl-2,从而抑制凋亡;激活端粒酶,使正常细胞永生化;使感染的HPV细胞逃逸机体免疫。因此,HPV16和HPV18 E6蛋白可作为HPV持续感染及CIN发生与发展的重要预警指标。宫颈癌病因复杂,但与HPV的关系明确;以疫苗为代表的免疫治疗将对宫颈癌的预后产生重大改善。2006年,世界上第一支可以预防癌症的疫苗——HPV疫苗,由美国食品药品监督管理局(FDA)批准上市,并获得世界卫生组织(WHO)的认可。早在2014年,WHO就发布指南,呼吁大家接种宫颈癌疫苗,认为接种宫颈癌疫苗和定期进行宫颈筛查,是最有效的防控措施。
5.疾病诊断、疗效评价和预后估计
(1)疾病诊断:
有些生物学标志在正常的人体生物材料中并不存在,只在疾病发生时才出现,如微卫星不稳定性是一种肿瘤的分子标志。微卫星不稳定性(microsatellite instability)是指基因组中少于10个核苷酸的简单重复序列的增加或丢失,它与肿瘤的发生有关,仅在肿瘤细胞中发现,从未在与肿瘤相邻的正常组织及周围白细胞中发现。且在原发肿瘤与转移肿瘤中,微卫星不稳定性均匀分布于整个肿瘤,这提示微卫星不稳定性是在肿瘤细胞克隆之前或刚克隆时发生的现象,微卫星不稳定性首先在结直肠癌中观察到,以后相继在胃癌、胰腺癌、肺癌、膀胱癌等肿瘤中发现。因此,微卫星不稳定性这一标志可作肿瘤的早期诊断和筛检。某些生物学标志,如胚胎性肿瘤抗原,主要有AFP和CEA,原是在宫内时期表达的抗原,出生后即大大减弱或消失,在修复过程或肿瘤增生时又重新出现于胎儿期所出现的器官。肝癌患者中70%AFP阳性,还见于卵巢和睾丸的癌,偶见于消化道及肺的癌,在慢性肝炎和肝硬化呈中等水平。还有些生物学标志是正常组织中可能已经存在,如癌基因、抑癌基因和其他相关抗原,只是含量低,或处于未激活状态,基因产物低表达,而当被激活后其基因产物高表达、含量升高,也可能具有诊断和筛检价值。
应指出的是:凡生物学标志要用于疾病的筛检和诊断,均应进行评价。比如,2011年Chu等采用电化学发光免疫分析技术研究了细胞角蛋白19片段(CYFRA21-1)对肺癌的诊断价值,截断点为4.0ng/ml,其灵敏度、特异度及准确度分别为24.13%、97.3%和21.4%;从组织学角度来看,对鳞癌的灵敏度高于腺癌;CYFRA21-1对肺癌的诊断也优于CEA。因此,在与其他指标的诊断价值作规范、科学的比较后发现,CYFRA21-1可能成为检测肺鳞癌的首选的肿瘤标志物。
(2)疗效及干预效果评价:
通过不同种类的生物学标志可以了解临床及社区干预措施的效果。在戒烟的试验中已经发现,检测唾液中可替宁(cotinine)的含量对目前吸烟状况的了解比用调查表得到的信息准确得多。在疗效评价的研究中,可以用生物学标志来监测对治疗措施的依从性。比如,一项在社区诊所进行的初级预防试验,为了评价一种降血脂药物考来烯胺对心血管疾病的死亡和发病的影响,使用血清胆固醇的检测作为用药依从性的判断指标。当然也可以用生物学标志评价治疗效果。如果评价某一药物治疗病毒性肝炎的效果,可以用血清ALT作评价指标;如果试验清除HBV的效果,可以用血清HBsAg、HBeAg等指标来评价。如果评价流行性出血热沙鼠肾细胞培养病毒灭活疫苗的免疫效果,就可以用流行性出血热病毒(epidemic hemorrhagic fever virus, EHFV)中和抗体的阳转率来评价。上述血清ALT、HBsAg、HBeAg和抗-EHFV中和抗体都是生物学标志。
(3)预后的估计:
有些生物学标志与疾病的严重程度相关,或与肿瘤的转移和复发相关,无疑利用这类标志可以对预后作出适度的估计。多项研究结果显示miRNAs有成为对人类癌症预测和判断预后标志物的潜能。不同的恶性肿瘤中,异常的miRNA表达可能具有潜在的预后价值。小细胞肺癌肿瘤样本的微阵列分析显示,miR-92a-2、miR-147和miR-574-5p与耐药明显相关。miR-92a-2肿瘤中的高表达与小细胞肺癌患者生存期缩短亦相关。这些miRNAs有可能用于筛查小细胞肺癌患者的再次耐药风险。在不同的恶性肿瘤中,异常的miRNA表达可能具有潜在的预后价值。对源自术前未接受任何治疗的Ⅰ~Ⅲ期鳞癌(squamous cell carcinoma, SCC)患者的配对癌组织和非癌组织的miRNA表达检测发现,miR-31高表达与生存期不佳相关。肿瘤抑癌基因 DICER1的活性。在食管SCC患者中也发现,血清miR-31高表达者无复发生存期和癌症相关生存期的预后较差。体外研究显示,miR-31可促进食管SCC集落形成、迁移和侵袭。三种肿瘤抑癌基因( EMP1、 KSR2和 RGS4)被证实为miR-31的靶标。
6.疾病筛检和高危人群确定
在健康人群中通过某些生物学标志的检查可得到某病的可疑病例,如采用宫颈涂片和S状结肠镜筛检探测早期瘤,检出宫颈癌或大肠癌的病例,筛检得到的无症状个体由于早期疾病对生理的影响比临床确诊的病例少,暴露生物学标志或易感性生物学标志被歪曲的可能性少,因为错分少,可用于评价早期生物效应和疾病状态的关系,暴露指标和遗传易感性的表型也易应用于这样的研究中,有预测价值的疾病中间标志物将有助于在筛检人群中发现病例,尤其是那些在暴露-疾病链中能代表早期暴露的标志物更有利于应用。
7.交互作用的评价
分子流行病学最大的功能之一就是评价外环境暴露和遗传易感性之间的交互作用,如酰化表型和芳香胺染料职业暴露的交互作用与膀胱癌、石棉或PAH的职业暴露与脒基四氢异喹胍代谢表型交互作用与肺癌等。研究表明在暴露史相似的情况下,具有一定表型的个体患病危险度高于那些无该表型的个体。
8.传染病流行过程及相关问题确定
(1)病原体快速、准确、简便的检测:
面对传染病或新发的传染病,需要尽早确定病原体,这就需要高灵敏度和特异度的生物学标志和检测方法。2008年,瑞典斯德哥尔摩Karolinska医学院的医生和研究者遇到1例疑难病例,3例接受了来自同一供者器官的移植手术患者,在手术后4~6周均持续发热并相继死亡,而且并无明显的免疫反应。采用常规细菌和病毒培养、多种病原体PCR检测试剂盒以及病毒和细菌病原体微阵列芯片都未发现可疑病原体。于是,研究者从2例患者组织中提取了RNA,采用454测序仪进行新一代测序,经一系列生物信息学过滤和分析后,最后发现14条组装片段同沙粒病毒(old world arenaviruses)序列同源(约80%同源性),后经多种生物实验手段验证后,验证了该病原体在3例患者体内广泛存在,该项工作也成为新一代测序技术鉴定“未知”病原体的开山之作。
(2)传染病流行规律、传播机制的研究:
传播途径的判断、传染源的追溯和传播机制的研究方面,生物学标志发挥巨大的作用。例如,乙型肝炎病毒(hepatitis B virus, HBV)可经胎盘传播至胎儿,造成HBV宫内感染。我国学者采用免疫组化染色和原位杂交等方法,通过对HBsAg阳性母亲的不同孕期胎盘的检测,并结合其胎儿和新生儿宫内感染情况研究表明,HBV经胎盘感染胎儿的路径可能是通过胎盘屏障中各层细胞至细胞的传递而实现的。通过体外细胞实验验证了HBV宫内感染的“细胞-细胞传播途径”的假说。在突发传染性疾病,如严重急性呼吸综合征(severe acute respiratory syndrome, SARS)病毒,中东呼吸综合征病毒,埃博拉病毒的研究中分子流行病学研究对于病毒的宿主来源、分子进化及传染源追溯方面发挥着巨大作用。
(3)传染病监测:
目前全球已经开展针对流行性感冒病毒株的检测、针对人感染H5N1高致病禽流感的监测。通过全球范围内的分子流行病学研究对传染病的预防和控制提供重要的信息资料。如HIV感染基因型的全球分布,HBV基因型、HCV基因型的全球分布特点的研究为HIV、HBV及HCV的预防控制及临床治疗提供重要的信息资料,对于局部地区传染病暴发传染源追溯也提供重要信息。
(4)病原体耐药和毒力变化规律研究:
对传染病作出有效的防控措施,就要对病原体的耐药和毒力变化规律进行研究,明确其耐药和毒力增强的原因,阐明耐药和毒力相关基因传播的机制。例如,由于新德里金属-β-内酰胺酶-1(New Delhi metallo-β-lactamaseⅠ,NDM-1)耐药基因的出现,产生的“超级耐药菌”引起关注。我国25个省市出现bla NDM-1阳性菌株,其中广东地区阳性率高达39.49%。研究耐药基因的检测靶点和水平转移机制,能够给防治多耐药、高毒力致病菌提供新的方法和理论依据。
9.慢性非传染性疾病的防制
(1)慢性病的发病机制和易感性研究:
为了更好防控慢性非传染性疾病,暴露的测量应更加科学、准确;应测定到更细微效应标志;易感性研究深入到单个核苷酸和氨基酸水平。另外,罕见或低频的SNP、基因组拷贝数变化、插入序列和甲基化等表观遗传学对复杂病因的慢性病提出新的致病理论,而以往的传统流行病研究往往忽略了这些方面的影响。因此对糖尿病和肿瘤等疾病研究,应在SNP和表观遗传学领域进行深入研究。
(2)三级预防和效果评价:
在慢性非传染性疾病研究中,分子流行病学可以研究疾病的危险因素从暴露到疾病发生的全过程,为慢性病的三级预防提供理论依据。另外在慢性病预防控制效果评价中,可以将早期生物效应标志作为结局进行测量,会大大缩短效果评价时间。
三、案例
案例一:欧洲在队列和环境流行病学合作研究方面开展了很好的工作。生命早期暴露组(human early-life exposome, HELIX)项目由13家合作机构共同承担,测量32 000对母婴的环境暴露,以及对儿童成长、发育、健康的后续影响。孕期和生命早期被认为是由于环境破坏而产生终身后果的高敏感期,所以生命早期是研究暴露组学的重要起点。开展对孕期和生命早期的环境暴露-效应及其机制的研究意义深远。
HELIX所用数据来源于6个生活在西班牙、法国、英国、挪威、希腊和立陶宛的欧洲母婴出生队列。调查人员已收集了大量的健康数据,另外还计划收集1 200对母婴的生物学标志数据作为子数据集。对于食品、水、空气污染、杀虫剂、噪声和辐射的外暴露测量将和来源于代谢组学、蛋白质组学、转录组学及其他组学研究的生物学标志进行整合。进而,研究者可以估算由于多种环境暴露而产生的儿童疾病负担的情况。生命早期暴露组学的特征是,探索可以重塑生物进程和影响身体发育及正常功能的关键胚胎发育时期,并适时给予干预措施。HELIX项目将执行4年半,所期待的结果是可以帮助研究者识别未知的健康隐患,有利于更好地建立预防措施和法规。
HELIX所用到的工具、方法包括:生物学标志、基于组学的方法、遥感和基于地理信息系统(geographic information system, GIS)的空间分析方法、个体暴露仪器、用于连接暴露和疾病负担的统计工具。其中一种新的工具是ExpoApp软件,这是一种用于追踪受试者活动水平的可移动应用程序。ExpoApp利用全球定位系统(global positioning system, GPS)和智能手机来追踪受试者的位置并监测其每隔10s的身体活动情况。受试者佩戴启用ExpoApp的智能手机一周,同时佩戴空气污染和辐射检测仪。这些数据用于计算吸入空气总量和个体对空气污染的暴露情况。HELIX的研究思路见图2-3。
暴露组学研究需要收集大量数据、需要多方协作、需要大量经费支持及尖端的技术平台等,新技术的不断出现大大提高了测量效能并可进行多终点的同步测量。HELIX是第一次在多个方面应用暴露组学开展的研究工作。该项目中用于研究母婴队列参与者的方法需要很多不同工具,而这些工具跨越多个学科,该项目将对其他环境健康和暴露科学领域的研究有一定的启发,有助于将来建立基于较少人口的平行研究,来验证暴露组学的其余部分。
图2-3 HELIX项目研究思路
案例二:日本在暴露组学方面提出了深入的研究计划。开始于2011年的日本环境和儿童研究(the Japan environment and children’s study, JECS)是一个出生队列研究,包括10万对父母和儿童,拟评估一系列环境因素对儿童健康和发育的影响。2008年开始在四个大学做预研究,并将已有的2个队列(Hokkaido和Tohoku)样本用来建立暴露测量规范。2011年正式发布了JECS计划,2014年3月该研究招募了数十万名妊娠妇女。对孕妇孕早期至孕晚期生活条件及环境内外暴露情况、出生结局、新生儿健康状况及内外暴露情况、哺乳期母婴内外暴露情况及6月龄之后的暴露情况进行全面追踪调查,直至儿童年满13岁为止,该研究计划于2032年完成。