上海理工大学学报  2020, Vol. 42 Issue (4): 411-416   PDF    
基于美国高加索人群瘦体重的全基因组关联研究
冉姝, 刘宇, 张宇雪, 刘宝林     
上海理工大学 医疗器械与食品学院,上海 200093
摘要: 为了寻找与瘦体重相关的单核苷酸多态性(SNP)位点及易感基因,在2 283名不相关的美国高加索人群中对瘦体重指数(LMI)进行全基因组关联分析(GWAS),并在1 000名不相关的美国高加索人群中验证,将研究结果与验证结果进行荟萃分析。研究发现,位于19p13.3区域的UQCR,MBD3和TCF3基因与LMI相关联。UQCR基因上rs8697(合并p=4.94×10−3)和rs56122285(合并p=2.59×10−3)具有eQTL效应,MBD3基因上rs8110543(合并p=6.88×10−3)和rs7252741(合并p=1.22×10−2)具有eQTL效应,DB得分分别为1b和1f。本研究进一步证实了UQCR,MBD3和TCF3基因在瘦体重变异中的作用,对肌少症的认识提供新的理论依据。
关键词: 瘦体重     肌少症     表达数量性状基因座     全基因组关联分析    
Genome-wide association study of lean body mass in American Caucasian population
RAN Shu, LIU Yu, ZHANG Yuxue, LIU Baolin     
School of Medical Instrument and Food Engineering, University of Shanghai for Science and Technology, Shanghai 200093, China)
Abstract: Lean body mass (LBM), a good index for skeletal muscle quantity and quality, is regarded as the important predictor of sarcopenia. To find the single nucleotide polymorphisms (SNP) loci and susceptibile genes associated with LBM, a genome-wide association study (GWAS) on the lean mass index (LMI) of 2 283 unrelated American Caucasian samples was performed and replicated on that of 1 000 unrelated American Caucasian samples. Then, a meta-analysis of the GWAS results and replication results was carried out. The genes UQCR, MBD3 and TCF3, located in the 19p13.3 region, are found to be associated with LMI. rs8697 (p=4.94×10−3) and rs56122285 (p=2.59×10−3) on UQCR gene are of eQTL (expression quantitative trait loci) effects, and rs8110543 (p=6.88×10−3) and rs7252741 (p=1.22×10−2) on MBD3 gene are also of eQTL effects, their DB scores are 1b and 1f respectively. The study further confirms the role of UQCR, MBD3 and TCF3 genes in lean body mass variability, and provides a new theoretical basis for the understanding of sarcopenia.
Key words: lean body mass     sarcopenia     expression quantitative trait loci     genome-wide association study    

肌少症(sarcopenia)是与增龄相关的、进行性的全身肌量减少和(或)肌强度下降或肌肉生理功能减退的综合症[1-2]。肌少症和骨质疏松症相伴出现,致使老年人易于跌倒和骨折,继而成为老年人群致残、致死的主要原因之一[3-4]。中国城市地区高龄男性肌少症的患病率为12.3%,女性为4.8%,农村高龄男性肌少症患病率为6.4%,女性为 11.5%[5]。最近一项研究估计全球肌少症的患病率为10%[6]。预计到2050年,髋部一个部位的跌倒骨折人数就将达到600万,造成254亿美元的直接治疗费用以及更高的术后护理费用[7]。肌少症将是未来面临的主要健康问题之一。

肌少症的核心是骨骼肌数量和质量的丢失,在研究其发病因素及防治方法时应主要考虑这两个方面。使用双能X线骨密度仪(DXA)测量的瘦体重(LBM)是肌少症的重要性状[8]。LBM受遗传控制,遗传度在50%~80%之间[9]。与肌少症高度相关的其他性状的研究中发现,握力的遗传度为32%~77%[10-11],肌肉横截面积的遗传度为70%~90%[12]。因此,LBM显著的遗传度为肌少症遗传学研究提供了良好的理论基础。瘦体重指数(LMI)为瘦体重与身高的平方之比[13]

全基因组关联研究(genome-wide association study,GWAS)是一种通过扫描整个基因组,鉴定出与复杂疾病或复杂性状相关的遗传因素的研究方法。目前GWAS研究已经发现许多SNPs(单核苷酸多态性)与瘦体重相关。2009年,Liu等[14]对1 000名白人全身瘦体重进行全基因组关联分析,发现位于TRHR基因的SNPs(rs16892496和rs7832552)与LBM显著关联。Guo等[15]以1 627名中国人作为实验样本、2 286名欧洲白人作为验证样本进行双变量全基因组关联研究,发现与葡萄糖代谢和能量代谢相关的GLYAT基因与四肢瘦体重(appendicular lean mass, ALM)关联。Urano等[16]对1 081名日本绝经后妇女进行关联研究,发现PRDM16基因在调节LBM中有重要作用。2017年,Zillikens等[17]对38 292名欧洲人全身LBM和28 330名欧洲人ALM进行大规模关联分析,并分别在63 475和45 090名不相关的欧洲人群中进行验证,研究发现VCAN,ADAMTSL3,IRS1和FTO基因与全身LBM和ALM相关联。2019年,Pei等[18]对来自弗雷明汉心脏研究队列内6 587名受试者的腿部瘦体重进行了关联分析,发现位于6p21.1处的两个功能变体(rs524533和rs571770)与LBM有关,并通过Cis-eQTL分析发现这些SNPs与NFKBIE基因表达相关联。

为了鉴定与肌少症相关联的基因,本研究对2 283名不相关的美国高加索人样本进行基于基因水平的关联分析,并在1 000名不相关的美国高加索人样本中验证。

1 材料与方法 1.1 样本

研究参与者是从美国奥马哈市(Omaha)和堪萨斯城(Kansas)及其周边地区招募的健康个体,研究得到了克瑞顿大学和密苏里大学堪萨斯分校伦理委员会的批准。所有研究者在进入研究之前都提供了书面知情同意书,并且完成了包括生活方式、病史、家庭信息等相关问卷调查。研究采用肌少症遗传研究中广泛应用的排除标准对样本进行筛选,避免出现假阳性结果。

研究样本由2 283名不相关的美国高加索受试者组成,包括556名男性和1 727名女性。验证样本由1 000名不相关的美国高加索人组成,包括501名男性和499名女性。研究样本和验证群组之间没有重叠。

使用Hologic公司的DXA4500(Hologic Inc., Bedford, MA, USA)骨密度仪对研究者进行瘦体重和脂肪量的测量。

1.2 基因分型和质量控制

a. 研究样本。抽取每位受试者10 mL的外周静脉血。本研究采用标准的DNA提取试剂盒进行DNA提取,提取后采用Beckman公司的DU530核酸/蛋白分析仪(Beckmanlnc., Fullerton,CA.UK)进行浓度和纯度的测量。采用Genome-Wide Human SNP Array 6.0芯片(Affymetrix, Santa Clara, CA, USA)对研究样本进行基因分型,并在个体和SNP水平上执行严格的质量控制步骤。在个体水平,使用PLINK软件根据X染色体上的基因型数据推断出个体的性别,并与问卷中记录的性别作比较,将不明确的以及与报告性别不一致的个体删除。在SNP水平,所挑选的SNP符合以下条件:最低基因分型率为95%;哈迪温伯格平衡值大于0.001;等位基因频率大于0.01。最后有746 709个SNPs保留在研究样本中。

b. 验证样本。基因分型采用Affymetrix 250K Nsp和Affymetrix 250K Sty,过程按标准步骤进行,共有379,319个SNPs用于关联分析。

1.3 统计学处理

研究以瘦体重指数(LMI)作为表型,采用SPSS 19.0软件对性别、年龄、年龄的平方和脂肪量进行协变量校正。为了避免因群体分层现象而导致出现假阳性或假阴性结果, 采用主成分分析法(principal component analysis, PCA)校正2 283名美国高加索人样本中潜在的种群分层。在样本中挑选一组无关样本并计算它们的主成分,作为它们的遗传背景信息。再选用前5个主成分, 利用这5个主成分值对表型进行校正。使用PLINK软件(http://zzz.bwh.harvard.edu/plink/summary.shtml)的加性遗传模式对校正后的表型进行关联分析。荟萃分析采用Fisher方法[19],对研究样本和验证样本的结果进行合并,得到合并p值。

1.4 功能预测

采用GTEx数据库(http://gtexportal.org)和Regulome DB数据库(http://regulomedb.org/)进行功能预测。GTEx数据库目前收集了来自544个人体的基因型和基因表达数据,提供了跨器官的表达数量性状基因座(eQTL)研究平台。Regulome DB数据库集合GEO,ENCODE等项目的数据集,通过评分对SNPs是否处于启动子区域、增强子区域、转录因子结合位点以及DNase敏感区域进行注释。

2 结 果

受试者的基本信息如表1所示。UQCR基因上的SNPs rs8697(研究样本p=2.50×10−2,验证样本p=2.33×10−2,合并p=4.94×10−3)以及rs56122285(研究样本p=9.92×10−3,验证样本p=2.85×10−2,合并p=2.59×10−3)与LMI关联。MBD3基因上的11个SNPs以及TCF3基因上的3个SNPs与LMI有关联,具体信息列于表2中。



表 1 研究样本和验证样本的基本信息 Table 1 Information of the discovery sample and replication sample

表 2 19p13.3显著SNP和相关基因的eQTL分析结果 Table 2 19p13.3 eQTL analysis results about significant-association SNP and genes

通过Regulome DB查询rs8110543和rs7252741的DB得分分别为1b和1f。得分为1b的变体对功能具有很高的置信度,rs8110543不仅位于DNase敏感区域,还是转录因子与eQTL的结合位点。DNase敏感区域的DNA特别活跃而且具有顺式调节的作用,在一定程度上可以说DNase敏感区域表示转录调节的控制区域。

采用GTEx对SNPs进行eQTL分析,发现16个SNPs的eQTL靶基因都是UQCR,并起到顺式调节的作用(表2)。GTEx查询得到UQCR基因在骨骼肌表达图(图1)和 rs8697,rs56122285的eQTL图(图2图3),N为样本容量。TPM为每百万映射读取的转录本。


图 1 UQCR11(UQCR)eQTL基因骨骼肌表达图 Fig. 1 Structure of the eQTL gene skeletal muscle expression of UQCR11(UQCR)

图 2 rs8697的eQTL基因表达图 Fig. 2 Strueture of the eQTL gene expression of rs8697

图 3 rs56122285的eQTL基因表达图 Fig. 3 Strueture of the eQTL gene expression of rs56122285

使用STRING蛋白互作网络对TCF3,MBD3相关肌肉代谢蛋白进行分析(如图4所示)。MBD3蛋白是抑制性核小体重塑和去乙酰化酶(NuRD)复合物的核心成分,具有保守的甲基CpG结合域[20-21]。TCF3蛋白靶基因的表达限于特定的细胞谱系,通过含有TCF3和组织限制性螺旋−环−螺旋(bHLH)因子的异二聚体来激活细胞特异性基因表达并促进细胞分化[22]。这种谱系选择机制在骨骼肌的分化中得到了清楚的阐释[23-24]


图 4 TCF3及MBD3与肌肉代谢蛋白的STRING蛋白质互作网络 Fig. 4 STRING protein interaction network between TCF3 and MBD3 and muscle metabolic proteins
3 讨 论

UQCR(ubiquinolcytochrome c reductase)泛醌细胞色素c还原酶、产物线粒体复合物III是电子传递链上的核心元素,在辅酶Q氧化和细胞色素c还原的过程中起到介导的作用[25]。复合物III在高等哺乳动物中由11个亚基组成,其中,有3个是催化亚基,分别是细胞色素b、细胞色素c1和Rieske铁硫蛋白[26]。在三磷酸腺苷(ATP)的生化合成过程中可以催化电子使其转移到细胞色素b,还能利用能量在线粒体膜上转移质子。在儿童和成年人的神经肌肉和非神经肌肉疾病患者中发现线粒体复合物III缺乏[27]

MBD3(methyl-CpG binding domain protein 3)甲基CpG结合域蛋白3是组成NuRD复合物的一个亚基。此外,NuRD还是由HDAC1(组蛋白脱乙酰酶1)、HDAC2、MTA2和RBBP7等组成的多亚基复合物[28],其在DNA的损伤修复过程以及DNA转录调节中发挥重要功能。HDAC1可以使生肌决定因子(MYOD)去乙酰化并阻止MYOD在分化条件下启动肌源性程序[29]。在肌细胞分化时,HDAC1水平的降低与MYOD乙酰化水平的增加有关,后者会刺激转录[30]

TCF3(transcription factor 3)转录因子3可以编码螺旋−环−螺旋(helix-loop-helix)结构的转录因子E12(免疫球蛋白转录因子−1)和E47(转录因子−3)[31]。E12和E47两种因子可以与生肌决定因子(MYOD)和 肌细胞生成素(MYOG)相互作用,参与肌细胞特异性bHLH蛋白的二聚化[24]。bHLH转录因子家族包括MYOD,MYOG,生肌因子5(MYF5),生肌因子6(MYF6)和生肌调节因子4(MRF4),它们可以调节肌源性细胞分化,然后再融合成肌纤维[32]

采用全基因组关联分析方法,在2 283名不相关的美国高加索人中发现位于基因UQCR,MBD3和TCF3的16个SNPs与LMI有关。这16个SNPs都具有eQTL效应,可能会影响或者导致肌少症。

参考文献
[1]
ROSENBERG I H. Sarcopenia: origins and clinical relevance[J]. Clinics in Geriatric Medicine, 2011, 27(3): 337-339. DOI:10.1016/j.cger.2011.03.003
[2]
JANSSEN I, HEYMSFIELD S B, ROSS R. Low relative skeletal muscle mass (sarcopenia) in older persons is associated with functional impairment and physical disability[J]. Journal of the American Geriatrics Society, 2002, 50(5): 889-896. DOI:10.1046/j.1532-5415.2002.50216.x
[3]
KARAKELIDES H, NAIR K S. Sarcopenia of aging and its metabolic impact[J]. Current Topics in Developmental Biology, 2005, 68: 123-148. DOI:10.1016/S0070-2153(05)68005-2
[4]
HSU F C, LENCHIK L, NICKLAS B J, et al. Heritability of body composition measured by DXA in the diabetes heart study[J]. Obesity Research, 2005, 13(2): 312-319. DOI:10.1038/oby.2005.42
[5]
HAN P P, KANG L, GUO Q, et al. Prevalence and factors associated with sarcopenia in suburb-dwelling older Chinese using the asian working group for sarcopenia definition[J]. The Journals of Gerontology: Series A, 2016, 71(4): 529-535. DOI:10.1093/gerona/glv108
[6]
SHAFIEE G, KESHTKAR A, SOLTANI A, et al. Prevalence of sarcopenia in the world: a systematic review and meta- analysis of general population studies[J]. Journal of Diabetes & Metabolic Disorders, 2017, 16(1): 21.
[7]
SI L, WINZENBERG T M, JIANG Q, et al. Projection of osteoporosis-related fractures and costs in China: 2010—2050[J]. Osteoporosis International, 2015, 26(7): 1929-1937. DOI:10.1007/s00198-015-3093-2
[8]
HANSEN R D, RAJA C, ASLANI A, et al. Determination of skeletal muscle and fat-free mass by nuclear and dual-energy x-ray absorptiometry methods in men and women aged 51—84 y[J]. The American Journal of Clinical Nutrition, 1999, 70(2): 228-233. DOI:10.1093/ajcn.70.2.228
[9]
DENG H W, LAI D B, CONWAY T, et al. Characterization of genetic and lifestyle factors for determining variation in body mass index, fat mass, percentage of fat mass, and lean mass[J]. Journal of Clinical Densitometry, 2001, 4(4): 353-361. DOI:10.1385/JCD:4:4:353
[10]
SILVENTOINEN K, MAGNUSSON P K E, TYNELIUS P, et al. Heritability of body size and muscle strength in young adulthood: a study of one million Swedish men[J]. Genetic Epidemiology, 2008, 32(4): 341-349. DOI:10.1002/gepi.20308
[11]
SCHUTTE N M, NEDEREND I, HUDZIAK J J, et al. Differences in adolescent physical fitness: a multivariate approach and meta-analysis[J]. Behavior Genetics, 2016, 46(2): 217-227. DOI:10.1007/s10519-015-9754-2
[12]
HUYGENS W, THOMIS M A, PEETERS M W, et al. Determinants and upper-limit heritabilities of skeletal muscle mass and strength[J]. Canadian Journal of Applied Physiology, 2004, 29(2): 186-200. DOI:10.1139/h04-014
[13]
WANG J, RENNIE K L, GU W J, et al. Independent associations of body-size adjusted fat mass and fat-free mass with the metabolic syndrome in Chinese[J]. Annals of Human Biology, 2009, 36(1): 110-121. DOI:10.1080/03014460802585079
[14]
LIU X G, TAN L J, LEI S F, et al. Genome-wide association and replication studies identified TRHR as an important gene for lean body mass[J]. The American Journal of Human Genetics, 2009, 84(3): 418-423. DOI:10.1016/j.ajhg.2009.02.004
[15]
GUO Y F, ZHANG L S, LIU Y J, et al. Suggestion of GLYAT gene underlying variation of bone size and body lean mass as revealed by a bivariate genome-wide association study[J]. Human Genetics, 2013, 132(2): 189-199. DOI:10.1007/s00439-012-1236-5
[16]
URANO T, SHIRAKI M, SASAKI N, et al. Large-scale analysis reveals a functional single-nucleotide polymorphism in the 5'-flanking region of PRDM16 gene associated with lean body mass[J]. Aging Cell, 2014, 13(4): 739-743. DOI:10.1111/acel.12228
[17]
ZILLIKENS M C, DEMISSIE S, HSU Y H, et al. Large meta-analysis of genome-wide association studies identifies five loci for lean body mass[J]. Nature Communications, 2017, 8(1): 80. DOI:10.1038/s41467-017-00031-7
[18]
PEI Y F, HU W Z, YANG X L, et al. Two functional variants at 6p21.1 were associated with lean mass[J]. Skeletal Muscle, 2019, 9(1): 1-10. DOI:10.1186/s13395-019-0212-3
[19]
FISHER K A, MILES R. Modeling the acoustic radiation force in microfluidic chambers[J]. The Journal of the Acoustical Society of America, 2008, 123(4): 1862-1865. DOI:10.1121/1.2839140
[20]
WADE P A, GEGONNE A, JONES P L, et al. Mi-2 complex couples DNA methylation to chromatin remodelling and histone deacetylation[J]. Nature Genetics, 1999, 23(1): 62-66. DOI:10.1038/12664
[21]
ZHANG Y, NG H H, ERDJUMENT-BROMAGE H, et al. Analysis of the NuRD subunits reveals a histone deacetylase core complex and a connection with DNA methylation[J]. Genes & Development, 1999, 13(15): 1924-1935.
[22]
MASSARI M E, MURRE C. Helix-loop-helix proteins: regulators of transcription in eucaryotic organisms[J]. Molecular and Cellular Biology, 2000, 20(2): 429-440. DOI:10.1128/MCB.20.2.429-440.2000
[23]
WEINTRAUB H. The MyoD family and myogenesis: redundancy, networks, and thresholds[J]. Cell, 1993, 75(7): 1241-1244. DOI:10.1016/0092-8674(93)90610-3
[24]
ARNOLD H H, WINTER B. Muscle differentiation: more complexity to the network of myogenic regulators[J]. Current Opinion in Genetics & Development, 1998, 8(5): 539-544.
[25]
CUI T Z, CONTE A, FOX J L, et al. Modulation of the respiratory supercomplexes in yeast: enhanced formation of cytochrome oxidase increases the stability and abundance of respiratory supercomplexes[J]. Journal of Biological Chemistry, 2014, 289(9): 6133-6141. DOI:10.1074/jbc.M113.523688
[26]
AKARSU S, TORUN D, ERDEM M, et al. Mitochondrial complex I and Ⅲ mRNA levels in bipolar disorder[J]. Journal of Affective Disorders, 2015, 184: 160-163. DOI:10.1016/j.jad.2015.05.060
[27]
VISAPÄÄ I, FELLMAN V, VESA J, et al. GRACILE syndrome, a lethal metabolic disorder with iron overload, is caused by a point mutation in BCS1L[J]. The American Journal of Human Genetics, 2002, 71(4): 863-876. DOI:10.1086/342773
[28]
KAJI K, NICHOLS J, HENDRICH B. Mbd3, a component of the NuRD co-repressor complex, is required for development of pluripotent cells[J]. Development, 2007, 134(6): 1123-1132. DOI:10.1242/dev.02802
[29]
MAL A, STURNIOLO M, SCHILTZ R L, et al. A role for histone deacetylase HDAC1 in modulating the transcriptional activity of MyoD: inhibition of the myogenic program[J]. The EMBO Journal, 2001, 20(7): 1739-1753. DOI:10.1093/emboj/20.7.1739
[30]
JO C, JANG B G, JO S A. MEK1 plays contrary stage-specific roles in skeletal myogenic differentiation[J]. Cellular Signalling, 2009, 21(12): 1910-1917. DOI:10.1016/j.cellsig.2009.08.008
[31]
SLATTERY C, RYAN M P, MCMORROW T. E2A proteins: regulators of cell phenotype in normal physiology and disease[J]. The International Journal of Biochemistry & Cell Biology, 2008, 40(8): 1431-1436.
[32]
KRAUSS R S, COLE F, GAIO U, et al. Close encounters: regulation of vertebrate skeletal myogenesis by cell-cell contact[J]. Journal of Cell Science, 2005, 118(11): 2355-2362. DOI:10.1242/jcs.02397