User:Angus Cheng/PheWAS
在遺傳學與基因流行病學中,全表現型關聯研究(英語:Phenome-wide association study,簡稱PheWAS)是一種研究設計,旨在探討單一核苷酸多型性(SNP)或其他類型的DNA變異與大量不同表現型之間的關聯性。PheWAS 的目標在於檢驗已知的序列變異與各種類型的特徵(包括分子、生化、細胞,尤其是臨床診斷與預後)之間是否具因果聯繫。[1][2]
PheWAS 是對全基因組關聯研究(GWAS)方法的一種互補。GWAS 是從「表現型」出發,找出與之相關的基因變異;而 PheWAS 則是從「基因變異」出發,找出其與多種表現型之間的潛在關聯。[2] 這種方法除了能重新發現先前已知的基因-表現型關聯[1][3],亦能識別出新的關聯。[4]
PheWAS 方法的發展受惠於大量匿名化的人類臨床電子健康紀錄(EHR)與基因型資料的可得性,這些表現型是透過稱為「phecode」的國際疾病分類(ICD)代碼群組所定義。[5] 另外,在模式生物中建立的大規模基因體與表現型資料集,也證實了該方法的有效性。PheWAS 也可應用於既有的流行病學研究資料中。首篇概念驗證的研究於2010年發表,該研究基於單一研究單位的電子病歷資料[6],證實了多重表現型與相同基因變異之間可能存在潛在關聯。
研究方法
[编辑]PheWAS 最初的推動來自於臨床實務上日益普及的電子病歷系統(EMR)。[6] 在 EMR 系統中,一項關鍵組件是 ICD9(第九版國際疾病分類),這是用於醫療帳單處理的標準工具。該系統涵蓋約 14,000 種疾病,並以分層編碼方式組織。PheWAS 便是以這些表現型資料為基礎,將基因變異與各種表現型建立關聯。[3]
典型的 PheWAS 研究會將樣本族群分成兩組:未出現特定 ICD9 編碼者視為「對照組」,而出現該編碼者視為「病例組」。[7] 接著以特定的基因變異(通常為 SNP)作為起點,進行分析並計算各基因型的分布、卡方檢定與費雪確切檢定的 P 值,藉此判定基因型與特定表現型之間的相關性。[8] 為因應多重檢定問題,常會應用邦費羅尼校正(Bonferroni correction)。
概念驗證研究
[编辑]首個 PheWAS 研究選取了 5 個 SNP(rs1333049、rs2200733、rs3135388、rs6457620 與 rs1333049),並在約 6,000 位歐裔美國人中進行分析。[6] 品質管控措施包括標記與樣本的基因型效率、等位基因頻率與哈溫平衡測試。
該研究修改了 ICD9 編碼以利遺傳分析,具體包含:
- 合併疾病來源相同或相似的三位數編碼(如結核病的三種亞型合併為一類010)。[6]
- 對同一 ICD9 編碼下具臨床差異的表現型加入第4碼(如I型與II型糖尿病皆為250,但增加額外一碼加以區分)。[6]
- 排除無法用於基因分析的項目(如異物污染、非特異性症狀)。[6]
該研究證實 rs3135388 與多發性硬化症(MS)之間有顯著關聯,也發現其他 22 種疾病具 P 值 < 0.05 的顯著結果。
應用領域
[编辑]多效性研究
[编辑]PheWAS 的一大優勢是可辨識具多效性(pleiotropy)之基因變異。[3] 當一項基因變異可影響兩種以上獨立表現型時,即屬多效性效應。研究方式包括從 Genomics and Epidemiology (PAGE) 計畫取得基因型與表現型摘要資料,再依據表現型的類型進行邏輯斯迴歸或線性迴歸分析。[9]
PheWAS 的結果類型可分為:
- 「已知結果」:與先前報導的基因-表現型關聯一致,可作為正向對照(如高胰島素血症、肥胖與第二型糖尿病之關聯)。[9]
- 「新穎結果」:未曾報導的新關聯(如一 SNP 同時與糖尿病與關節炎相關),指出可能存在多效性,但需後續生物學研究加以驗證。[10]
藥物反應變異
[编辑]PheWAS 也用於研究藥物反應的個體差異。舉例而言,一項研究發現炎症性腸道疾病(IBD)患者中硫代嘌呤甲基轉移酶(TPMT)活性高者,較可能出現糖尿病與缺鐵性貧血,亦顯示常規硫代嘌呤治療對其效果較差。[11] 此發現有助於發展精準醫療策略,根據 TPMT 水準選擇更合適的治療方式。
臨床應用潛力
[编辑]以 PheWAS 分析HIV 病患的臨床資料時,有 47% 的已知關聯能被成功重現。[10] 此外,亦發現第7號染色體上多個 SNP 同時與低密度脂蛋白(LDL-C)與總膽固醇相關,顯示臨床應用潛力。
侷限性
[编辑]儘管 PheWAS 有許多潛力,但仍有下列限制:
- 統計限制:Bonferroni 校正過於保守,可能導致真陽性率降低。[3]
- ICD 編碼限制:並非所有表現型都有對應 ICD 編碼,同一 ICD9 亦可能對應多種異質表現型。[3]
- 協變量影響:年齡、性別等變項會影響表現型,單一迴歸模型無法完全控制。[3]
- 所有新發現的多效性關聯皆須進一步的實驗或生物學驗證。[10]
參考文獻
[编辑]- ^ 1.0 1.1 引用错误:没有为名为
Denny_2016的参考文献提供内容 - ^ 2.0 2.1 引用错误:没有为名为
Bush_2016的参考文献提供内容 - ^ 3.0 3.1 3.2 3.3 3.4 3.5 引用错误:没有为名为
Hebbring_2014的参考文献提供内容 - ^ 引用错误:没有为名为
Cronin_2014的参考文献提供内容 - ^ 引用错误:没有为名为
Bastarache_2021的参考文献提供内容 - ^ 6.0 6.1 6.2 6.3 6.4 6.5 引用错误:没有为名为
Denny_2010的参考文献提供内容 - ^ 引用错误:没有为名为
Pendergrass_2015的参考文献提供内容 - ^ 引用错误:没有为名为
Robinson_2018的参考文献提供内容 - ^ 9.0 9.1 引用错误:没有为名为
Pendergrass_2011的参考文献提供内容 - ^ 10.0 10.1 10.2 引用错误:没有为名为
Moore_2015的参考文献提供内容 - ^ 引用错误:没有为名为
Neuraz_2013的参考文献提供内容