跳转到内容

User:Angus Cheng/PheWAS

维基百科,自由的百科全书

在遺傳學與基因流行病學中,全表現型關聯研究(英語:Phenome-wide association study,簡稱PheWAS)是一種研究設計,旨在探討單一核苷酸多型性(SNP)或其他類型的DNA變異與大量不同表現型之間的關聯性。PheWAS 的目標在於檢驗已知的序列變異與各種類型的特徵(包括分子、生化、細胞,尤其是臨床診斷與預後)之間是否具因果聯繫。[1][2]

PheWAS 是對全基因組關聯研究(GWAS)方法的一種互補。GWAS 是從「表現型」出發,找出與之相關的基因變異;而 PheWAS 則是從「基因變異」出發,找出其與多種表現型之間的潛在關聯。[2] 這種方法除了能重新發現先前已知的基因-表現型關聯[1][3],亦能識別出新的關聯。[4]

PheWAS 方法的發展受惠於大量匿名化的人類臨床電子健康紀錄(EHR)與基因型資料的可得性,這些表現型是透過稱為「phecode」的國際疾病分類(ICD)代碼群組所定義。[5] 另外,在模式生物中建立的大規模基因體與表現型資料集,也證實了該方法的有效性。PheWAS 也可應用於既有的流行病學研究資料中。首篇概念驗證的研究於2010年發表,該研究基於單一研究單位的電子病歷資料[6],證實了多重表現型與相同基因變異之間可能存在潛在關聯。

研究方法

[编辑]

PheWAS 最初的推動來自於臨床實務上日益普及的電子病歷系統(EMR)。[6] 在 EMR 系統中,一項關鍵組件是 ICD9(第九版國際疾病分類),這是用於醫療帳單處理的標準工具。該系統涵蓋約 14,000 種疾病,並以分層編碼方式組織。PheWAS 便是以這些表現型資料為基礎,將基因變異與各種表現型建立關聯。[3]

典型的 PheWAS 研究會將樣本族群分成兩組:未出現特定 ICD9 編碼者視為「對照組」,而出現該編碼者視為「病例組」。[7] 接著以特定的基因變異(通常為 SNP)作為起點,進行分析並計算各基因型的分布、卡方檢定費雪確切檢定的 P 值,藉此判定基因型與特定表現型之間的相關性。[8] 為因應多重檢定問題,常會應用邦費羅尼校正(Bonferroni correction)。

概念驗證研究

[编辑]

首個 PheWAS 研究選取了 5 個 SNP(rs1333049、rs2200733、rs3135388、rs6457620 與 rs1333049),並在約 6,000 位歐裔美國人中進行分析。[6] 品質管控措施包括標記與樣本的基因型效率、等位基因頻率與哈溫平衡測試。

該研究修改了 ICD9 編碼以利遺傳分析,具體包含:

  1. 合併疾病來源相同或相似的三位數編碼(如結核病的三種亞型合併為一類010)。[6]
  2. 對同一 ICD9 編碼下具臨床差異的表現型加入第4碼(如I型與II型糖尿病皆為250,但增加額外一碼加以區分)。[6]
  3. 排除無法用於基因分析的項目(如異物污染、非特異性症狀)。[6]

該研究證實 rs3135388 與多發性硬化症(MS)之間有顯著關聯,也發現其他 22 種疾病具 P 值 < 0.05 的顯著結果。

應用領域

[编辑]

多效性研究

[编辑]

PheWAS 的一大優勢是可辨識具多效性(pleiotropy)之基因變異。[3] 當一項基因變異可影響兩種以上獨立表現型時,即屬多效性效應。研究方式包括從 Genomics and Epidemiology (PAGE) 計畫取得基因型與表現型摘要資料,再依據表現型的類型進行邏輯斯迴歸線性迴歸分析。[9]

PheWAS 的結果類型可分為:

  • 「已知結果」:與先前報導的基因-表現型關聯一致,可作為正向對照(如高胰島素血症、肥胖與第二型糖尿病之關聯)。[9]
  • 「新穎結果」:未曾報導的新關聯(如一 SNP 同時與糖尿病與關節炎相關),指出可能存在多效性,但需後續生物學研究加以驗證。[10]

藥物反應變異

[编辑]

PheWAS 也用於研究藥物反應的個體差異。舉例而言,一項研究發現炎症性腸道疾病(IBD)患者中硫代嘌呤甲基轉移酶(TPMT)活性高者,較可能出現糖尿病與缺鐵性貧血,亦顯示常規硫代嘌呤治療對其效果較差。[11] 此發現有助於發展精準醫療策略,根據 TPMT 水準選擇更合適的治療方式。

臨床應用潛力

[编辑]

以 PheWAS 分析HIV 病患的臨床資料時,有 47% 的已知關聯能被成功重現。[10] 此外,亦發現第7號染色體上多個 SNP 同時與低密度脂蛋白(LDL-C)與總膽固醇相關,顯示臨床應用潛力。

侷限性

[编辑]

儘管 PheWAS 有許多潛力,但仍有下列限制:

  • 統計限制:Bonferroni 校正過於保守,可能導致真陽性率降低。[3]
  • ICD 編碼限制:並非所有表現型都有對應 ICD 編碼,同一 ICD9 亦可能對應多種異質表現型。[3]
  • 協變量影響:年齡、性別等變項會影響表現型,單一迴歸模型無法完全控制。[3]
  • 所有新發現的多效性關聯皆須進一步的實驗或生物學驗證。[10]

參考文獻

[编辑]
  1. ^ 1.0 1.1 引用错误:没有为名为Denny_2016的参考文献提供内容
  2. ^ 2.0 2.1 引用错误:没有为名为Bush_2016的参考文献提供内容
  3. ^ 3.0 3.1 3.2 3.3 3.4 3.5 引用错误:没有为名为Hebbring_2014的参考文献提供内容
  4. ^ 引用错误:没有为名为Cronin_2014的参考文献提供内容
  5. ^ 引用错误:没有为名为Bastarache_2021的参考文献提供内容
  6. ^ 6.0 6.1 6.2 6.3 6.4 6.5 引用错误:没有为名为Denny_2010的参考文献提供内容
  7. ^ 引用错误:没有为名为Pendergrass_2015的参考文献提供内容
  8. ^ 引用错误:没有为名为Robinson_2018的参考文献提供内容
  9. ^ 9.0 9.1 引用错误:没有为名为Pendergrass_2011的参考文献提供内容
  10. ^ 10.0 10.1 10.2 引用错误:没有为名为Moore_2015的参考文献提供内容
  11. ^ 引用错误:没有为名为Neuraz_2013的参考文献提供内容

外部連結

[编辑]