User:Angus Cheng/PheWAS

在遺傳學與基因流行病學中，全表現型關聯研究（英語：Phenome-wide association study，簡稱PheWAS）是一種研究設計，旨在探討單一核苷酸多型性（SNP）或其他類型的DNA變異與大量不同表現型之間的關聯性。PheWAS 的目標在於檢驗已知的序列變異與各種類型的特徵（包括分子、生化、細胞，尤其是臨床診斷與預後）之間是否具因果聯繫。^[1]^[2]

PheWAS 是對全基因組關聯研究（GWAS）方法的一種互補。GWAS 是從「表現型」出發，找出與之相關的基因變異；而 PheWAS 則是從「基因變異」出發，找出其與多種表現型之間的潛在關聯。^[2] 這種方法除了能重新發現先前已知的基因-表現型關聯^[1]^[3]，亦能識別出新的關聯。^[4]

PheWAS 方法的發展受惠於大量匿名化的人類臨床電子健康紀錄（EHR）與基因型資料的可得性，這些表現型是透過稱為「phecode」的國際疾病分類（ICD）代碼群組所定義。^[5] 另外，在模式生物中建立的大規模基因體與表現型資料集，也證實了該方法的有效性。PheWAS 也可應用於既有的流行病學研究資料中。首篇概念驗證的研究於2010年發表，該研究基於單一研究單位的電子病歷資料^[6]，證實了多重表現型與相同基因變異之間可能存在潛在關聯。

研究方法

PheWAS 最初的推動來自於臨床實務上日益普及的電子病歷系統（EMR）。^[6] 在 EMR 系統中，一項關鍵組件是 ICD9（第九版國際疾病分類），這是用於醫療帳單處理的標準工具。該系統涵蓋約 14,000 種疾病，並以分層編碼方式組織。PheWAS 便是以這些表現型資料為基礎，將基因變異與各種表現型建立關聯。^[3]

典型的 PheWAS 研究會將樣本族群分成兩組：未出現特定 ICD9 編碼者視為「對照組」，而出現該編碼者視為「病例組」。^[7] 接著以特定的基因變異（通常為 SNP）作為起點，進行分析並計算各基因型的分布、卡方檢定與費雪確切檢定的 P 值，藉此判定基因型與特定表現型之間的相關性。^[8] 為因應多重檢定問題，常會應用邦費羅尼校正（Bonferroni correction）。

概念驗證研究

首個 PheWAS 研究選取了 5 個 SNP（rs1333049、rs2200733、rs3135388、rs6457620 與 rs1333049），並在約 6,000 位歐裔美國人中進行分析。^[6] 品質管控措施包括標記與樣本的基因型效率、等位基因頻率與哈溫平衡測試。

該研究修改了 ICD9 編碼以利遺傳分析，具體包含：

合併疾病來源相同或相似的三位數編碼（如結核病的三種亞型合併為一類010）。^[6]
對同一 ICD9 編碼下具臨床差異的表現型加入第4碼（如I型與II型糖尿病皆為250，但增加額外一碼加以區分）。^[6]
排除無法用於基因分析的項目（如異物污染、非特異性症狀）。^[6]

該研究證實 rs3135388 與多發性硬化症（MS）之間有顯著關聯，也發現其他 22 種疾病具 P 值 < 0.05 的顯著結果。

應用領域

多效性研究

PheWAS 的一大優勢是可辨識具多效性（pleiotropy）之基因變異。^[3] 當一項基因變異可影響兩種以上獨立表現型時，即屬多效性效應。研究方式包括從 Genomics and Epidemiology (PAGE) 計畫取得基因型與表現型摘要資料，再依據表現型的類型進行邏輯斯迴歸或線性迴歸分析。^[9]

PheWAS 的結果類型可分為：

「已知結果」：與先前報導的基因-表現型關聯一致，可作為正向對照（如高胰島素血症、肥胖與第二型糖尿病之關聯）。^[9]
「新穎結果」：未曾報導的新關聯（如一 SNP 同時與糖尿病與關節炎相關），指出可能存在多效性，但需後續生物學研究加以驗證。^[10]

藥物反應變異

PheWAS 也用於研究藥物反應的個體差異。舉例而言，一項研究發現炎症性腸道疾病（IBD）患者中硫代嘌呤甲基轉移酶（TPMT）活性高者，較可能出現糖尿病與缺鐵性貧血，亦顯示常規硫代嘌呤治療對其效果較差。^[11] 此發現有助於發展精準醫療策略，根據 TPMT 水準選擇更合適的治療方式。

臨床應用潛力

以 PheWAS 分析HIV 病患的臨床資料時，有 47% 的已知關聯能被成功重現。^[10] 此外，亦發現第7號染色體上多個 SNP 同時與低密度脂蛋白（LDL-C）與總膽固醇相關，顯示臨床應用潛力。

侷限性

儘管 PheWAS 有許多潛力，但仍有下列限制：

統計限制：Bonferroni 校正過於保守，可能導致真陽性率降低。^[3]
ICD 編碼限制：並非所有表現型都有對應 ICD 編碼，同一 ICD9 亦可能對應多種異質表現型。^[3]
協變量影響：年齡、性別等變項會影響表現型，單一迴歸模型無法完全控制。^[3]
所有新發現的多效性關聯皆須進一步的實驗或生物學驗證。^[10]

參考文獻

^ ^1.0 ^1.1 引用错误：没有为名为Denny_2016的参考文献提供内容
^ ^2.0 ^2.1 引用错误：没有为名为Bush_2016的参考文献提供内容
^ ^3.0 ^3.1 ^3.2 ^3.3 ^3.4 ^3.5 引用错误：没有为名为Hebbring_2014的参考文献提供内容
^ 引用错误：没有为名为Cronin_2014的参考文献提供内容
^ 引用错误：没有为名为Bastarache_2021的参考文献提供内容
^ ^6.0 ^6.1 ^6.2 ^6.3 ^6.4 ^6.5 引用错误：没有为名为Denny_2010的参考文献提供内容
^ 引用错误：没有为名为Pendergrass_2015的参考文献提供内容
^ 引用错误：没有为名为Robinson_2018的参考文献提供内容
^ ^9.0 ^9.1 引用错误：没有为名为Pendergrass_2011的参考文献提供内容
^ ^10.0 ^10.1 ^10.2 引用错误：没有为名为Moore_2015的参考文献提供内容
^ 引用错误：没有为名为Neuraz_2013的参考文献提供内容

外部連結

PheWAS 研究資料庫

[Denny_2016-1] 1.0 ^1.1 引用错误：没有为名为Denny_2016的参考文献提供内容

[Bush_2016-2] 2.0 ^2.1 引用错误：没有为名为Bush_2016的参考文献提供内容

[Hebbring_2014-3] 3.0 ^3.1 ^3.2 ^3.3 ^3.4 ^3.5 引用错误：没有为名为Hebbring_2014的参考文献提供内容

[Cronin_2014-4] 引用错误：没有为名为Cronin_2014的参考文献提供内容

[Bastarache_2021-5] 引用错误：没有为名为Bastarache_2021的参考文献提供内容

[Denny_2010-6] 6.0 ^6.1 ^6.2 ^6.3 ^6.4 ^6.5 引用错误：没有为名为Denny_2010的参考文献提供内容

[Pendergrass_2015-7] 引用错误：没有为名为Pendergrass_2015的参考文献提供内容

[Robinson_2018-8] 引用错误：没有为名为Robinson_2018的参考文献提供内容

[Pendergrass_2011-9] 9.0 ^9.1 引用错误：没有为名为Pendergrass_2011的参考文献提供内容

[Moore_2015-10] 10.0 ^10.1 ^10.2 引用错误：没有为名为Moore_2015的参考文献提供内容

[Neuraz_2013-11] 引用错误：没有为名为Neuraz_2013的参考文献提供内容

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]