跳转到内容

BacDive

维基百科,自由的百科全书
BacDive
内容
说明(描述)细菌多样性数据库
相关信息
研究中心莱布尼茨研究所DSMZ—德国微生物与细胞培养物保藏中心有限公司英语Leibniz Institute DSMZ
主要参考文献(引用)PMID 39470737
发布日期2012年
访问
网站http://bacdive.dsmz.de/
网络服务网址https://api.bacdive.dsmz.de/
网络协议与资源描述框架查询语言端点https://sparql.dsmz.de/bacdive/

细菌多样性数据库(英語:Bacterial Diversity Database),其混成词简称为BacDive,是全球最大的标准化细菌古菌菌株级信息数据库

BacDive是一个综合资源,包含有关细菌和古菌菌株的多种数据,包括生物分类学形态学生理学、采样和环境数据以及序列信息。[1][2]该数据库建立在来自培养物保藏中心的精选数据基础上。2025年,BacDive包含99,392个菌株的信息,其中包括21,168个模式菌株。该数据库由莱布尼茨研究所DSMZ—德国微生物与细胞培养物保藏中心有限公司托管,是综合DSMZ数字多样性基础设施的一部分。BacDivede.NBI英语German Network for Bioinformatics Infrastructure(德国生物信息学基础设施网络)和ELIXIR英语ELIXIR(欧洲生命科学生物信息基础设施)的成员。全球生物数据联盟英语Global Biodata Coalition于2022年将BacDive指定为全球核心生物数据资源(Global Core Biodata Resource,GCBR)。[3] 2023年,BacDive被另外命名为ELIXIR核心数据资源。[4]

数据库内容

[编辑]

BacDive最初于2012年4月发布,旨在标准化并公开菌种保藏中心、其他文库和出版物的菌株数据。首次发布版本包含18,157个菌株的89,758个条目和179个不同用途的数据字段。[5]

如今(截至2024年12月),该数据库涵盖超过1000个不同的数据字段。数据库目前包含2,709,516个条目,涵盖99,392个菌株。每个条目都链接到一个参考文献。[6] 每个菌株的数据分为“名称和分类学”、“形态学”、“培养和生长条件”、“生理和代谢”、“分离、采样和环境信息”、“安全信息”、“序列信息”等类别。[7]

自2023年以来,使用经过精选BacDive数据训练的机器学习模型生成的高质量预测数据可以在题为“基于基因组的预测”的附加部分中找到。[8]

数据访问

[编辑]

可以通过图形用户界面(GUI)、RESTful网络服务SPARQL协议与资源描述框架查询语言端点访问数据。[9]

GUI提供简单的搜索功能,可自动完成按菌株名称、菌种保藏编号、NCBI分类标识符编号或国际核苷酸序列数据库合作组织英语International Nucleotide Sequence Database Collaboration(INSDC)序列登录号进行搜索。此外,用户还可以使用高级搜索功能,该功能支持130个数据字段的搜索,并通过组合多个字段进行复杂查询。数据可以以逗号分隔值(CSV)格式下载,包含一个或多个菌株。[10]

通过RESTful网络服务门户BacDive内容可以自动访问(需要免费注册)。为了支持应用程序接口(API)的使用,PythonR语言软件客户端可用。

其它数据库

[编辑]

对于BacDive关注范围之外的数据,提供了其它数据库的链接。

DSMZ数字多样性基础设施内的其他数据库:

外部数据库:

参考文献

[编辑]
  1. ^ Abu-Jamous, Basel; Fa, Rui; Nandi, Asoke K. Integrative Cluster Analysis in Bioinformatics. John Wiley & Sons. 2015: 448. ISBN 9781118906552. 
  2. ^ Reimer, LC; Sardà Carbasse, J; Koblitz, J; Ebeling, C; Podstawka, A; Overmann, J. BacDive in 2022: the knowledge base for standardized bacterial and archaeal data. Nucleic Acids Research. January 7, 2022, 50 (Database issue): D741–D746. PMC 8728306可免费查阅. PMID 34718743. doi:10.1093/nar/gkab961. 
  3. ^ Database from Braunschweig is essential for global bacteria research. dsmz.de. [14 November 2024]. 
  4. ^ ELIXIR announces new Core Data Resources and Recommended Interoperability Resources. elixir-europe.org. 14 December 2023 [14 November 2024]. 
  5. ^ Söhngen, C; Boyke, B; Podstawka, A; Gleim, D; Overmann, J. BacDive - The Bacterial Diversity Metadatabase. Nucleic Acids Research. October 13, 2013, 42 (Database issue): D592–D599. PMC 3965005可免费查阅. PMID 24214959. doi:10.1093/nar/gkt1058. 
  6. ^ BacDive News. December 19, 2024. 
  7. ^ Reimer, LC; Vetcininova, A; Sardà Carbasse, J; Söhngen, C; Gleim, D; Ebeling, C; Overmann, J. BacDive in 2019: bacterial phenotypic data for High-throughput biodiversity analysis. Nucleic Acids Research. September 17, 2018, 47 (Database issue): D631–D636. PMC 6323973可免费查阅. PMID 30256983. doi:10.1093/nar/gky879. 
  8. ^ Schober, I; Koblitz, J; Sardà Carbasse, J; Ebeling, C; Schmidt, ML; Podstawka, A; Gupta, R; Ilangovan, V; Chamanara, J; Overmann, J; Reimer, LC. BacDive in 2025: the core database for prokaryotic strain data.. Nucleic Acids Research. 29 October 2024, 53 (D1): D748–D756. PMC 11701647可免费查阅. PMID 39470737. doi:10.1093/nar/gkae959可免费查阅. 
  9. ^ Söhngen, C; Podstawka, A; Boyke, B; Gleim, D; Vetcininova, A; Reimer, LC; Ebeling, C; Pendarovski, C; Overmann, J. BacDive - The Bacterial Diversity Metadatabase in 2016. Nucleic Acids Research. September 30, 2015, 44 (Database issue): D581–D585. PMC 4702946可免费查阅. PMID 26424852. doi:10.1093/nar/gkv983. 
  10. ^ Schober, I; Koblitz, J; Sardà Carbasse, J; Ebeling, C; Schmidt, ML; Podstawka, A; Gupta, R; Ilangovan, V; Chamanara, J; Overmann, J; Reimer, LC. BacDive in 2025: the core database for prokaryotic strain data.. Nucleic Acids Research. 29 October 2024, 53 (D1): D748–D756. PMC 11701647可免费查阅. PMID 39470737. doi:10.1093/nar/gkae959可免费查阅. 

外部链接

[编辑]