跳转到内容

草稿:DraCor

维基百科,自由的百科全书

DraCor (Drama Corpora) 是一个开放式数字基础设施,用于对从古希腊罗马时代到 20 世纪的欧洲戏剧进行计算研究。该平台收录了以 TEI 格式编码的各种语言的戏剧,支持戏剧研究中的比较和计算方法。截至 2025 年,该平台收集了 20 多种语言的 4000 多个文本。截至 2025 年,该平台收集了 20 多种语言的 4000 多个文本。DraCor 提供的数据在数字人文研究中得到了广泛应用。

概述

[编辑]

DraCor 旨在创建可靠、可扩展和可互操作的戏剧文学语料库。该项目强调 “可编程语料库”[1]的概念,即数据不仅可以访问,还可以通过应用程序接口和与其他工具的集成进行计算分析。该平台努力遵循 FAIR 数据原则(可查找、可访问、可互操作、可重用)。

主要功能

[编辑]

多语种语料库: 包含 20 多种语言(主要是欧洲语言)的戏剧语料库。

TEI 编码: 文本根据 TEI 指南进行编码,以保持结构和语义的一致性。

API 访问: 提供文档化的应用编程接口,可通过编程访问文本和元数据。

网络可视化: 生成表示剧中人物共现的网络图。

数据下载: 提供下载文本子集(如演讲稿或舞台说明)以及网络数据的选项。

开放访问: 数据可公开用于研究和相关用途。

可编程语料库:支持与外部分析工具和编程语言集成,提供 Python (pydracor[2]) 和 R (rdracor[3]) API 封装程序。

语料库

[编辑]

DraCor 的语料库不断增加,涵盖法语、德语、英语、俄语、西班牙语、荷兰语、意大利语、匈牙利语、瑞典语、波兰语、乌克兰语、古希腊语、拉丁语和其他语言的戏剧。每个语料库都由学者个人或团队[4] 精心策划,在提供 TEI 编码文本的同时还提供丰富的元数据,支持对戏剧结构、人物互动和相关主题的分析。

工具和使用

[编辑]

DraCor 平台包括基本的可视化工具,特别是用于网络分析的工具。它还支持以编程方式访问语料库,从而能够集成到计算研究工作流程中。这有助于进行各种类型的分析,包括

定量文本分析

字符的社会网络分析

文体测量研究

跨语言的戏剧比较研究

社区、开发、影响

[编辑]

DraCor 由多个机构的研究人员合作开发,尤其是柏林自由大学波茨坦大学。作为一个开源项目,它积极鼓励社区贡献和反馈。

外部链接

[编辑]

https://dracor.org/

https://staging.dracor.org/doc/research

https://dracor.org/doc/api

https://github.com/dracor-org

https://textcourt.ames.ox.ac.uk/

https://ctext.org/wiki.pl?if=gb&res=434821&remap=gb

https://cascorpus.com/link-detail/727822?utm_source=chatgpt.com

https://hdipp.pku.edu.cn/sjzy/yu_l.htm

https://zzife.zgence.com/project/lxlhfb?utm_source=chatgpt.com

https://lib.sta.edu.cn/02/1d/c201a541/page.htm

奖项

[编辑]

该项目于 2022 年获得了 TEI 协会颁发的 Rahtz TEI 独创奖。2022: Rahtz Prize for TEI Ingenuity.[5]

参考资料

[编辑]
  1. ^ Fischer, Frank; Börner, Ingo; Göbel, Mathias; Hechtl, Angelika; Kittel, Christopher; Milling, Carsten; Trilcke, Peer. Programmable Corpora: Introducing DraCor, an Infrastructure for the Research on European Drama. 2019-07-10 [2025-07-01]. doi:10.5281/ZENODO.4284002 (英语). 
  2. ^ Danial, Albert, Installation, Apress: 11–21, 2022 [2025-07-01], ISBN 978-1-4842-7222-0 
  3. ^ Paediatric regulatory network. World Health Organization. 2025-02-19. 
  4. ^ García Sánchez-Migallón, Patricia; Santa María, María Teresa. Redes sociales de personajes aplicadas al estudio de comedias de diferentes épocas presentes en el corpus de DraCor. Revista de Humanidades Digitales. 2025-03-04, 10 [2025-07-01]. ISSN 2531-1786. doi:10.5944/rhd.vol.10.2025.40145. 
  5. ^ Rahtz, Sebastian; Burnard, Lou. Reviewing the TEI ODD system. Proceedings of the 2013 ACM symposium on Document engineering (New York, NY, USA: ACM). 2013-09-10 [2025-07-10]. doi:10.1145/2494266.2494321.