草稿:DraCor
| 您所提交的草稿仍需改善。在2025年7月10日由Kanshui0943 (留言)审阅。 如何改善您的草稿
|
| 您所提交的草稿仍需改善。在2025年7月5日由Bosco Sin (留言)审阅。 如何改善您的草稿
|
DraCor (Drama Corpora) 是一个开放式数字基础设施,用于对从古希腊罗马时代到 20 世纪的欧洲戏剧进行计算研究。该平台收录了以 TEI 格式编码的各种语言的戏剧,支持戏剧研究中的比较和计算方法。截至 2025 年,该平台收集了 20 多种语言的 4000 多个文本。截至 2025 年,该平台收集了 20 多种语言的 4000 多个文本。DraCor 提供的数据在数字人文研究中得到了广泛应用。
概述
[编辑]DraCor 旨在创建可靠、可扩展和可互操作的戏剧文学语料库。该项目强调 “可编程语料库”[1]的概念,即数据不仅可以访问,还可以通过应用程序接口和与其他工具的集成进行计算分析。该平台努力遵循 FAIR 数据原则(可查找、可访问、可互操作、可重用)。
主要功能
[编辑]多语种语料库: 包含 20 多种语言(主要是欧洲语言)的戏剧语料库。
TEI 编码: 文本根据 TEI 指南进行编码,以保持结构和语义的一致性。
API 访问: 提供文档化的应用编程接口,可通过编程访问文本和元数据。
网络可视化: 生成表示剧中人物共现的网络图。
数据下载: 提供下载文本子集(如演讲稿或舞台说明)以及网络数据的选项。
开放访问: 数据可公开用于研究和相关用途。
可编程语料库:支持与外部分析工具和编程语言集成,提供 Python (pydracor[2]) 和 R (rdracor[3]) API 封装程序。
语料库
[编辑]DraCor 的语料库不断增加,涵盖法语、德语、英语、俄语、西班牙语、荷兰语、意大利语、匈牙利语、瑞典语、波兰语、乌克兰语、古希腊语、拉丁语和其他语言的戏剧。每个语料库都由学者个人或团队[4] 精心策划,在提供 TEI 编码文本的同时还提供丰富的元数据,支持对戏剧结构、人物互动和相关主题的分析。
工具和使用
[编辑]DraCor 平台包括基本的可视化工具,特别是用于网络分析的工具。它还支持以编程方式访问语料库,从而能够集成到计算研究工作流程中。这有助于进行各种类型的分析,包括
定量文本分析
字符的社会网络分析
文体测量研究
跨语言的戏剧比较研究
社区、开发、影响
[编辑]DraCor 由多个机构的研究人员合作开发,尤其是柏林自由大学和波茨坦大学。作为一个开源项目,它积极鼓励社区贡献和反馈。
外部链接
[编辑]https://staging.dracor.org/doc/research
https://textcourt.ames.ox.ac.uk/
https://ctext.org/wiki.pl?if=gb&res=434821&remap=gb
https://cascorpus.com/link-detail/727822?utm_source=chatgpt.com
https://hdipp.pku.edu.cn/sjzy/yu_l.htm
https://zzife.zgence.com/project/lxlhfb?utm_source=chatgpt.com
https://lib.sta.edu.cn/02/1d/c201a541/page.htm
奖项
[编辑]该项目于 2022 年获得了 TEI 协会颁发的 Rahtz TEI 独创奖。2022: Rahtz Prize for TEI Ingenuity.[5]
参考资料
[编辑]- ^ Fischer, Frank; Börner, Ingo; Göbel, Mathias; Hechtl, Angelika; Kittel, Christopher; Milling, Carsten; Trilcke, Peer. Programmable Corpora: Introducing DraCor, an Infrastructure for the Research on European Drama. 2019-07-10 [2025-07-01]. doi:10.5281/ZENODO.4284002 (英语).
- ^ Danial, Albert, Installation, Apress: 11–21, 2022 [2025-07-01], ISBN 978-1-4842-7222-0
- ^ Paediatric regulatory network. World Health Organization. 2025-02-19.
- ^ García Sánchez-Migallón, Patricia; Santa María, María Teresa. Redes sociales de personajes aplicadas al estudio de comedias de diferentes épocas presentes en el corpus de DraCor. Revista de Humanidades Digitales. 2025-03-04, 10 [2025-07-01]. ISSN 2531-1786. doi:10.5944/rhd.vol.10.2025.40145.
- ^ Rahtz, Sebastian; Burnard, Lou. Reviewing the TEI ODD system. Proceedings of the 2013 ACM symposium on Document engineering (New York, NY, USA: ACM). 2013-09-10 [2025-07-10]. doi:10.1145/2494266.2494321.
