跳转到内容

一二三排检法

维基百科,自由的百科全书

一二三排检法,全称一二三汉字笔顺排检法,是一种根据笔顺和笔画表来给汉字做排序和检索的方法,其工作原理与英文和汉语拼音等拉丁文字的字母顺序一致。与传统的笔画排检法相比,一二三排检法免除了数算笔画和归并笔形(为五类)的负担,但保持了排检的精确度。[1][2]

该排检法已应用于Unicode中日韩汉字基本集的排序,还编排出版了一本涵盖新华字典现代汉语词典的联合索引手册。 [3][4][5]

文章末尾有一附录,列出Unicode中日韩汉字集共20,992字的一二三序。[6]

排检法

[编辑]

单字排检

[编辑]

单字按汉字笔顺[7]和《一二三汉字笔顺排检法笔形表》顺序排检,类似于英文和汉语拼音字母序

如果把汉字笔顺的笔划序列看做英语单词的字母序列,那么用一二三排检法给汉字排序类似于按字母表给英文单词排序。两个汉字按各自的第一笔在笔形表中的位置前后来排序。如果第一笔相同,检查第二笔,依此类推。例如,“一二三排检(檢)法”中的不同汉字的排序为:[8]

  • 一(㇐)
  • 二(㇐㇐)
  • 三(㇐㇐㇐)
  • 檢(㇐㇑㇓㇔㇓㇏㇐㇑㇕㇐㇑㇕㇐㇓㇔㇓㇔)
  • 检(㇐㇑㇓㇔㇓㇏㇐㇔㇔㇓㇐)
  • 排(㇐㇚㇀㇑㇐㇐㇐㇑㇐㇐㇐)
  • 法(㇔㇔㇀㇐㇑㇐㇜㇔)

多字词排检

[编辑]

多字词按第一个字排序,如果第一个字相同,则比较第二个字,以此类推。非汉字字符排在汉字后面,按照字母表/Unicode的顺序排序,例如:[8]

  • 覺醒
  • 觉醒
  • 觉悟
  • B超
  • T恤

笔顺和笔形表

[编辑]

在字形和笔顺方面,应该遵循官方的标准。目前较有影响的标准是 中国内地国家语言文字工作委员会颁布的《通用规范汉字笔顺规范》[9] 和台湾的《常用国字标准字体笔顺手册》[10]

一二三排检法的笔形表依据《GB13000.1字符集汉字折笔规范》[11]和Unicode《CJK笔形表》[12]编写,略作调整。共计30种笔形,按照标准平笔笔形的顺序“横(㇐)、提(㇀)、竖(㇑)、撇(㇓)、点(㇔)、捺(㇏)”和折点顺序“折、弯、钩”排列。全表如下:[13]

㇐ ㇕ ㇅ ㇎ ㇡ ㇋ ㇊ ㇍ ㇈ ㇆ ㇇ ㇌ ㇤ ㇀ ㇑ ㇗ ㇞ ㇉ ㇥ ㇙ ㇄ ㇟ ㇚ ㇓ ㇜ ㇛ ㇢ ㇔ ㇏ ㇂

应用

[编辑]

一二三排检法已经成功应用于一些工具书和列表的编排,包括:

  • 一二三笔顺检字手册(共276页的小册子,由国家语言文字工作委员会语文出版社审定出版,其中有一个涵盖《新华字典》第11版和《现代汉语词典》第六版所有13,000多个简繁异体汉字的联合索引)。[14]
  • The YES-CEDICT Chinese Dictionary (一二三漢英大詞典),试用版,按繁体字头排序,共有110,000多个词条。[15]
  • The YES-CEDICT Chinese Dictionary (一二三汉英大词典),试用版,按简体字头排序,共有110,000多个词条。[16]

名称

[编辑]

排检法的中文名“一二三”取字序表的前三个汉字[a],显示其简单便捷,不需按笔画数排检的特点。

英文名称 "YES" 是“一二三”汉语拼音“Yi Er San”的缩写。[17]

优缺点

[编辑]

与传统的笔画排检法相比,一二三排检法有几个优点:一是免除了数算笔画数目和归并笔画(为五类)的负担,同时保持了排检的精确度;二是基本排检原则与英文和汉语拼音的排检法完全一致;三是笔画表的排列有理据,便于使用。 但与英文等拉丁文字的字母表排检法相比,还存在一些距离:一是需要从汉字到笔顺的转换,二是有极少数汉字笔顺完全一样但字形有别,三是还没有全球统一的笔画表和笔顺标准。因此,还达不到英文排检那么简便。[18]

参见

[编辑]

注释

[编辑]
  1. ^ 因为笔形表的第一个笔画是“一”(相当于英文字母表中的"Aa"),所以“一、二、三”在任何排序中都是位于前三位。

参考资料

[编辑]

引用

[编辑]
  1. ^ 张 & 李 2013,第(序)1页.
  2. ^ 李 2011.
  3. ^ Unicode CJK Unified Ideographs (PDF). Unicode. 2023 [2024-05-25]. (原始内容存档 (PDF)于2018-08-19). 
  4. ^ Zhang & Li 2015.
  5. ^ 张 & 李 2013.
  6. ^ 张 2020.
  7. ^ 苏 2014,第82-84页.
  8. ^ 8.0 8.1 Zhang, Li & Lun 2015a,第6页.
  9. ^ 国家语委 2021.
  10. ^ 国语推行委员会 1996.
  11. ^ 国家语委 2002.
  12. ^ 存档副本 (PDF). [2023-06-02]. (原始内容存档 (PDF)于2021-01-31). 
  13. ^ Zhang & Li 2013,第封面内测页.
  14. ^ 张 & 李 2013.
  15. ^ Zhang, Li & Lun 2015a.
  16. ^ Zhang, Li & Lun 2015c.
  17. ^ 张 & 李 2013,第275页.
  18. ^ 张 & 李 2013,第274-275页.

引用文献

[编辑]
  • 国家语委, 国家语言文字工作委员会. GB13000.1字符集汉字字序(笔画序)规范 (PDF). 上海: 上海教育出版社. 1999 [2023-06-02]. (原始内容存档 (PDF)于2023-05-23) (中文). 
  • 国家语委, 国家语言文字工作委员会. GB13000.1字符集汉字折笔规范. 北京: 语文出版社. 2002. ISBN 978-7-80-126882-2. 
  • 国家语委, 国家语言文字工作委员会. 通用规范汉字笔顺规范. Beijing: 商务印书馆. 2021. ISBN 978-7-100-19347-4 (中文). 
  • 李, 笑通. 汉字“笔形笔顺排检法”的设计与应用 (碩士論文). 香港: Department of Chinese and Bilingual Studies, Hong Kong Polytechnic University. 2011. 
  • 国语推行委员会, 中华民国教育部. 常用國字標準字體筆順手册. 台北: 教育部. 1996. ISBN 978-9-57-090664-6 (中文). 
  • 苏, 培成. 现代汉字学纲要 3rd. 北京: 商务印书馆. 2014: 82–84. ISBN 978-7-100-10440-1. 
  • Unicode Consortium. Unicode Standard, Version 15.1.0.. Mountain View, CA: Unicode Consortium. 2023 [2023-12-06]. (原始内容存档于2024-02-13) (英语). 
  • 张, 小衡; 李, 笑通; et al. 一二三笔顺检字手册. 北京: 语文出版社. 2013. ISBN 978-7-80241-670-3 (中文). 
  • 张, 小衡. 漢字的無標記排檢. 中文教学现代化学报. 2020,. 9 (2020) (縂 18): 42–59. 
  • Zhang, X; Li, X; Lun, C. The YES-CEDICT Chinese Dictionary (一二三漢英大詞典, Trial Edition, Sorted by Traditional Chinese). The Journal of Modernization of Chinese Language Education (中文教学现代化学报). 2015a, 4 (1): link to the book [2023-12-06]. (原始内容存档于2023-08-04) –通过link to the book. 
  • Zhang, X; Li, X; Lun, C. The YES-CEDICT Chinese Dictionary (一二三汉英大词典, Trial Edition, Sorted by Simplified Chinese). The Journal of Modernization of Chinese Language Education (中文教学现代化学报). 2015c, 4 (1): link to the book [2023-12-06]. (原始内容存档于2023-08-04) –通过link to the book. 
  • Zhang, Xiaoheng; Li, Xiaotong. Building a collation element table for a large Chinese character set in YES. Chinese Computational Linguistics and Natural Language Processing Based on Naturally Annotated Big Data - Lecture Notes in Computer Science. Switzerland: Springer Verlag. 2015: 3–14. ISBN 9783319258157 (英语). 

外部链接

[编辑]