一二三排檢法
一二三排檢法,全稱一二三漢字筆順排檢法,是一種根據筆順和筆畫表來給漢字做排序和檢索的方法,其工作原理與英文和汉语拼音等拉丁文字的字母順序一致。與傳統的筆畫排檢法相比,一二三排檢法免除了數算筆畫和歸併筆形(為五類)的負擔,但保持了排檢的精確度。[1][2]
該排檢法已應用於Unicode中日韓漢字基本集的排序,還編排出版了一本涵蓋新華字典和現代漢語詞典的聯合索引手冊。 [3][4][5]
文章末尾有一附錄,列出Unicode中日韓漢字集共20,992字的一二三序。[6]
排檢法
[编辑]單字排檢
[编辑]單字按漢字筆順[7]和《一二三漢字筆順排檢法筆形表》順序排檢,類似於英文和漢語拼音的字母序。
如果把漢字筆順的筆劃序列看做英語單詞的字母序列,那麼用一二三排檢法給漢字排序類似於按字母表給英文單詞排序。兩個漢字按各自的第一筆在筆形表中的位置前後來排序。如果第一筆相同,檢查第二筆,依此類推。例如,“一二三排检(檢)法”中的不同漢字的排序為:[8]
- 一(㇐)
- 二(㇐㇐)
- 三(㇐㇐㇐)
- 檢(㇐㇑㇓㇔㇓㇏㇐㇑㇕㇐㇑㇕㇐㇓㇔㇓㇔)
- 检(㇐㇑㇓㇔㇓㇏㇐㇔㇔㇓㇐)
- 排(㇐㇚㇀㇑㇐㇐㇐㇑㇐㇐㇐)
- 法(㇔㇔㇀㇐㇑㇐㇜㇔)
多字詞排檢
[编辑]多字詞按第一個字排序,如果第一個字相同,則比較第二個字,以此類推。非漢字字符排在漢字後面,按照字母表/Unicode的順序排序,例如:[8]
- 覺
- 覺醒
- 觉
- 觉醒
- 觉悟
- B超
- T恤
筆順和筆形表
[编辑]在字形和筆順方面,應該遵循官方的標準。目前較有影響的標準是 中国内地國家語言文字工作委員會頒布的《通用规范汉字笔顺规范》[9] 和台灣的《常用國字標準字體筆順手册》[10]。
一二三排檢法的筆形表依據《GB13000.1字符集漢字折筆規範》[11]和Unicode《CJK筆形表》[12]編寫,略作調整。共計30種筆形,按照標準平筆筆形的順序“橫(㇐)、提(㇀)、豎(㇑)、撇(㇓)、點(㇔)、捺(㇏)”和折點順序“折、彎、鉤”排列。全表如下:[13]
㇐ ㇕ ㇅ ㇎ ㇡ ㇋ ㇊ ㇍ ㇈ ㇆ ㇇ ㇌㇀ ㇑ ㇗ ㇞ ㇉
㇙ ㇄ ㇟ ㇚ ㇓ ㇜ ㇛ ㇢ ㇔ ㇏ ㇂
應用
[编辑]一二三排檢法已經成功應用於一些工具書和列表的編排,包括:
- 一二三笔顺检字手册(共276頁的小冊子,由国家语言文字工作委员会语文出版社审定出版,其中有一個涵蓋《新華字典》第11版和《現代漢語詞典》第六版所有13,000多個簡繁異體漢字的聯合索引)。[14]
- The YES-CEDICT Chinese Dictionary (一二三漢英大詞典),試用版,按繁體字頭排序,共有110,000多個詞條。[15]
- The YES-CEDICT Chinese Dictionary (一二三汉英大词典),試用版,按簡體字頭排序,共有110,000多個詞條。[16]
名稱
[编辑]排檢法的中文名“一二三”取字序表的前三個漢字[a],顯示其簡單便捷,不需按筆畫數排檢的特點。
英文名稱 "YES" 是“一二三”漢語拼音“Yi Er San”的縮寫。[17]
优缺点
[编辑]與傳統的筆畫排檢法相比,一二三排檢法有幾個優點:一是免除了數算筆畫數目和歸並筆畫(為五類)的負擔,同時保持了排檢的精確度;二是基本排檢原則與英文和漢語拼音的排檢法完全一致;三是筆畫表的排列有理據,便於使用。 但與英文等拉丁文字的字母表排檢法相比,還存在一些距離:一是需要從漢字到筆順的轉換,二是有極少數漢字筆順完全一樣但字形有別,三是還沒有全球統一的筆畫表和筆順標準。因此,還達不到英文排檢那麽簡便。[18]
参见
[编辑]注释
[编辑]- ^ 因爲筆形表的第一個筆畫是“一”(相當於英文字母表中的"Aa"),所以“一、二、三”在任何排序中都是位於前三位。
參考資料
[编辑]引用
[编辑]- ^ 张 & 李 2013,第(序)1頁.
- ^ 李 2011.
- ^ Unicode CJK Unified Ideographs (PDF). Unicode. 2023 [2024-05-25]. (原始内容存档 (PDF)于2018-08-19).
- ^ Zhang & Li 2015.
- ^ 張 & 李 2013.
- ^ 張 2020.
- ^ 苏 2014,第82-84頁.
- ^ 8.0 8.1 Zhang, Li & Lun 2015a,第6頁.
- ^ 国家语委 2021.
- ^ 國語推行委員會 1996.
- ^ 國家語委 2002.
- ^ 存档副本 (PDF). [2023-06-02]. (原始内容存档 (PDF)于2021-01-31).
- ^ Zhang & Li 2013,第封面内測頁.
- ^ 张 & 李 2013.
- ^ Zhang, Li & Lun 2015a.
- ^ Zhang, Li & Lun 2015c.
- ^ 張 & 李 2013,第275頁.
- ^ 張 & 李 2013,第274-275頁.
引用文獻
[编辑]- 国家语委, 国家语言文字工作委员会. GB13000.1字符集汉字字序(笔画序)规范 (PDF). 上海: 上海教育出版社. 1999 [2023-06-02]. (原始内容存档 (PDF)于2023-05-23) (中文).
- 国家语委, 国家语言文字工作委员会. GB13000.1字符集汉字折笔规范. 北京: 语文出版社. 2002. ISBN 978-7-80-126882-2.
- 国家语委, 国家语言文字工作委员会. 通用规范汉字笔顺规范. Beijing: 商务印书馆. 2021. ISBN 978-7-100-19347-4 (中文).
- 李, 笑通. 汉字“笔形笔顺排检法”的设计与应用 (碩士論文). 香港: Department of Chinese and Bilingual Studies, Hong Kong Polytechnic University. 2011.
- 國語推行委員會, 中華民國教育部. 常用國字標準字體筆順手册. 台北: 教育部. 1996. ISBN 978-9-57-090664-6 (中文).
- 苏, 培成. 现代汉字学纲要 3rd. 北京: 商务印书馆. 2014: 82–84. ISBN 978-7-100-10440-1.
- Unicode Consortium. Unicode Standard, Version 15.1.0.. Mountain View, CA: Unicode Consortium. 2023 [2023-12-06]. (原始内容存档于2024-02-13) (英语).
- 张, 小衡; 李, 笑通; et al. 一二三笔顺检字手册. 北京: 语文出版社. 2013. ISBN 978-7-80241-670-3 (中文).
- 張, 小衡. 漢字的無標記排檢. 中文教学现代化学报. 2020,. 9 (2020) (縂 18): 42–59.
- Zhang, X; Li, X; Lun, C. The YES-CEDICT Chinese Dictionary (一二三漢英大詞典, Trial Edition, Sorted by Traditional Chinese). The Journal of Modernization of Chinese Language Education (中文教学现代化学报). 2015a, 4 (1): link to the book [2023-12-06]. (原始内容存档于2023-08-04) –通过link to the book.
- Zhang, X; Li, X; Lun, C. The YES-CEDICT Chinese Dictionary (一二三汉英大词典, Trial Edition, Sorted by Simplified Chinese). The Journal of Modernization of Chinese Language Education (中文教学现代化学报). 2015c, 4 (1): link to the book [2023-12-06]. (原始内容存档于2023-08-04) –通过link to the book.
- Zhang, Xiaoheng; Li, Xiaotong. Building a collation element table for a large Chinese character set in YES. Chinese Computational Linguistics and Natural Language Processing Based on Naturally Annotated Big Data - Lecture Notes in Computer Science. Switzerland: Springer Verlag. 2015: 3–14. ISBN 9783319258157 (英语).
外部連結
[编辑]- YES stroke alphabetical order. [2023-12-06]. (原始内容存档于2023-12-13).
- Stroke-based sorting.