跳转到内容

一二三排檢法

维基百科,自由的百科全书

一二三排檢法,全稱一二三漢字筆順排檢法,是一種根據筆順和筆畫表來給漢字做排序和檢索的方法,其工作原理與英文和汉语拼音等拉丁文字的字母順序一致。與傳統的筆畫排檢法相比,一二三排檢法免除了數算筆畫和歸併筆形(為五類)的負擔,但保持了排檢的精確度。[1][2]

該排檢法已應用於Unicode中日韓漢字基本集的排序,還編排出版了一本涵蓋新華字典現代漢語詞典的聯合索引手冊。 [3][4][5]

文章末尾有一附錄,列出Unicode中日韓漢字集共20,992字的一二三序。[6]

排檢法

[编辑]

單字排檢

[编辑]

單字按漢字筆順[7]和《一二三漢字筆順排檢法筆形表》順序排檢,類似於英文和漢語拼音字母序

如果把漢字筆順的筆劃序列看做英語單詞的字母序列,那麼用一二三排檢法給漢字排序類似於按字母表給英文單詞排序。兩個漢字按各自的第一筆在筆形表中的位置前後來排序。如果第一筆相同,檢查第二筆,依此類推。例如,“一二三排检(檢)法”中的不同漢字的排序為:[8]

  • 一(㇐)
  • 二(㇐㇐)
  • 三(㇐㇐㇐)
  • 檢(㇐㇑㇓㇔㇓㇏㇐㇑㇕㇐㇑㇕㇐㇓㇔㇓㇔)
  • 检(㇐㇑㇓㇔㇓㇏㇐㇔㇔㇓㇐)
  • 排(㇐㇚㇀㇑㇐㇐㇐㇑㇐㇐㇐)
  • 法(㇔㇔㇀㇐㇑㇐㇜㇔)

多字詞排檢

[编辑]

多字詞按第一個字排序,如果第一個字相同,則比較第二個字,以此類推。非漢字字符排在漢字後面,按照字母表/Unicode的順序排序,例如:[8]

  • 覺醒
  • 觉醒
  • 觉悟
  • B超
  • T恤

筆順和筆形表

[编辑]

在字形和筆順方面,應該遵循官方的標準。目前較有影響的標準是 中国内地國家語言文字工作委員會頒布的《通用规范汉字笔顺规范》[9] 和台灣的《常用國字標準字體筆順手册》[10]

一二三排檢法的筆形表依據《GB13000.1字符集漢字折筆規範》[11]和Unicode《CJK筆形表》[12]編寫,略作調整。共計30種筆形,按照標準平筆筆形的順序“橫(㇐)、提(㇀)、豎(㇑)、撇(㇓)、點(㇔)、捺(㇏)”和折點順序“折、彎、鉤”排列。全表如下:[13]

㇐ ㇕ ㇅ ㇎ ㇡ ㇋ ㇊ ㇍ ㇈ ㇆ ㇇ ㇌ ㇤ ㇀ ㇑ ㇗ ㇞ ㇉ ㇥ ㇙ ㇄ ㇟ ㇚ ㇓ ㇜ ㇛ ㇢ ㇔ ㇏ ㇂

應用

[编辑]

一二三排檢法已經成功應用於一些工具書和列表的編排,包括:

  • 一二三笔顺检字手册(共276頁的小冊子,由国家语言文字工作委员会语文出版社审定出版,其中有一個涵蓋《新華字典》第11版和《現代漢語詞典》第六版所有13,000多個簡繁異體漢字的聯合索引)。[14]
  • The YES-CEDICT Chinese Dictionary (一二三漢英大詞典),試用版,按繁體字頭排序,共有110,000多個詞條。[15]
  • The YES-CEDICT Chinese Dictionary (一二三汉英大词典),試用版,按簡體字頭排序,共有110,000多個詞條。[16]

名稱

[编辑]

排檢法的中文名“一二三”取字序表的前三個漢字[a],顯示其簡單便捷,不需按筆畫數排檢的特點。

英文名稱 "YES" 是“一二三”漢語拼音“Yi Er San”的縮寫。[17]

优缺点

[编辑]

與傳統的筆畫排檢法相比,一二三排檢法有幾個優點:一是免除了數算筆畫數目和歸並筆畫(為五類)的負擔,同時保持了排檢的精確度;二是基本排檢原則與英文和漢語拼音的排檢法完全一致;三是筆畫表的排列有理據,便於使用。 但與英文等拉丁文字的字母表排檢法相比,還存在一些距離:一是需要從漢字到筆順的轉換,二是有極少數漢字筆順完全一樣但字形有別,三是還沒有全球統一的筆畫表和筆順標準。因此,還達不到英文排檢那麽簡便。[18]

参见

[编辑]

注释

[编辑]
  1. ^ 因爲筆形表的第一個筆畫是“一”(相當於英文字母表中的"Aa"),所以“一、二、三”在任何排序中都是位於前三位。

參考資料

[编辑]

引用

[编辑]
  1. ^ 张 & 李 2013,第(序)1頁.
  2. ^ 李 2011.
  3. ^ Unicode CJK Unified Ideographs (PDF). Unicode. 2023 [2024-05-25]. (原始内容存档 (PDF)于2018-08-19). 
  4. ^ Zhang & Li 2015.
  5. ^ 張 & 李 2013.
  6. ^ 張 2020.
  7. ^ 苏 2014,第82-84頁.
  8. ^ 8.0 8.1 Zhang, Li & Lun 2015a,第6頁.
  9. ^ 国家语委 2021.
  10. ^ 國語推行委員會 1996.
  11. ^ 國家語委 2002.
  12. ^ 存档副本 (PDF). [2023-06-02]. (原始内容存档 (PDF)于2021-01-31). 
  13. ^ Zhang & Li 2013,第封面内測頁.
  14. ^ 张 & 李 2013.
  15. ^ Zhang, Li & Lun 2015a.
  16. ^ Zhang, Li & Lun 2015c.
  17. ^ 張 & 李 2013,第275頁.
  18. ^ 張 & 李 2013,第274-275頁.

引用文獻

[编辑]
  • 国家语委, 国家语言文字工作委员会. GB13000.1字符集汉字字序(笔画序)规范 (PDF). 上海: 上海教育出版社. 1999 [2023-06-02]. (原始内容存档 (PDF)于2023-05-23) (中文). 
  • 国家语委, 国家语言文字工作委员会. GB13000.1字符集汉字折笔规范. 北京: 语文出版社. 2002. ISBN 978-7-80-126882-2. 
  • 国家语委, 国家语言文字工作委员会. 通用规范汉字笔顺规范. Beijing: 商务印书馆. 2021. ISBN 978-7-100-19347-4 (中文). 
  • 李, 笑通. 汉字“笔形笔顺排检法”的设计与应用 (碩士論文). 香港: Department of Chinese and Bilingual Studies, Hong Kong Polytechnic University. 2011. 
  • 國語推行委員會, 中華民國教育部. 常用國字標準字體筆順手册. 台北: 教育部. 1996. ISBN 978-9-57-090664-6 (中文). 
  • 苏, 培成. 现代汉字学纲要 3rd. 北京: 商务印书馆. 2014: 82–84. ISBN 978-7-100-10440-1. 
  • Unicode Consortium. Unicode Standard, Version 15.1.0.. Mountain View, CA: Unicode Consortium. 2023 [2023-12-06]. (原始内容存档于2024-02-13) (英语). 
  • 张, 小衡; 李, 笑通; et al. 一二三笔顺检字手册. 北京: 语文出版社. 2013. ISBN 978-7-80241-670-3 (中文). 
  • 張, 小衡. 漢字的無標記排檢. 中文教学现代化学报. 2020,. 9 (2020) (縂 18): 42–59. 
  • Zhang, X; Li, X; Lun, C. The YES-CEDICT Chinese Dictionary (一二三漢英大詞典, Trial Edition, Sorted by Traditional Chinese). The Journal of Modernization of Chinese Language Education (中文教学现代化学报). 2015a, 4 (1): link to the book [2023-12-06]. (原始内容存档于2023-08-04) –通过link to the book. 
  • Zhang, X; Li, X; Lun, C. The YES-CEDICT Chinese Dictionary (一二三汉英大词典, Trial Edition, Sorted by Simplified Chinese). The Journal of Modernization of Chinese Language Education (中文教学现代化学报). 2015c, 4 (1): link to the book [2023-12-06]. (原始内容存档于2023-08-04) –通过link to the book. 
  • Zhang, Xiaoheng; Li, Xiaotong. Building a collation element table for a large Chinese character set in YES. Chinese Computational Linguistics and Natural Language Processing Based on Naturally Annotated Big Data - Lecture Notes in Computer Science. Switzerland: Springer Verlag. 2015: 3–14. ISBN 9783319258157 (英语). 

外部連結

[编辑]