倉頡之友
康熙与倉頡
主頁 自學 倉頡字典 康熙字典體

倉頡平台2022 網上輸入法 九萬漢字

論壇 聯絡 康熙字典網上版 捐助本站
難取碼整體字的兩種取碼次序思維 - 倉頡論壇 - 康熙字典与倉頡之友 - Powered by Discuz!
請選擇 進入手機版 | 繼續訪問電腦版



 找回密碼
 注册
查看: 16016|回復: 10

難取碼整體字的兩種取碼次序思維

  [複製鏈接]
發表於 29-4-2020 01:18:28 | 顯示全部樓層 |閱讀模式
大家都懂得說倉頡取碼「由外至內,由上至下,由左至右」,九成多漢字都能按此原則解決。但某些少數時候,會碰上一些爭議位置,其實它的背後是關乎兩種概念。

第一種,是先把漢字裁成若干個明顯部件,若那個部件要取多碼,仍先取畢那個部件,接着才取下一個。這是三代的思維。
因此三代編碼,「兜」字是「竹女竹山(㇒㇙㇒乚)」,這「頭、次、三、尾」碼的取法是:先取完左上角的「斜匚」,再取「白」的撇,最尾才取「儿」的末碼。類似的「兠」字取「中一一山(丨一㇀乚)」,先取完左上角的「北之左半」(這已佔了頭、次、三碼),最尾才取「儿」的末碼。

三代中,「韭」和「囬」也類似。「韭」取「中一一一(〡一一一)」,先取左邊的「」,取其「頭、次、三」三碼後,再取全字的末橫作「尾」碼。而「面」下的「囬」取「田卜卜中(囗⺊⺊丨)」,框內部份,先取完「⊨」的「卜卜」,才再取右豎。不過,與「兜」和「兠」不同的是,「兜」和「兠」是因應定義而採用整體字取碼,「韭」和「囬」卻在字形上緊密地連結在一起。結果「韭」和「囬」這樣取碼,會有是否破壞了「由上至下」的次序之憂。

到了五代,官方似乎想改變思維。在九九年的五代,針對「韭」和「囬」這種整體字,變成先把部件都打碎做最基本的倉頡字根,然後完全按由上至下來取。因此「韭」改爲「中尸一一(丨⊨一一)」,頭碼來自左方,二碼來自右方,三碼來自左方,就是如此。而「面、囬」等字則因新增了「⊨」輔根,「ㅒ」中的「⊨」與「丨」一樣高,只須由左至右,先取「⊨」再取「丨」,解決了此尷尬。至於「兜」和「兠」這種不是整個完全相連的整體字,則維持三代做法。

但到了〇三年的五代(即漢文庫典收錄者),「兜」和「兠」這種字也改變了。〇三年五代中,「兜」取「竹尸竹山(㇒コ㇒乚)」,頭碼來自左方,次碼來自右方,三碼貌似來自中間「白部件」之頂,「山」是全字的尾碼。「兠」字也改爲「中心竹山(丨匕㇒乚)」,頭碼來自左方,次碼來自右方,三碼貌似來自中間「白部件」之頂,「山」是全字的尾碼。(不過一郎也無法排除,官方修改取碼時,會否把「兜」和「兠」改爲視作組合字,第三碼「竹」乃來自下方「儿」的撇筆。)

一郎以爲,若講究規則統一,宜全面檢討有關的字,嚴依其中一式來取碼。若只求與官方碼表融合,則兩種思維的內部矛盾在所難免。例如碰到下面這字,雙方就會爭議起來:

https://github.com/Jackchows/Cangjie5/issues/17
 樓主| 發表於 25-10-2021 23:39:22 | 顯示全部樓層
「亞」和「片」本身是整體字,三代還是五代也一樣。

「片」字取「中中一中(丿丨一丨)」是基於這種五畫的寫法,這種寫法在早期蠻常見的:

如果基於現在最常見的寫法,四畫那種,可以取「中中一弓(丿丨一㇕)」:


「亞」字至今還是覺得取「一中中廿(一丨丨ㅛ)」比較好,這個看看有沒其他朋友有什麼看法吶。
 樓主| 發表於 29-4-2020 01:30:50 | 顯示全部樓層
本帖最後由 Ichirou 於 29-4-2020 08:20 PM 編輯

一郎在樓上的這段話是錯的:
〇三年五代中,「兜」取「竹尸竹山(㇒コ㇒乚)」,頭碼來自左方,次碼來自右方,三碼貌似來自中間「白部件」之頂,「山」是全字的尾碼。「兠」字也改爲「中心竹山(丨匕㇒乚)」,頭碼來自左方,次碼來自右方,三碼貌似來自中間「白部件」之頂,「山」是全字的尾碼。
錯誤的原因是,「北」字中間有形塊時,不能用「先外後內」來解釋,須按「先左後右」來取碼,參「燕」字中間部份。

因此只剩下這個可能:把「兜」和「兠」改爲視作組合字,第三碼「竹」乃來自下方「儿」的撇筆。

剛剛一査「橷」字,採用「⿰木兠」這寫法的話,《漢文庫典》取「木中心山」:
http://chidic.eduhk.hk/v.php?id=7612
換言之是把「兠」的上方視爲次字首,拆作「木.中心.山」了。

同理,「⿰木兜」字在《漢文庫典》取「木竹尸山」:
http://chidic.eduhk.hk/v.php?id=8722
也是把「兜」的上方視爲次字首,拆作「木.竹尸.山」了。

那麼說來,〇三年五代把「兜」和「兠」的上方視爲可分割作字首了。
發表於 9-10-2020 18:26:34 | 顯示全部樓層
本帖最後由 頡論 於 9-10-2020 08:59 PM 編輯

請問版主,有解釋或標注整體字的五代倉頡字典嗎?如果有含組合字字身更好。

像,冥的「昗」、原的「內部形」、厡的「內部形」;「孝」、「考」、「者」,初學者難辨。

目前有漢字基因字典,用來看倉頡碼,應該沒說明整體字,多為漢字基因理論釋義。如,「喜」。

節錄自「喜《漢字基因字典》」:字首〔口〕;字身〔壴〕。

節錄自「漢字基因字典 第二版說明 」:6、字首取其形義,字身取其音韻(子音或母音)。然本字常有變音,如「是」組合音時為 ㄊㄧˊ Tyiˊ音。有關組合音,見字身定義。
發表於 9-10-2020 23:39:46 | 顯示全部樓層
頡論 發表於 9-10-2020 06:26 PM
請問版主,有解釋或標注整體字的五代倉頡字典嗎?如果有含組合字字身更好。

像,冥的「昗」、原的「內部形」、厡的「內部形」;「孝」、「考」、「者」,初學者難辨。

「漢字基因字典」是用來解釋字義的,它說的「字首」是傳統字典「部典」的革新版,並不是倉頡中的字首。
做這種字典要製作大量圖片,我想暫時都沒有。
發表於 22-10-2021 14:20:45 | 顯示全部樓層
请问一下,关于‘亞’和‘片’是不是也依照以上的五代整体字的取码思路?
發表於 30-10-2021 01:10:33 | 顯示全部樓層
我感觉整体字难辨别,有些字明明看着像组合字却是整体字的编码,另外一个难分辨的的地方就是切字,未末这两个字我经常弄错,还有一个能否把“难”字的编码改成正常编码,不用x键来参与编码,只用24个仓頡字母来编码,如“身”改成特别字首,首尾两码“竹竹”单独时“竹月山弓”
發表於 30-10-2021 13:23:13 | 顯示全部樓層
龍闖中原 發表於 30-10-2021 01:10 AM
我感觉整体字难辨别,有些字明明看着像组合字却是整体字的编码,另外一个难分辨的的地方就是切字,未末这两 ...

龍闖中原朋友,你好。我本身也正在學習倉頡。以下是我得到的資料。

第一,關於切字。我參考的是以下的網頁:維基教科書。

https://zh.m.wikibooks.org/wiki/%E5%80%89%E9%A0%A1%E8%BC%B8%E5%85%A5%E6%B3%95/%E6%BC%A2%E5%AD%97%E5%88%86%E5%89%B2

對三代或五代都進行統一的解釋。

第二,關於相似的字

以前我本身的教科書也會提及。未字是十木。末字是木十。本字是木一。目是月山。且是月一。
木火戈大七本身跨越取碼,可參考以下2個網頁。(我找不到自己所用的教材了。)

https://zh.wikibooks.org/wiki/%E5%80%89%E9%A0%A1%E8%BC%B8%E5%85%A5%E6%B3%95/%E4%BE%8B%E5%A4%96%E5%AD%97

https://zh.wikibooks.org/wiki/%E5%80%89%E9%A0%A1%E8%BC%B8%E5%85%A5%E6%B3%95/%E5%8F%96%E7%A2%BC%E5%8E%9F%E5%89%87#%E8%B7%A8%E8%B6%8A%E5%88%86%E5%89%87

第三,關於[難字]

它本身有一套字,可參考以下規則。

https://zh.wikibooks.org/wiki/%E5%80%89%E9%A0%A1%E8%BC%B8%E5%85%A5%E6%B3%95/%E4%BE%8B%E5%A4%96%E5%AD%97

六代倉頡取消了難字規則,但有關規則不是公開推行的,學習上有一點難度,也不容易下載,所以不推薦你使用。我本身也不會使用。

學習倉頡方面,也可以從臺灣常用字裡學習自己拆字。
https://zh.wikisource.org/wiki/%E5%B8%B8%E7%94%A8%E5%9C%8B%E5%AD%97%E6%A8%99%E6%BA%96%E5%AD%97%E9%AB%94%E8%A1%A8
發表於 30-10-2021 14:04:15 | 顯示全部樓層
從網上找到的解釋,希望對你有幫助。

code.pdf

163.46 KB, 下載次數: 111775

末未

發表於 12-11-2021 16:05:45 | 顯示全部樓層
龍闖中原 發表於 30-10-2021 01:10 AM
我感觉整体字难辨别,有些字明明看着像组合字却是整体字的编码,另外一个难分辨的的地方就是切字,未末这两 ...

1.我感觉整体字难辨别,有些字明明看着像组合字却是整体字的编码,
  我編的倉頡講義,參照了朱著三代手冊和五代手冊,以五代手冊較有系統而清楚,再斟酌揉入三代。參考我編的《操作表》(將倉頡所有規則及細項,通則原則附則,全精簡成一張輔助取碼的表)。

其左下角有關整體/區塊的定義:
  這些「1形勢  2相連原則」大部份是指類重疊型式或重直筆劃結構下的上根下根之間應切的位置。
  1形勢(這朱原著的話),是較易看出是否整體。而你的所述的「有些字明明看着像组合字却是整体字」可以在 「2 筆劃相連原則」中找到解說。
  (三代稱連體。五代納入附則的複合字/字首、難字、特殊字(支架)後,合稱整體字。)

12操作表

12操作表


2另外一个难分辨的的地方就是切字,未末这两个字我经常弄错,
  未=十木。一在木之上,與丨形成了字形「十」。自然先取十。剩下「木」後取。
  末=木十。一在木之內。木是整字的支架,也在最上取碼時先取得。
     「十」是「一」在木中間與丨形的字形,因「原則」3(不可破壞)特徵  1)不重複取碼  11/特殊字(支架)除外。所以,特殊字(五代=木大火七戈;三代=木大火)有與其他字形筆劃交疊處可重複取碼。如此,「木」雖先被取,但仍要假想「木」還在,保留著「一」要加上「木」的「丨」形成「十」。相同情況:
      戋=戈十(一加丨)、戈㦮=戈手(二加丨)、𢦍=戈大(ノ加丨)、𢦑=戈大大(ノノ加丨)。
  本=木一。一在木之下。木是整字支架,也在最上取碼時先取得。
     一是木先取走後,剩下的。「原則」3(不可破壞)特徵  1)不重複取碼;「木」既已被取走,自然剩下是「一」不再是「十」 。不存在所謂支架字形木的丨可重複再取的問題。

3还有一个能否把“难”字的编码改成正常编码,不用x键来参与编码,只用24个仓頡字母来编码,如“身”改成特别字首,首尾两码“竹竹”单独时“竹月山弓”
我試過把「難」碼拿掉,重新給十二難字取碼,取得的碼沒有跟其他字重碼,表示廢掉「難」是可行的。相信這「難」,是從第二代沿襲下來,爲求不干擾舊用戶的習慣而保留下來的。
您需要登錄後才可以回帖 登錄 | 注册

本版積分規則

Archiver|手機版|小黑屋|康熙字典与倉頡之友

GMT+8, 7-11-2024 11:49 PM , Processed in 0.019795 second(s), 11 queries , File On.

Powered by Discuz! X3.5

© 2001-2023 Discuz! Team.

快速回復 返回頂部 返回列表






倉頡之友 .自學倉頡輸入法    1997 - 2024   
馬來西亞    https://www.chinesecj.com
姐妹站:康熙字典網上版