倉頡之友
康熙与倉頡
主頁 自學 倉頡字典 康熙字典體

倉頡平台2022 網上輸入法 九萬漢字

論壇 聯絡 康熙字典網上版 捐助本站

中文輸入法學術論壇

倉頡之劫
  • 11# ejsoon
  • 12-9-2014 22:44:36
本帖最後由 ejsoon 於 12-9-2014 10:48 PM 編輯

4.複合字規則的問題

(1)用詞不妥及字首概念不清晰
原本三代沒有複合字首的概念,複合字就是複合字.到了五代,把複合字分爲兩類,一是複合字首,
二又是複合字.這讓我聯想到了中共某個公開的財政預算細則[其他]類別中還有[其他].大標題
等於小標題,這讓我久久弄不清複合字和複合字首到底甚麼關係.
倉頡之友-香港的三代倉頡教程,把這些約定俗成的字首叫作[特別字首].一看概念就特別清晰.
所以我認爲五代應把複合字首稱作特別字首,並且不要和複合字歸爲一類,以免概念混淆.

(2)五代手冊中漏掉了[登]等複合字首
在五代,一些規則中未有的複合字(首),在後附的字碼表中卻成爲了複合字(首),如[凳]字.網友
鍾靈提出了八個字例.誠然我可以理解,一個完整的字形作字首可以更方便理解和取碼.但根據倉
頡的精神,地圖式拆解是不能想當然地把某部件當作整體,否則[順]字就取碼成[川+頁]了.
上文已有說明.若[登]字能成爲複合字首,那後面如[春冬]等字都要成爲複合字首,蒐羅複合字首
的工作將永無盡時.所以我認爲五代對於[凳]等字的特殊規定不可取.

(3)麻和麻有區別嗎?
當然我知道他們在倉頡機裡是完全不同的兩個字,但在普通大眾目前的電腦中文內碼裡面並沒有
區別.即使時代發展到兩者確切是不同的字了,把某個放入重碼即可,而不應該把兩個形音義都同
的字寫入其中,使規則冗雜難記.
在取碼時,麻不管作字首和單獨字,方便的字形都應爲[广木木]("方便字形"的思想,後面會講到).
在單字取碼時可以設容錯碼,但作爲字首實不應再把兩者區分.

(4)广厂系複合字首的問題
五代希望讓規則更詳盡嚴謹,但沈女士可有想過,這個思路根本就違背了倉頡初創時"無招勝有招"
之精神?

五代的複合字首中我們看到有[麻厭]二字,那在三代中約定好的其他特別字首呢?三代之所以有
這樣的"潛規則",就是希望漢字結構的定義和拆分更加準確和方便.
先舉如下例子:
鷹:[五代:广+倠+鳥][三代:䧹+鳥]
腐:[五代:广+付+肉][三代:府+肉]
歷:[五代:厂+秝+止][三代:厤+止]
從取碼方便角度而言,[鷹]字取字首[䧹]要優於[广].並且在字理上原本就是䧹的撇自然延伸包
圍下方,在拆解時當然解讀成上䧹下鳥爲佳.

五代手冊對字首的講解中我們可以讀到這個規則:"凡字首有部分向右方或下方延伸,不能截然劃
分成兩部分者,爲取碼上的方便,亦視作字首."
用上面的規則,我們便可自然推出[䧹府厤麻厭辰]等特別字首.
沈女士若意圖把規則寫周全,還須加上[府厤䧹]等特別字首,否則,[麼]字是方便了,卻苦了[歷]等字.
但我有個更好的建議:在手冊的字首篇中舉出足夠的字例即可,不必寫入特別字首規則,延續"用
少量規則處理大量漢字"的倉頡精神.

(5)還剩兩個有問題的複合字首
五代手冊的複合字首中,我衹認同[气羽]兩個,所以有問題的還有[薛合]兩位.
薛:我無法理解這麼一個不像字首的字怎麼就成了字首,那[茲兹]爲甚麼不是?如果我詳細研究,
那能夠做字首的實在是太多了!特別字首的選定,應從實用出發,並且根據規則自然生成.如[腐]
字把[府]當作特別字首,就顯得自然,易於接受,不需死記.
合:[今]字也不是可以類同?[衾念含酓盦侌貪]這麼多字都會受影響.[合]字作字首,到底消除了
多少的重碼?[盒拿龕翕].我目前沒找到更多,這些字用三代輸入並未出現重碼.也不知道[命]字
適不適用.在"規則最簡化"的原則下,[合]字絕不可能有資格作字首.
  • 12# ejsoon
  • 13-9-2014 00:11:14
5.完整原則:"並沒有兩可的情況發生"

我完全讀不懂五代手冊中的這句話."兩可"是甚麼意思?如果是"兩種可能"的意思,怎麼會沒有呢?
由:豎直取到底,剩曰;豎斷開取,剩田.
甫:十直取到底,剩月;十斷開取,剩用.
以上,不管是[由]還是[甫],取碼都有兩種可能.並且根據倉頡規則,非特殊字是不能有貫穿功能的.

五代手冊在這裡的解釋實在是毋有說服力.我並不反對[甫]字這樣取碼.在此我試圖使規則的解
釋更能讓人理解和接受:
(1)豎對於凵冂這種"薄"的部件是具有貫穿能力的.
(2)是否貫穿至底取完,要看剩餘的部分是否"完整".上面兩字取豎後剩下的部件,[田]比[曰]更
完整,[月]比[用]更完整(因爲[用]字不是一個倉頡部件,其構字需要[月手]兩碼).

通過以上兩點說明,我們能夠比看了五代手冊更深入理解了[由]和[甫]的拆解.[再弗弟庸]等字
的取碼也有了合理的解釋.如[再]字,土的上部超出冂,而因爲豎對冂是有貫穿作用的,所以我們
先取走與豎相連的[土],看看剩下的部件是否完整,冂是完整的一個倉頡碼,所以[再]的取碼是
[一土冂],而不是[一丨冂土].

這裡介紹下我對"完整原則"的一種另類的解釋:獨體字中的貫穿的豎具有可拉伸性.即把豎筆拉
伸到頭看看剩下的部件是否能成爲一個獨立且好取碼的字形.
[弗弟庸甫再由確沈央]等字的拉伸理解圖如下:
弗弟庸甫再由確沈央-拉伸圖.png

但這裡又生出個疑點,爲何[央]字的拆解不是[大冂],而是[丨冂大]?請看下面的章節.
  • 13# ejsoon
  • 13-9-2014 00:16:55
本帖最後由 ejsoon 於 14-9-2014 12:59 PM 編輯

6.特殊字還是三代的經典

我用回三代後,才覺其實特殊字[火大木]三個就足夠了,[七戈]根本是多餘的.
七:規定這個特殊字的唯一用途是[屯],但[屯]在三代就可以取碼[七凵].五代的規則入細,[七]
作特殊字後取碼遂變爲[七屮],但倉頡編碼還是一樣的,都是[心山],[凵]和[屮]都同在[山]裡面!
七在[屯]字的取碼,本身可以用[完整原則]來解釋:豎可貫穿凵,貫穿後取走[七],剩下的部件[凵]
是完整的,所以取碼[七凵].
如此,規定[七]爲特殊字仍有必要嗎?甚至會因爲[七]的特殊字地位,給一些字的拆解造成歧義,如:
未:[無特殊字取碼方法:手火][有特殊字取碼方法:十木]
毛:[無特殊字取碼方法:竹手山][有特殊字取碼方法:竹十七]

特殊字屬性介紹:某字含有特殊字字形[木]時,取碼一定要取到.

[未]字本來根據"前碼取最大"的完整原則潛在規定,正確取碼是[手火],但其所含特殊字[木]有
以上屬性,所以[木]字一定要在取碼的名單上.
特殊字[大火]並無上述屬性,例如[夫]字的取碼不爲[十大].所以我們不能說[七]也必須有這個屬
性.衹是很難在規則中將其解釋明白.



現在來解答爲何有了[完整原則],[央]字卻不被取碼爲[大冂].

這裡再補充一個特殊屬性:含特殊字[大木]的漢字,其取碼順序由[大木]的橫的位置決定.其它部
件在橫之上,則先取,在下則後取.
根據上面的屬性,我們就不難理解[未末]二字的取碼順序了.
[央]字,豎確貫穿了冂,取完大後剩下的冂也完整,符合完整原則.但冂在[大]的橫之上,冂之上又
有一豎,遂不能先取[大].正確的取碼爲[中月大].
這樣看來,特殊字在手冊上隻字不提的潛在屬性,其優先權比[完整原則]還要高!



戈:用處僅在簡化字[戋]上.我們可以用橫的長短來看出[木]在[未末]二字中的取碼順序,但無法
判斷[戈]取的是[戋]的第幾橫.在寫文過程中,又發現一字[㦮].我認爲對這些"戈型特殊字",用
完整原則來解釋,[戋=戈一],或效倣簡化钅的做法,[戋=戈戈],就不需設其爲特殊字,從而使[木
火大]這個特殊字群體得以保持完好隊型.
  • 14# ejsoon
  • 13-9-2014 00:29:19
本帖最後由 ejsoon 於 13-9-2014 12:33 AM 編輯

7.韭字左右盼

韭:[五代:中一尸一][三代:中一一一]
[尸=卜卜]這個三/五代差異下面會講,在這裡不管是[尸]還是[卜]都不影響對[韭]字取碼順序合
理性的探討.
三代先是按照人的一慣思維,既然先取了左豎,那就把連接於左豎的三橫取完,再到右部,最後底橫.
五代嚴格遵循地圖式的取碼順序,從上往下,先取左豎,再取右[卜/尸],再回到左橫,最後連體字的尾碼底橫.

(1)弱弱的連體字
韭字的獨特之處在於,它的兩邊是靠底橫連接,所以它其實是一個[弱連體],左右部分的高低沒有
如[井]一樣的網格連接.我們可以用下圖來理解三代的取碼:
韭.png

[韭]字的構形,應是[非左+非右+一],遂可理解爲[完整原則在獨體字取碼順序上的應用].
其實最重要的一點,是這隻用底橫連接的[弱連體字],若用五代方式,第一碼再到第二碼,要靠兩
豎和底橫[傳電],這根本不符合人們對[韭]字形態的常規理解,使得五代用戶在取碼時睛珠左右
往復,忙不暇接.

(2)近水樓臺先得月
倉頡連體字取碼順序就近相連潛在規則:連體字的下一個取碼應與上一個相連或較爲接近.
例證:
兜:[竹女竹山](由於下方有[儿]起了連接作用,整個字被當作連體字處理,如果按五代[韭]的思
路,那從上往下,第二碼輪到的應是[竹],即[白]的撇)
幽:[山女戈戈](如果幽爲連體字,那麼左豎折之後輪到右豎折,則正確取碼應爲[山女女戈].)

[幽]字在五代規則中仍然合理,因五代手冊裡[山]字已可作字首,可是一般人真的很難注意到這
個藏在例子中的規則,而仍把[幽]視作連體字.在三代的規則中[幽]就是連體字,這也是三/五代
難以察覺的細微差別之一.

以上,五代[韭]字取碼不妥.
  • 15# ejsoon
  • 13-9-2014 00:37:19
8.尸=卜卜=>狗尾續貂

這一節我真的很難寫,因爲道理依據全憑個人感覺,我試圖表達清晰,以獲認同.

我初始學倉頡五代,學會後用了數月時間,可以說[尸=卜卜]這個輔助字母對我而言乃先入爲主,
搶佔了認同和接受的先機.及到我嘗試使用三代,才開始思考這個輔助字形的增加是否合理.

先請看以下字例:
耳:[尸十]
乍:[五代:人尸][三代:竹尸]

及到我用了三代,眼前一亮,發現[耳-十]這個輔助字形竟然還有如此巧妙的用法,[竹尸]輕巧地
解決了[乍]的取碼問題.
[耳-十]已經存在的情況下,[卜卜]是否有必要增加?

(1)還是要動用潛規則.
[乍]在五代兩種取碼方式:
[人尸]
[竹尸]
這裡把倉五手冊[完整原則]的完整解釋摘錄如下:"若有兩個或兩個以上的符號都合於所需形狀
時,應該取形狀較完整,能保留字形特徵的一個."
於是你根本不能通過理解手冊來選擇到底是[人尸]還是[竹尸].衹好用一個潛在規定:取碼時先
取的碼應盡量佔更多的筆畫.(如[丰]字先取[手]而非[十],因先取者須佔更多筆畫)

以上歧義的產生,在潛規則的作用下消除了.但我試問,若無[卜卜]的加入,怎會有歧義產生?

(2)未發現帶來多大方便
五代手冊44頁對[卜卜]的解釋:"可以簡化像[面],[非],[乍]這一類字的取碼."
面:[五代:一田尸中][三代:一田卜中]
非:[五代:中一尸卜][三代:中一卜卜卜]
乍:[五代:人尸][三代:竹尸]
韭:[五代:中尸一一][三代:中一一一]
韱:[五代:人戈中尸一][三代:人戈中一一]

以上,在取碼數量上,[面乍韭韱]並沒有被"簡化",[非]字衹簡化字了一個取碼.如果說五代手冊
中的"簡化"不能理解爲"取碼數量",那要用怎樣的理解方式?諸如[面]字因爲取碼所佔筆畫"更全"
(所有部件均取到)所以更"簡化"?
因我學並用了五代幾個月後,轉而使用三代至今.[耳-十]和[卜]的配合在體驗上並不差,相反比
新輔助字形加入前更好.

[卜卜]在與[耳-十]輔助字形在[乍]上發生爭議的同時,還與[卜]在各種字糾纏不清.所以在我看
來,[卜卜]這個輔助字形帶來的不是方便,而是歧義.

(3)倉頡的精神:越少越好.
以下引號內爲五代手冊原文摘錄.

原文:"有人衹爲了輸入的速度,常刻意遷就,筆者認爲輸入僅爲文字功能之一,如無全面的解決方
案,本末倒置,將產生未來發展的困難."
解讀:由此可得,爲了遷就[非]字的輸入速度而加入了[卜卜]字形,將產生未來發展的困難.

原文:"其實漢字字形基因不過一百多個,亦即取碼符號.有了倉頡輸入碼,程式即可以組出字形來."
解讀:由此看得出,朱邦復前輩很是希望倉頡輸入法在輔助字形(或稱字根)上以量少作爲其特點
和優勢.

原文:"倉頡字母及輔助字形共計114個,在設計之初,即考慮到有朝一日,如果用電腦程式來認字,
所需要認的符號當然是越少越好.然而,少也要有一定的限度,至少要能令人取碼時易於分辨,不
致混淆."
解讀:衹要不影響分辨,越少越好.
  • 16# ejsoon
  • 13-9-2014 09:30:28
(4)其實有先例.
[丰]字的拆解,給了[非]字右半部的取碼帶來了先例.如果[手]裡面沒有[十十]這個輔助字形,[丰]
即取碼[十十十],那將會給[丰毛耕拜]等一系列字的取碼造成困難.所以例推[非]的右半部也
應有一個[卜卜]合二爲一.
如果衹是單純爲少輸入一個[卜]而將兩個[卜]合二爲一,我是觀迎的.但與倉頡字母[手]不同的
是,[尸]裡面已經有了一個[耳-十].如下圖:
手沒有一手.png

後來證明兩者(加上單個[卜]一共是三者)果然產生了混淆,必須用"潛規"才消除了這個混淆.如
此麻煩,卻衹是爲了[非]字少輸入一個[卜],得不償失.
各種弔長刺難度對比.png

這樣偏離倉頡發明本意的思想到後來六代有了發展.試問爲了"簡化"加入[卜卜],那[爻]的加入
是否能"簡化"[駁爽]等字的取碼?[彡]的加入是否能使[杉形修鬱]等字的取碼"簡化"?[人人]的
加入是否亦"簡化"了[檢坐兩來韱滿]等字的取碼?[口口口]是否能簡化[靈欞鑰]等字的輸入?(六
代果然增添了!!)

(5).三/五代差異,是否"越少越好"?
今臺灣90%以上使用注音,大陸99%以上使用拼音,衹有香港還保持著至少30%的倉頡使用者.
並且,香港是全世界唯一能開辨"倉頡教室"的地區,學習倉頡成爲香港教育產業中的重要科目.
倉頡的推廣和普及,很大程度依靠微軟作業系統的預裝.及現今絕大多數在個人電腦上的使用的
都是微軟倉頡.

倉頡有了新版本-五代,可是你能說三代不重要嗎?五代完全可以替代三代嗎?在朱邦復系列網站
上確實做到了這樣的替代,但個倉頡用戶群體仍以三代爲主,大部分香港用戶使用微軟視窗系統,
教用三代倉頡,證明其有龐大的用戶粘滯.
所以倉頡不宜推出"五代新版本",而應致力於"三代改良版",把三代一些錯誤更正,並細化嚴謹化
規則,而不能影響原來合理的字形系統和取碼方式.

[卜卜]輔助字型的增加,使[乍面非]等字三/五代編碼各異,並影響到[窄怎昨作祚]等常用字,在
這些字的取碼中,既沒有去掉重碼,又沒有減少取碼次數.變化是產生了,"簡化"到底在哪裡呢?
  • 17# ejsoon
  • 13-9-2014 09:35:52
9.排重的X

這其實不是五代獨有,但我認爲在編碼前加X排重不是可行的辦法.

未來可能會有更多的漢字加入,也有人分析漢字在收錄到十萬左右就應該達到極限了.如果漢字
的數量是有限的,不管後面的生僻字,別字,字型改動字有沒有被收錄,後加的字如已有編碼,就放
到重碼的位置上,使用者在頻繁用到時自然會記住它的位置.

所有在重碼位置上的字,應該享有平等的權利.我試問,編碼加了X,XX的字,其設立標準何在?依據
字頻嗎?但若過了幾年因爲某流行詞而使得某字發生變化呢?重碼字的選擇,可以有不同標準,但
不該將重碼字另設一種加X的編碼.

做五代手冊的朱邦復團隊,應更專注於標桿思想,制訂規則,實不該連重碼的解決方案也要規定,
這已經和漢字取碼方法無關了.倉頡亦作爲一種檢字法,試問,有人用倉頡碼來查字,他會知道那
個字的倉頡編碼前加了X嗎?解決重碼的問題,不同的輸入法軟體,不同的倉頡碼表製作者,有著不
同的理念.

目前網上幾乎所有的倉頡輸入法都沒有使用編碼前加X的方案,倉頡用戶更樂於即時組字選重.

一種沒有重碼的形碼是不可能存在的,這個思想要再延續下去,說不定後來會見到三個X,四個X.
  • 18# ejsoon
  • 13-9-2014 09:37:24
10.中文字母

五代有兩套中文字母,筆畫類和字型類更新.
竹戈十大中一弓:斜點交叉縱橫鈎
尸廿山女田卜  :側並仰紐方卜

即便我新學倉頡的時候選擇了五代,但我那時已經不接受五代倉頡字母.

(1)寫法不一的"字母"
新版倉頡字母有"正異體多種寫法"和"簡繁不一致"的問題.

"橫鈎紐"三個字均有較通用的異體字型:"[木黄]鉤紐(中橫不出頭)".其中"鉤"被臺灣定爲正字.
"點縱鈎側並紐"這些字對大陸地區而言是"繁體字",我前面有看過朱邦復老先生在開放文學網中
的留言,他認爲簡化字也應得到相等的待遇,這是倉頡的一貫做法.可是如果中文字母有簡繁兩套
寫法,不利於兩岸的學習與交流.就我所知,很多台灣民眾也在閱讀和觀看大陸的文學和影視作品,
倘若有大陸人做了個不錯的倉頡教程呢?他就有可能用的是簡化版倉頡字母.

原版倉頡字母並無正異體和簡繁轉換之憂.寫法唯一,才能達到作爲"字母"的標準等級.

(2)漏掉一個[卜]
新版倉頡字母中,每一個字母都對原先的"竹戈十大"作了意義的詮釋,唯獨[卜]仍是[卜].如我們
知道"仰"的輔助字型都是像"匕"一樣朝天仰的字型,那"卜"要怎麼理解呢?
如果是同一個[卜]字,我們怎知道是那一個版本的[卜]?難道要效仿英文字母的CKZ把它寫大一點
嗎?
新版倉頡字母沒有做全,不如不做.

(3)無法替代
我們看到,在五代手冊中,已經確立了以"斜點交叉"爲正的倉頡字母使用方式,但在其後又以括號
標示原倉頡字母,顯然新版無法替代舊版,卻使得倉頡字母的表述發生混亂.倉頡"一簡"與字母稱
呼在五代開始不一致,可是貼倉頡字母的鍵盤上,都是"竹戈十大"的舊版字母.

究其原因,我認爲原版的[竹戈十大]不僅具有與"一簡"對應的認知優勢,其選字顯露出朱前輩對
漢字獨特而玄妙的理解.其大多爲部件少的連體字(竹字雖非連體,然而其作爲漢字一貫以整體出
現).用人類認知學來解讀,人們更易於接受和理解有具體感受的實物."竹戈十大"就是一種"具象
",給新學者予實在的記憶體,而"斜點交叉"是抽象的概括,就沒那麼易懂了.

在倉頡教學的時候,即使教的是五代,大多數網站和教者也都使用"竹戈十大"版本的倉頡字母,恰
恰證明了"仰紐"等新版字母的表述方式普遍不被接受.
  • 19# ejsoon
  • 13-9-2014 09:38:40
11.方便字型

所謂方便,即如一個字有兩種寫法,選容易取碼的來進行編碼.
倉頡懂方便字型的例證:
[邦]:國字正確寫法首筆爲撇.倉頡現有的輔助字母都對撇與豎的[交]毫無辦法,這便是[中難竹]
產生的原因.正好[邦]字有另一種寫法,首筆爲橫,則不管平時寫字和電腦字型顯示是否首筆爲撇
,倉頡碼的拆法都預設其首筆爲橫.類似的字還有[丰彗]等.
[冒]:及到五代,並未加上[冂二]輔助字形,則[冒]在取碼時,我們理解成[方便字型],上面爲日.
類字有[曼最冕]等.

既有以上兩個例證,[急]字的方便字型應爲中橫右邊不出頭.手冊把中橫出頭[急]字編碼成了[弓
一心],其橫是不被包含的.
我的建議是,把所有帶[雪字底]的,取碼時都先選擇橫右不出頭的方便字型,這樣包含原則就用得
上.影響到的字如[蔧樰]等.這樣就不用去考慮到底倉頡取了哪個字型,到底雪字底有沒有包含.

五代手冊中把[急]字的兩種形態分別編碼,我並不認可這種行爲.這確實是地域造成的字形問題,
兩者其實爲同一字.如果把兩種[急]字看作不同的字進行編碼,那從此所有帶[雪字底]的字都會
有兩個編碼.可是五代手冊中對於[蔧]字衹有一個.不如規定統一爲可以使用[包含省略]的寫法,
體現出"方便字型"的關懷.
  • 20# ejsoon
  • 13-9-2014 09:39:37
12.仍有一些字的編碼的改動不能苟同

卑:[五代:竹田竹十][三代:竹竹十](五代規定了[十]有"與上面部件相連"的功能,殃及了"卑乃
上下結構"的常規理解.[卑]字和[干]往上相連的情況根本不同,我們不認爲[卑]是連體字.)
麵:[五代:十水一田中][三代:十弓一田中]([麥]下當然以[夕]理解爲佳,因爲其撇並沒有像[又]
字一樣左右等長.又參"方便字形".)
毋:[五代:田十竹][三代:田十](在"長撇如豎"的倉頡思維中,三代的取碼是可接受的,五代不是
要朝向"簡化"發展嗎?即使更改也應爲[田大]更好些吧?[母框]取完後就"沒有"了,不應還有截斷
剩下部件的功能.)
聚:[五代:尸水竹竹人/尸水人竹人][三代:尸水人人人](五代何必要嫌棄[人人人]的方便字形呢?)
1234.. 8下一頁
回復 2收藏 淘帖