康熙与倉頡
倉頡之友

主頁 自學 倉頡字典 康熙字典體

倉頡平台2022 網上輸入法 九萬漢字

論壇 聯絡 康熙字典網上版 捐助本站

倉頡論壇

『自由倉頡2002』的簡體倉頡編碼
67781530兄:

雖然細明體不是標準字體,但不幸的是繁體版本和英文版本的視窗系統均採用細明體為繁體字形,這是一個不爭的事實。我們在很多公司工作,不可能安裝別的字體和輸入法,但只要我們知道倉頡的拆字原理,就可以走到那裏都可以順利輸入中文。在這裏我很多謝勤兄、施能賢、老牛兄等先生,他們倆教曉我很多倉頡拆字的難題和倉頡第三代和第五代的分別。

勤兄的第五代倉頡輸入法的好處比第三代好得多、合理得多,但在香港,第三代仍然是主流。其實我都希望兩岸三地都有一個共同的字形標準,那麼我們輸入中文都可以有一個共同的倉頡輸入法。但在這個標準未曾確立之前,看來一字多碼是比較分開三地用不同的輸入法好得多。

但如果一定要細分不同地方的輸入法的話,應該是向詞庫方面着手,因為各地的語系不同,用詞不同,生活習慣不同,自然詞庫方面有不同的需求,否則詞庫太大,會令電腦記憶體耗用太多而出現當機等現象。


四方木。
  • 12# 老牛
  • 7-7-2003 20:07:18
非常感謝各位的開導和指點。

個人上述曾提及的六個一時無法輸入的簡体漢字,終於找到了相關的倉頡碼,由於個人所學不精,是花了很多時間才找到的。現列出如下,祈請多加指點:

(1)「冢」 倉頡碼(月一尸人),(B M S O)。

     「自由倉頡」採用 (月一一人),(B M M O)。

     「自倉」以下兩個字都用相同字碼(月一一人):

     「冢」,用(B M M O)
     「冡」,用(B M M O)

      也不知這些字碼是否都正確?  

(2)「刭」 倉頡碼是(弓一中弓),(NMLN)。
      
      這是「自剄」的「刭」。

      「自由倉頡」取(一一中弓),(MMLN),

       一碼之差,相信是誤用繁体碼。

(3)「怼」 倉頡碼是(水戈心),(EIP)。
      
      這是「懟恨」的「怼」。
      
      「自由倉頡」取(廿戈心),(TIP)。
      
      一碼之差,相信也是誤用繁体碼。

(4)「笾」 倉頡碼是(竹卜大尸),(HYKS)。

      這是「籩」的簡化字「笾」。

      「自由倉頡」取(竹卜竹尸),(HYHS)。

      一碼之差,相信是誤用繁体碼。

(5)「舄」 倉頡碼是(竹難心火),(HXPF)。
   
      「自由倉頡」取(竹難女火),(HXVF)。
               
       也是一碼之差,原因不詳。

      推測可能和有兩個類似字有關:
     「舃」(竹難卜火),(HXYF)。
     「舄」(竹難心火),(HXPF)。

(6)「飘」的倉頡碼是 (一火竹弓大),(MFHNK)。

     「自由倉頡」字碼取(一田竹弓大),(MWHNK)。

     這個字的第二碼取(田)(W),是很難理解。

     個人推測可能是錯誤的編碼?或者另有其它理由?  

這些字碼找出僅供參考,如果採用自由倉頡的朋友要用到簡倉輸入這些字,就不必和我個人一樣花那麽多時間再去找了。

以上若有不對之處,請多加指正為盼。
謝謝。
虽然各个版本的windows都有细明体。但是标准字体只有一个。
而之所以这么多字出现了这么多的分歧,主要还是大家都把细明体当作标准来看待。
如果不以细明体为标就不会有这么多的分歧。细明体可以参考,但不应该作为标准。

否则,随便一个字体就能当标准来编码,那么X个字体不把编码人累死。
而学校里学的是标准体,编码用细明体的话,很多字是死记硬背出来的,不是拆出来的~~~~~~~~~~

如果要增加一字多码,那也是相当累人的。有些字都是远看一样,近看差别大。最后会导致重码率加大。而如果不严格按照标准字体来编码,如果只给台湾的某个字编码,没有大陆或香港的异码,那么大陆人和香港就根本不知道怎么拆,最后还得借助字典来死记硬背~~~~这样的话又增加了学习者的负担。而且,大家在学校里学的,日常生活接触的都是标准体,如果用个细明体,完全是颠覆了日常生活中的习惯,这样的输入法没有人会用。但是大家都使用仓颉的,也能看见,有些字的编码和细明体完全就是南辕北辙,其实就是做编码的也知道,不会按照细明体来编码。但是研究人就更没必要和细明体来做比较~~~~~~~~~~~

[ Last edited by 67781530 on 9-7-2003 at 04:16 PM ]
  • 14# 老牛
  • 9-7-2003 19:51:58
兄台的看法有理,我個人也很同意。

希望倉頡編碼專家們也能注意到這點。

的確,倉頡「最重要和最優先」是要根据標準字体來編碼。

「簡體字」要根据中國公布的標準簡体字來編碼。

其實朱邦復先生很多年前公布的簡倉編碼,和現在阿勤兄推行的五代簡倉字碼都是鎖定在這個方向並根据中國標準簡体字形來編碼的。

倉頡是可以對所有漢字進行合理的編碼。漢字也有許多異体字,當然編碼者也能替這些異体字編碼,並在系統允許下加入這些字碼或容錯碼,方便用戶。不過,不能用異体字的編碼來替代標準倉頡碼,而將標準倉頡碼忽略,尤其是簡体字更應依從「標準」和「規范」,否則用戶將不知何去何從。

「倉頡亂碼」並不是因為倉頡輸入法的不對或不好,而是各個倉頡編碼專家們取舍和依据的標準不同所造成。每一個倉頡用戶都會期望所有倉頡編碼專家們能看法一致,整理一套合理標準和統一的倉頡碼,讓用戶能用它來進行有效的漢字電腦輸入。

以上淺見,謝謝指點。

四方木

甚麼是標準字體?GBK-18030算不算是中國的標準字體?以「為」字為例,『為』(Unicode 70BA=GBK-18030 9EE9);『爲』 (Unicode 7232=GBK-18030 A091)。請問那一個是標準字?

又好像『術』字,正寫字中間並不是從〔木〕而是從〔朮〕的。但很可惜GBK-18030的字形是錯的。怎可以作為標準?

勤兄的輸入法,『沛』字就已經有兩個倉頡碼,一個是〔水十月〕,另一個是〔水卜中月〕,那一個才是正確的輸入碼?


四方木.
  • 16# 老牛
  • 11-7-2003 12:16:12
非常感謝四方木兄的指點。

請容個人再略加補充。

這裏「自由倉頡」編碼的討論,個人只提及「簡体字」GB2312的編碼。由於對「自倉」繁体字方面沒有進一步瞭解,不便表示看法。

個人在前文中曾提到「兩點」:

(1)簡体字倉頡編碼「最重要和最優先」是根据中國公布的標準簡体字來編   碼。
(2)其次,在系統允許下,可加入相關的異体字字碼或容錯碼,方便用戶。

這和四方木兄所說的「希望有共同字形標準」,否則暫時「一字多碼較好」的看法相同。在標準字形有爭論或統一倉頡字碼尚未建立的情况下,一字多碼,即標準碼再加上容錯碼,確是解决的方法。在「一字多碼」情况下,那一個字是誰的標準就變得不那麽重要了。個人非常同意四方木兄的看法。希望簡体字的倉頡編碼者也能注意到這一點。

再次謝謝四方木兄的指點。
12
回復 1收藏