康熙与倉頡
倉頡之友

主頁 自學 倉頡字典 康熙字典體

倉頡平台2022 網上輸入法 九萬漢字

論壇 聯絡 康熙字典網上版 捐助本站

倉頡程式下載及技術支援

自創三碼倉五碼表爛尾,簡短心得。
  • 1# 頡論
  • 6382724-5-2021 23:02:19
本帖最後由 頡論 於 7-7-2021 12:30 PM 編輯

Github項目,詳細內容盡在項目中。

額外心得,以下皆為個人主觀:

                想有個便利版倉頡,參考過快倉(僅僅瞄過)、大新倉頡(無法適應),於是有了這個Github項目。目前冷凍中,已放置一年多,今日才上傳。有幾個問題仍存在,連體字之判定(影響大字根)、大字根邏輯化、快選按鍵未定。
               
                這個項目,可能設計的也不怎樣。想法是這樣子,常用字三碼加快選;常用字頭尾碼防忘碼;打倉五碼衝突少。大字根目前控制在五十個,可能重新設計會更好。

                簡碼舉例(只處理含四碼以上字):網,火廿女,略紐月;般,竹卜水,略斜鉤;劍,人人弓,略縱;貨,人心金,略月仰。

以上,僅作參考。
---
補充:
倉五碼來自Jackchows的倉五
Jackchows的Github
        如果是没看到Jackchows的倉五項目,幾年前找形碼輸入法就不會選倉頡了。
---
常用字三碼倉五第二版方向,
        五碼字(2.3)────
                字身整體字:字首取頭尾、字身取尾。
                字身分體字:字首取頭、字身取頭尾。

        四碼字(4、1.3、2.2)────
                整體字,前二與尾
                字身整體字:字首取頭尾、字身取尾;字首一碼、字身取頭尾。例:理,一田土、啄,口一人。
                字身分體字:字首取頭、字身取頭尾;字首一碼、字身取頭尾。例:皓,竹竹口、滅,水戈火。
倒序瀏覽 看全部 全部回復7
  • 來自 5# 頡論
  • 10-10-2021 19:15:43
錯誤修正,例:理,一土土。
  • 2# 頡論
  • 16-6-2021 11:58:31
本帖最後由 頡論 於 16-6-2021 01:46 PM 編輯

        自發文後,突有靈光一現,大字根不須有就可以符合原先的構想。不過得有些例外,大概十個以內,如:殳、刂、口為字身首碼且獨自不相連、字身數個重合字形視作整體字等等。據傳,華人各地常用字不盡相同,但應該不過七千字,不過目前沒空重新編碼。


頡論 發表於 16-6-2021 11:58 AM
自發文後,突有靈光一現,大字根不須有就可以符合原先的構想。不過得有些例外,大概十個以內,如:殳、刂 ...

设成1至3码,字首取一码,字身取首尾两码!
  • 4# 頡論
  • 20-6-2021 00:21:49
本帖最後由 頡論 於 20-6-2021 12:26 AM 編輯
龍闖中原 發表於 17-6-2021 12:30 AM
设成1至3码,字首取一码,字身取首尾两码!


字首取首码,字身取首尾两码!請看常用字
字首取尾码,字身取首尾两码!請看常用字

以上為粗淺示範,當時對常用字觀察時,不考慮此做法。
想請教兩個問題

1. 請問您如何判斷是不是整體字呢?
2. 如果是分體字,如何判斷字身是整體字還是分體字呢?

最近也想編輯自己的倉頡碼表,一直沒想到怎麼解決這個問題,幾萬個字全部用肉眼篩選不太實際,希望樓主能分享下經驗,謝謝
sowhat1124 發表於 24-5-2022 05:44 PM
想請教兩個問題

1. 請問您如何判斷是不是整體字呢?

個人見解是:至倉六為止每一代的編碼都是人工校對的,標準稍微有所搖動也不無可能。

有想過寫「倉頡實驗室」的程式,人工只需要訂下幾個規則和取部件的編碼,剩下的全字表由電腦生成。

還沒開始動工。
  • 8# 頡論
  • 16-6-2022 00:41:43
sowhat1124 發表於 24-5-2022 05:44 PM
想請教兩個問題

1. 請問您如何判斷是不是整體字呢?

        你的萬字以上思路應該與此項目不同喔,簡化太多反而失去檢字本質,我提供的連結內有指出是不到六千字的簡化。

以下淺見,僅參考。

1. 請問您如何判斷是不是整體字呢?
        1-1. 單一漢字:三碼無需處理,所以不用判斷;五碼必為分體字;四碼是主要著手點。
        1-2-1. 四碼,由於限定常用字,大部分都好判斷。遇到如「考」字,參考倉頡之友的倉頡字典,或是直接查找該字倉五碼。
        1-2-2. 或者擱置爭議當成整體字,因我認為漢字分體字多於整體字,如「牽」字。

2. 如果是分體字,如何判斷字身是整體字還是分體字呢?
        同1-2-2.,如「線」字,白水視為整體字。
---
題外:
        之前由於限定三碼,總會有那麼些重碼單組有八字以上。所以目前我是限定四碼常用字,雖然有克服單組八字,但犧牲不少打字節奏性。
        不過仍不滿意,正嘗試跳出倉頡剪字法,不是拋棄它,而是結合新思路。
回復 收藏