自創三碼倉五碼表爛尾,簡短心得。
本帖最後由 頡論 於 7-7-2021 12:30 PM 編輯Github項目,詳細內容盡在項目中。
額外心得,以下皆為個人主觀:
想有個便利版倉頡,參考過快倉(僅僅瞄過)、大新倉頡(無法適應),於是有了這個Github項目。目前冷凍中,已放置一年多,今日才上傳。有幾個問題仍存在,連體字之判定(影響大字根)、大字根邏輯化、快選按鍵未定。
這個項目,可能設計的也不怎樣。想法是這樣子,常用字三碼加快選;常用字頭尾碼防忘碼;打倉五碼衝突少。大字根目前控制在五十個,可能重新設計會更好。
簡碼舉例(只處理含四碼以上字):網,火廿女,略紐月;般,竹卜水,略斜鉤;劍,人人弓,略縱;貨,人心金,略月仰。
以上,僅作參考。
---
補充:
倉五碼來自Jackchows的倉五
Jackchows的Github
如果是没看到Jackchows的倉五項目,幾年前找形碼輸入法就不會選倉頡了。
---
常用字三碼倉五第二版方向,
五碼字(2.3)────
字身整體字:字首取頭尾、字身取尾。
字身分體字:字首取頭、字身取頭尾。
四碼字(4、1.3、2.2)────
整體字,前二與尾
字身整體字:字首取頭尾、字身取尾;字首一碼、字身取頭尾。例:理,一田土、啄,口一人。
字身分體字:字首取頭、字身取頭尾;字首一碼、字身取頭尾。例:皓,竹竹口、滅,水戈火。
錯誤修正,例:理,一土土。 本帖最後由 頡論 於 16-6-2021 01:46 PM 編輯
自發文後,突有靈光一現,大字根不須有就可以符合原先的構想。不過得有些例外,大概十個以內,如:殳、刂、口為字身首碼且獨自不相連、字身數個重合字形視作整體字等等。據傳,華人各地常用字不盡相同,但應該不過七千字,不過目前沒空重新編碼。
頡論 發表於 16-6-2021 11:58 AM
自發文後,突有靈光一現,大字根不須有就可以符合原先的構想。不過得有些例外,大概十個以內,如:殳、刂 ...
设成1至3码,字首取一码,字身取首尾两码! 本帖最後由 頡論 於 20-6-2021 12:26 AM 編輯
龍闖中原 發表於 17-6-2021 12:30 AM
设成1至3码,字首取一码,字身取首尾两码!
字首取首码,字身取首尾两码!請看常用字
字首取尾码,字身取首尾两码!請看常用字
以上為粗淺示範,當時對常用字觀察時,不考慮此做法。 想請教兩個問題
1. 請問您如何判斷是不是整體字呢?
2. 如果是分體字,如何判斷字身是整體字還是分體字呢?
最近也想編輯自己的倉頡碼表,一直沒想到怎麼解決這個問題,幾萬個字全部用肉眼篩選不太實際,希望樓主能分享下經驗,謝謝 sowhat1124 發表於 24-5-2022 05:44 PM
想請教兩個問題
1. 請問您如何判斷是不是整體字呢?
個人見解是:至倉六為止每一代的編碼都是人工校對的,標準稍微有所搖動也不無可能。
有想過寫「倉頡實驗室」的程式,人工只需要訂下幾個規則和取部件的編碼,剩下的全字表由電腦生成。
還沒開始動工。 sowhat1124 發表於 24-5-2022 05:44 PM
想請教兩個問題
1. 請問您如何判斷是不是整體字呢?
你的萬字以上思路應該與此項目不同喔,簡化太多反而失去檢字本質,我提供的連結內有指出是不到六千字的簡化。
以下淺見,僅參考。
1. 請問您如何判斷是不是整體字呢?
1-1. 單一漢字:三碼無需處理,所以不用判斷;五碼必為分體字;四碼是主要著手點。
1-2-1. 四碼,由於限定常用字,大部分都好判斷。遇到如「考」字,參考倉頡之友的倉頡字典,或是直接查找該字倉五碼。
1-2-2. 或者擱置爭議當成整體字,因我認為漢字分體字多於整體字,如「牽」字。
2. 如果是分體字,如何判斷字身是整體字還是分體字呢?
同1-2-2.,如「線」字,白水視為整體字。
---
題外:
之前由於限定三碼,總會有那麼些重碼單組有八字以上。所以目前我是限定四碼常用字,雖然有克服單組八字,但犧牲不少打字節奏性。
不過仍不滿意,正嘗試跳出倉頡剪字法,不是拋棄它,而是結合新思路。
頁:
[1]