倉頡之友
康熙与倉頡
主頁 自學 倉頡字典 康熙字典體

倉頡平台2022 網上輸入法 九萬漢字

論壇 聯絡 康熙字典網上版 捐助本站

倉頡論壇

爲甚麼「长」字,微軟會取「人心卜口女」?
  • 1# Ichirou
  • 5053029-4-2021 17:02:51
昨天有網友詢問:爲甚麼「长」字,微軟會取「人心卜口女」?

顯而易見,「长」字怎麼拆,都不可能拆到「人心卜口女」,這絕對是錯碼。能取出「人心卜口女」這編碼的字形,是「镶」或「锿」。

問題是,爲甚麼會錯成這樣?

其實,微軟倉頡的取碼,Big-5以外的字(包括簡化字)都是微軟員工自行補編的,而負責的微軟員工能力不高,弄出大量錯碼,本來已司空見慣,可參見「維基敎科書」倉頡敎程的「特別注意」:
https://zh.wikibooks.org/wiki/倉頡輸入法/特別注意#微軟倉頡的編碼訛誤

不過,「金、長、門」剛好是三個順序的部首,而微軟倉頡裏的「门」字,也被誤編成「心人」——這個本應屬於「长」字的編碼。再數下去,「门」部的簡化字也有大量錯碼,例如:
闩(戈尸)、闪(戈尸一)、闫(戈尸人)、闬(戈尸一一一)、闭(戈尸一十)、问(戈尸木竹)、闯(戈尸口)

可以看出,微軟員工誤認爲「门」取碼「戈尸」(這是不對的,正確的取碼,在1999年版五代爲「中戈尸」,在1987年版五代爲「中尸」)。然後,扣除「戈尸」這字首部份,餘下的字身部份,皆是對應前方那一個字。

因此我們可以推論,微軟員工處理碼表時,不愼把碼表中一部分的漢字與對應編碼移了位。例如本來的碼表,可能長成這個樣子:
人心卜口女
人心卜口女
心人
戈尸
戈尸一
戈尸人
戈尸一一一
戈尸一十
戈尸木竹
戈尸口
戈尸弓女一

結果在微軟員工的不謹愼處理後,錯誤地移位成這樣:
人心卜口女
人心卜口女
心人
戈尸
戈尸一
戈尸人
戈尸一一一
戈尸一十
戈尸木竹
戈尸口
戈尸弓女一


於是微軟倉頡就無法以「人心卜口女」打出「镶」字,卻反而可以打出「长」字,並造成「门」部若干簡化字的一系列錯碼。
倒序瀏覽 看全部 全部回復
暫無回復,快來搶沙發
回復 收藏 淘帖