昨天有網友詢問:爲甚麼「长」字,微軟會取「人心卜口女」?
顯而易見,「长」字怎麼拆,都不可能拆到「人心卜口女」,這絕對是錯碼。能取出「人心卜口女」這編碼的字形,是「镶」或「锿」。
問題是,爲甚麼會錯成這樣?
其實,微軟倉頡的取碼,Big-5以外的字(包括簡化字)都是微軟員工自行補編的,而負責的微軟員工能力不高,弄出大量錯碼,本來已司空見慣,可參見「維基敎科書」倉頡敎程的「特別注意」:
https://zh.wikibooks.org/wiki/倉頡輸入法/特別注意#微軟倉頡的編碼訛誤
不過,「金、長、門」剛好是三個順序的部首,而微軟倉頡裏的「门」字,也被誤編成「心人」——這個本應屬於「长」字的編碼。再數下去,「门」部的簡化字也有大量錯碼,例如:
闩(戈尸)、闪(戈尸一)、闫(戈尸人)、闬(戈尸一一一)、闭(戈尸一十)、问(戈尸木竹)、闯(戈尸口)
可以看出,微軟員工誤認爲「门」取碼「戈尸」(這是不對的,正確的取碼,在1999年版五代爲「中戈尸」,在1987年版五代爲「中尸」)。然後,扣除「戈尸」這字首部份,餘下的字身部份,皆是對應前方那一個字。
因此我們可以推論,微軟員工處理碼表時,不愼把碼表中一部分的漢字與對應編碼移了位。例如本來的碼表,可能長成這個樣子:
锿 | 人心卜口女 |
镶 | 人心卜口女 |
长 | 心人 |
门 | 戈尸 |
闩 | 戈尸一 |
闪 | 戈尸人 |
闫 | 戈尸一一一 |
闬 | 戈尸一十 |
闭 | 戈尸木竹 |
问 | 戈尸口 |
闯 | 戈尸弓女一 |
結果在微軟員工的不謹愼處理後,錯誤地移位成這樣:
锿 | 人心卜口女 |
长 | 人心卜口女 |
门 | 心人 |
闩 | 戈尸 |
闪 | 戈尸一 |
闫 | 戈尸人 |
闬 | 戈尸一一一 |
闭 | 戈尸一十 |
问 | 戈尸木竹 |
闯 | 戈尸口 |
| 戈尸弓女一 |
於是微軟倉頡就無法以「人心卜口女」打出「镶」字,卻反而可以打出「长」字,並造成「门」部若干簡化字的一系列錯碼。