倉頡之友
康熙与倉頡
主頁 自學 倉頡字典 康熙字典體

倉頡平台2022 網上輸入法 九萬漢字

論壇 聯絡 康熙字典網上版 捐助本站
「𤄪」和「忄」字編碼有誤? - 倉頡論壇 - 康熙字典与倉頡之友 - Powered by Discuz!



 找回密碼
 注册
查看: 36727|回復: 31

「𤄪」和「忄」字編碼有誤?

 火... [複製鏈接]
發表於 18-3-2011 14:32:53 | 顯示全部樓層 |閱讀模式
本帖最後由 鍾靈 於 18-3-2011 02:36 PM 編輯

𤄪=水_竹火_水=e_hfe,這個碼有待商榷:
     字首=氵,取碼「水」;次字首是「釆」,取碼=竹木;剩尾碼取右下角「又」,取碼「水」。全字取碼應=水_竹火_水=e_hd_e。

註:[氵{釆{廿キ丩又}}] 這個字,又祇顯示成一個點了,為甚麼?


忄=竹卜=hy,應該是=yh吧?
因「卜」比「丿」高,應先取。這裡作左而右看,並不適當,應作上而下看。
發表於 18-3-2011 15:31:44 | 顯示全部樓層
𤄪
把它放大,兄台的电脑小字看不到相信是浏览器问题,兄台用的是什么浏览器呢?操作系统是?
發表於 19-3-2011 09:13:03 | 顯示全部樓層
本帖最後由 ogik1975 於 20-3-2011 08:11 AM 編輯

瀏覽http://www.zdic.net/《漢典》之網頁
找到「𤄪」字之【倉頡】編碼:EHFE水竹火水,
「忄」:HY竹卜。是否「拆部件」有誤?
涉及「解碼準則」問題,期待「專家」探究。
看到「忄」部首【倉頡】部件:P心,
拆開成HY或YH哪一合理?然而「忄」是為「部首」
看成「獨立部件」P心就是,不必拆開。
 樓主| 發表於 21-3-2011 17:11:55 | 顯示全部樓層
本帖最後由 鍾靈 於 21-3-2011 06:08 PM 編輯

回阿勤版主,已放大到248%了,且也換了瀏覽器(IE 及 google),也改設編碼(big5 或 unicode見亂碼,改回本站用的BG18030),還是一個點。不過換用firefox卻可以看到,怪!(上傳下圖也一樣,IE 8.0 及 Google都不行,換Firefox 就可)
ehfe 字.JPG

「𤄪」的次字首是「釆」,全字取碼=e_hd_e;除非「釆」的腳跟下方的字形是連接的,一直連接到底部,否則,不應整個右邊的字身看作一個連體字,而取碼作=e_hfe。
發表於 22-3-2011 21:02:42 | 顯示全部樓層
我以為竹卜是“忄”正確,因為字首的一次分離原則很明確,先把最左的抽出來,如你你認為先抽上面的話,實際抽不出“丨”來,因為它的下部和“八”在一起。這個没問題。
    另外這個字你說的和我認為的一樣。那麼,水竹火水的編碼是誰給的呢?網友的話就不必討論了。官方的話就得反映反映。
發表於 22-3-2011 21:04:41 | 顯示全部樓層
如果是卜竹的話,就成了把右上方作字首了。倉頡輸入法的字首是最左或最上者。
發表於 22-3-2011 21:10:41 | 顯示全部樓層
有兩個字也有疑問,同樣編碼一中竹弓,𠀺𠁘。我認為這是為了避重碼,否則其編碼應為一弓金、一弓火。但銎銐𨥲三重碼,烈烮𣧛𤆉𤐱五重碼。所以雖然能一次分離字首。也沒有做。
 樓主| 發表於 4-4-2011 15:03:46 | 顯示全部樓層
本帖最後由 鍾靈 於 8-4-2011 01:42 PM 編輯

7樓所指的兩字:𠀺、𠁘,取碼:一中竹弓(mlhn)

mlhn.JPG
其實不能算有問題。連體字最多取四碼,取了第三碼「丿」後,祇剩一位尾碼,而尾筆劃在几之內的字形。又因几是一個三面包圍的字形,所以這時尾碼的包含省略原則就發揮作用,祇取几右邊的字形「」(字母=弓),就取到了几的外廓字形,而忽略了几之內的字形。這種情況跟「海」取碼=水人田卜(eowy);「甚」,取碼=廿一一女(tmmv),是一樣的。

5樓所指的「字首的一次分離原則」是自最上及最左開始,也即是自左上角開始。當拉一條虚擬線由左上角到右下角線時,這條線最先碰到的字形是「卜」不是「丿」。「忄」的字形是垂直高瘦型,所以取碼就由高而低,不是橫向婑胖型,故不能由左而右。這就是我的思路。
發表於 4-4-2011 19:32:55 | 顯示全部樓層
回復 8# 鍾靈


    對於我說的那兩個字,我認為你的解釋差不多,但也不是沒問題。另有一字:一弓竹火口。也是包圍,何其相似!你對於我說的忄的取碼的解釋,恕我直言,是强詞奪理。豈有往左上分一部分卻“不小心”把右上部分給提出來的?
發表於 4-4-2011 19:36:24 | 顯示全部樓層
照你的說法,不如這樣取,仿“小”字取碼,來個中金好了。差不多和竹卜有同樣說服力,但你那取法絕對是……
發表於 4-4-2011 19:38:37 | 顯示全部樓層
2010平臺五倉世紀碼表的中金第三重碼,即第四個字,是𡭔,與豎心旁更是如出一轍,這個怎麼解釋一下?
 樓主| 發表於 6-4-2011 23:03:03 | 顯示全部樓層
本帖最後由 鍾靈 於 7-4-2011 05:49 PM 編輯

9樓:𠁈
「𠁈」=一丨   几 乎(無鉤)口
    一丨 丿⺄ ノ?十口
對應碼=一中 竹弓 竹火十口
(連體字,取首次三尾共四碼)
應取碼=一中 竹弓(我認為應取碼)
編碼 =mnhfr
   =一弓竹火口;「一」下方的「丨」(位於第二碼),和几的「丿」漏取了(位於第三碼),我認為不正確。

-----(上述觀點不正確,見16樓修正之)-----4/7 補述。

9樓:有關字首
我們再來研究第五代手冊:
第53頁:一、字首
....
1. 凡字形可從縱向或橫向一次截然分離者,其「最左側」或「最上方」稱做字首。
第97頁:二、輸入規則
1. 名詞定義
   ①字首:凡字形可縱向或橫向一次分離者,其最左側或最上方部份稱做字首。
   ....
   ④整體字:筆畫交連不可分割的字,視為整體字。
   2. 取碼方法
      ①取碼順序:按中文書寫的習慣,由上而下,由左而右,由外而內取碼。
      ②取碼數和取碼部位:
        2-1 整體字取 1 -- 4 碼,由上到下依次取三碼,最後一碼取字尾部份。

字首的定義是最上方或最左側,但這比較適合於組合字(分體字)。一般,我們都很容易分辨左而右的並列型
組合字或上而下的重疊型組合字。一般,在找字首時,我們不用刻意分辨左而右或上而下,最容易的方式是自
左上角向右下角劃一虚線,看先碰到哪一字形便是字首。這在許多倉頡的書中都有講述。
「忄」是輔助字形,也是整體字(連體字),於是我們就看到第97頁的 2-1 :
        2-1 整體字取 1 -- 4 碼,由上到下依次取三碼,最後一碼取字尾部份。
由此,最顯易而見的,「卜」字形就是比「丿」字形來得最先被取碼。不是嗎?
圖: 心偏旁.JPG
圖中還有「㣺」,就取碼=心戈。

你把「忄」左右擴張成一個胖子來看,把它當作左右組合字了,自然認為是自左向右,應先取「丿」而不是取
「卜」了。

10樓:
在微軟的倉頡,「忄」就是取碼「中金」。但,「忄」左邊是一小豎,右邊是點,並不是左撇右捺的「八」字
形,所以取「金」實不正確。
(修正: )所謂「小」取「中金」:因為「亅丶」不是「卜」,「亅」是一個豎鉤,不是一個豎。所以,無法取「卜」,
「丨」祇能取「中」,剩下的「八」就取「金」。「小」不能取:「中金」,應取「弓金」。

11樓:
2010平臺五倉頡世紀我沒有裝。奇怪的自從我升級IE為8.0版後,有些字都祇看到碼,你說的中金第三重碼、
第四字我祇看到數字「 𡭔」,若能貼成圖傳上來看最好。或許再過一陣子,我裝了2010平臺五倉頡世
紀,能看到那個字的字形。現在我沒法回答。
 樓主| 發表於 6-4-2011 23:34:20 | 顯示全部樓層
本帖最後由 鍾靈 於 6-4-2011 11:35 PM 編輯

整體字的說明中,四點的第二、四點:
2. 雖非全部交連但形勢上為一完整個體:島焉來噩坐
4. 丶附屬於整個字形, 視為其一部份,如:寸永兔甫犬
個人認為「忄」的丨左右兩邊,其實是點(忄是心旳變形),附合上述情況。所以「忄」是整體字。
配合:  2-1 整體字取 1 -- 4 碼,由上到下依次取三碼,最後一碼取字尾部份。
由上而下,自是先取「卜」字形。
發表於 7-4-2011 13:44:13 | 顯示全部樓層
回復 13# 鍾靈

    我不一樓樓回了,一起說比較容易看。所有的圖也都在一起。    首先那三個怪字,一中竹弓的兩個和一弓竹火口的那個。依我之見恰與你相反。我將其看成包圍字。然後一弓竹火口取碼是對的,前面的分別改成𠀺一弓(廿?)金,𠁘一弓(土?)火。因為外面是連的,而裡面不連。這種字形很特殊,但和風的取碼應該相通。(試想在風字頭上加一橫一豎)
    你又拿來手冊上的一大段來講,又找了其他教材上說的“先遇到”原則。我不否認卜在“忄”中是先遇到的,但先遇到的反而成了右部,則說明字首已經在右上了,不對。所以還要分離規則起作用。至於說“金”這個輔助字形不包括兩點的這種,實在不能苟同,輔助字形以其形近而放置一起,不能變通,何有輔助字形?如廿山山月之𦮙,如田大之𡆢。此等部件不放於難部上,明證。且儿和八同為金的輔助字形。丿(川的第一筆)在川的取碼中也是按中取。而如圖中所示,這不是一個中的輔助字形。
    如果說兩點左右開立,我還真沒找到有這種部件,大陸的字體和臺港的字體都沒有吧?一般來說朝內的倒八字有,朝外的八字有,字例分別為曾的兩種寫法。但朝外的兩點沒有。即使如趙字,所有字形裡面都沒有把肖的第一筆作向外的點,有向外也是短撇。豎心旁第一筆是點,有時寫成短豎也是變通,本來是點,要不然何以稱為豎“心”旁?心即是點,不用多說。那這樣的話,衹能把它當點來看待,所以豈不是竹卜為“忄”都不對了,該改“戈”卜(或你說的卜戈?)?

    說整體和部分的關繫更沒有說服力,明明看到是分開的還不承認。那好,图中也有順字的編碼,大家都知道川分不開,可也沒有說順字取碼應為中中一金,而接受中中中金。小也是,雖然是取不到卜,但不意味着不能取碼, 竹弓戈(或依你取弓竹戈?)不也行?
    所以雖然倉頡的規則是可以解釋通,但在歧義之虙,還是要權衡一下。合理就取碼。你再看你舉的”雖非全部交連,形勢上為一整体“的例子,哪有像豎心旁這樣層次分明的?那些是指糾纏不清的情況,可分開可不分開的情況,明明可分開的就要分開。
發表於 7-4-2011 13:44:53 | 顯示全部樓層
回復 14# 960zxc
T_(11J5U`E3(M]I72H)V[_Y.jpg
 樓主| 發表於 7-4-2011 17:47:19 | 顯示全部樓層
本帖最後由 鍾靈 於 9-4-2011 09:55 AM 編輯

上面回10樓中,確是有點言不由衷,腦筋有點亂,已修正。
14樓說:「先遇到的反而成了右部」,我倒認為,整體字「忄」這個先遇到是由上而下所得的上部「丨」,重點在丨,右點、是「丶附屬於整個字形, 視為其一部份」而得「卜」字母。
還有,原本看到微軟對「忄」取「中金」,也覺較妥,因心左邊本是點,變作偏旁成「忄」,左點成小豎(抱歉,是個人依字形所示之淺見,沿用原編碼「竹卜」而取「竹」),但既然「卜」是一個字母,繁先原則下,當然取「卜」而不應放掉右點。所以纔會結論應取「卜竹」(或「卜戈」也可)。
對於「金」輔助字形應包括左右兩點,14樓的意見未必錯,但仍有商榷地方。「忄」的兩點比諸所舉例的「小」和「 𡭔」,相對地小很多,「小」和「 𡭔」的左右還不如說是兩撇,不是兩點。取「中金」較適合。
14樓說「 如果說兩點左右開立,我還真沒找到有這種部件」,也確實如是。所以,「所以豈不是竹卜為“忄”都不對了,該改“戈”卜(或你說的卜戈?)?」,這也是為何我由微軟的「中金」取碼,改支持「卜竹」(或「卜戈」也可)。
「點丶是附屬於整個字形,視為其一部份」,所以,纔有視忄為整體字的想法(雖然忄三筆劃是明顯分開)。因此,「卜戈」是更為適當。(「卜戈」也沒有編碼。)
所舉「順」,三個丨都是一般大,纔看成是並列型分體字。
再看「州」,三個[丶丨]字形都一般大,是並列型。(當然,依先生思意,會反質問我,怎麼不取作「中戈中戈」。這真的是左右並列型中的單一個區塊[丶丨]成了先右後左,不通了。)



𠀺𠁘=mlhn
𠁈=mnhfr
修正12樓對「𠁈」觀點:
「𠁈」是分體字(包圍字),14樓是正確的:
一丨几 = 字首 = 一弓(首尾碼)
乎口   = 字身 = 竹火口(首次尾碼)     (乎,無鉤)
此字,丅的丨沒有直貫穿到几內,連「乎」;取碼跟分體字「風」雷同。
而,「𠀺𠁘」兩字是整體字,上頭丅的丨是直貫通到几之內,筆劃互相交連的。
因此,「𠁈」和「𠀺𠁘」兩組取碼不同。
發現了:𣃪=一弓_卜竹尸(字身=方)。若依原本愚見,作整體字而取=一中竹弓。(𠁘、𣃪,可能真的應視作分體字,如下述①,類似於風。)
若依先生之見,至少,𠀺還是整體字(下方八視為與上相連);
至於𠁘、𣃪成了同組①:𠁘的下方是四點灬不能視作與上相連,成分體字,字身是下面的灬,取碼變成=一弓_火;



𦮙=廿山山月 (字母山和月,分別代表艹下X字形裡位於左上角右上角及右下角的筆劃,也真的祇有這個。中文字裡也祇有如此這麼一個仰和覆(月)。倉頡不借用字母山月,也就技窮了。)
𡆢=田大     (字母「大」包括字形「α」,實在也祇有這麼一個,像是無可奈何地找近似的一個字母作代表)



8樓我的解釋中,提到尾碼包含省略,舉例:
「伪」取碼=人戈大尸(oiks)
我現在發現舉例有問題(故在8樓中編輯刪除),包含省略有:
三代包含省略字形有囗、(母-÷)、冂、凵、匚、几、𠂊、乃、土、工、王、....。
五代包含省略字形有囗、(母-÷)、(瓦-丶)、(匃-人)、廿、冂、凵、匚、コ、几、𠂊、乃(取消土工王)
不論看伪的𠃌(二面包圍),或ナ和𠃌形成的三面包圍,並不在上述的包含省略的字形名單中。
所以,伪=人戈大尸,取碼是有誤的,沒有包含省略,應取=人戈大戈。

請賜教。
 樓主| 發表於 8-4-2011 14:37:24 | 顯示全部樓層
15樓有圖:
𡦹=戈竹弓口(ihnr),為何作連體字取碼?不作分體字取碼=戈弓_大口口----字首={丶几};字身=[〥〥]
請問有何高見?多謝。
發表於 8-4-2011 23:56:58 | 顯示全部樓層
回復 16# 鍾靈


       我發現這問題越討論越複雜,當然,討論多牽扯就多,也衹好耐著性子了。    先說倉頡輸入法與其他輸入法不同之處:其他輸入法是字根式,有根有字,無根難辦;倉頡輸入法是象形式,輔助字形為本,類推歸併(草字頭有幾種,都放在一起,用廿來代表)。像〇這種,倉頡碼可仿鄭碼,放在田或口下作重碼計,而不必以五難處理。而那兩個我舉的帶弧形筆劃的字卻沒有放入難部,理不通吧?不僅是這兩個字,我當初找怪字還有𢀓一中尸一,工字形加一反S。其中反S形取碼為尸,也是這個道理。沒有奇怪字根的鄭碼也以這種方式處理怪字吧?所以沒有太多“無可奈何”。倉頡和鄭碼的不同就在於,鄭碼用戶一定要問,為甚麼犬和太一樣是先寫大後寫點,倉頡裡卻編碼相反?因為倉頡取右上的點優先。為甚麼末為木十,未為十木?完整原則。按道理來講很多地方倉頡就很氣餒,然而我們要明確,鄭碼是主內,以結構嚴謹而著稱,倉頡主外,以取碼方便為優勢。這是我要說的第一點。順帶提17樓戈竹弓口,我也認為編碼不對,應為戈弓大大,道理很簡單,𡆢就是把結狀部件給了一碼——大,兩個一起,大大。
    再說那四個字,𠀺𠁘𣃪,𠁈。前三個我姑且承認其為獨體,後一個則包圍。然而這樣問題就來了,首先,倉頡規則中沒有說要成字的部件一定不能分在字身字首兩部分中,如兴,黑。墨字不是把四點看成了次字首?你說依我之見𠀺有八字也應視為與上相連,這不行,詹字可以把八字以上視為字首,興字可沒辦法。它下面沒東西。𠁅(一竹心大大)和詹比,規律幾何?前一字上部比後一字更緊凑對吧?然而前一字取碼一竹心大大,不取一土心大大,我認為也應視為包圍。這樣和𠀺𠁘𣃪就就有了可比性。而且與虎字還有了可比性。當然,虎有複合字首在內。但結構上看,我們都應該把它們看成包圍,這就一致了。其實有些“隱性”複合字首是我們常用沒有提出來的,但因為實在沒必要提,一提就太多了。𠁅(待考)和詹的上部就可以算兩個。所以倉頡的第二個特點是再把第一個特點發揮一下,組字析字方便、人性化。
    如果你不同意,我也沒辦法,我說的是憑感覺的東西,一旦和細節較了真,就沒有了自己的堅持。我前面和後面說的都算上,不敢說自己了解得對,惟有問朱先生才好定奪,哈哈。
    你由中金取忄改為卜竹、卜戈,其實也還是“支持”,不是立場。輔助字形不論大小,論形狀和空間位置的布局是否相似,所以儿和八能在一起稱金部,所以兩點向內向外就不重要了,都可以,是不是點也都可以。依小字,先取上面取不到別的,取到的是中間的亅,所以剩下的都成了金了,那和忄差不多,何必講能不能連帶上一點而成卜呢?把廿卄䒑丱?等廿部的輔助字形的關繫興此?𡭔忄等一比,立刻得出結論。剛才說不論大小,所以順也不論其中川的三豎是否一般大。忄取中金最好,如果不能,也不能先取右再取左。有的字字身大,有的字首大,所以,竹卜、戈卜也是沒問題。小是獨體無疑問,心是也無疑問,但心一變形,不是了,也無足為奇。
    閣下也不必客氣,我言辭多有不當,望海涵。所述有誤也請指出。
發表於 9-4-2011 00:02:23 | 顯示全部樓層
回復 18# 960zxc

怪字篇

怪字篇
發表於 9-4-2011 00:26:05 | 顯示全部樓層
其實我還有個字想說一下,為,因你提起伪字,我也突然有了想法。為甚麼它不可以看成包圍字,然後取碼為戈尸火呢?爲則為月竹尸火。這些都無重碼的。當然,隨便一提。
    我當初打伪字也是打了半天才知道,但現在既然習慣了,也覺得很正常。甚至有些時候打到一個字就想,為甚麼它沒有省略規則呢?具體的字等我想到再說吧。
    補充一句關於忄的,如果真的像你說的那樣取了碼,那才是個例中的個例呢。我可一個這樣的字也沒有印象。
您需要登錄後才可以回帖 登錄 | 注册

本版積分規則

Archiver|手機版|小黑屋|康熙字典与倉頡之友

GMT+8, 19-4-2024 10:41 PM , Processed in 0.023646 second(s), 11 queries , File On.

Powered by Discuz! X3.5

© 2001-2023 Discuz! Team.

快速回復 返回頂部 返回列表






倉頡之友 .自學倉頡輸入法    1997 - 2024   
馬來西亞    https://www.chinesecj.com
姐妹站:康熙字典網上版