Great Circle Associates

XCIN Mail-list
(April 2001)


Indexed By Date: [Previous] [Next] Indexed By Thread: [Previous] [Next]

Subject: Re: Commiting libtabe into SourceForge
From: thhsieh@tlug.sinica.edu.tw
Date: Sun, 29 Apr 2001 14:04:50 +0800
To: xcin@linux.org.tw
Delivered-To: xcin-gate@tlug.sinica.edu.tw
Delivered-To: xcin-list@tlug.sinica.edu.tw
Reply-To: xcin@tlug.sinica.edu.tw
User-Agent: Mutt/1.2.5i

: 剛剛也 commit 我的 source tree, 主要有兩個 update.
: 
: 1. 加了幾個讀音
:   液 (一ㄝ4)
:   行 (ㄒ一ㄥ4)
:   波 (ㄆㄛ)
: 
:   PS. 著 (ㄓㄨ4) 還不曉得怎麼加, 每個字在現在的 implement 裡最多只有四個讀
:        音, 而著不只有四個.

Hello

抱歉抱歉,拖這麼晚才回信,最近老闆交待的任務弄得我有點霧煞煞 ....

關於「著」這個字,我的建議是選其中四個最常見的讀音加進去。我想您
所加的應該是 tabe_zhi2yin.h 的地方吧?那個地方就我所知其最大的用
處應該是當 tsi.src 的詞沒有音時,才用它的表格來補注音。因此,未
來當我們慢慢將 tsi.src 的音補齊後,那個表格的重要性也就降低了 (除
非未來還有其他作用)。因此我的建議是不需要一定將該字所有的讀音都
填進去,因為這一步已經在 tsi.src 裡頭做到了。所以,既然基於程式
設計的考量,該表格中每個字只允許四個讀音,我們就最多填入四個最常
用的讀音即可。

事實上,我也打算等 tsi.src 填補完後,寫個程式讀取 tsi.src 的內容
將 tabe_zhi2yin.h 等表格更新一遍,原因是我們在填補過程中發現有些
錯誤的讀音,這些錯誤其實是承襲自古早的倚天中文而來 (因為我們的表
格就是根據倚天中文的標準產生的),我建議需要進行修正。

: 2. Chu -> chunk 現在可以處理非 big5 的 chunk.

另外,目前 libtabe 有些讀音是不能接受的,但事實上這些都是字典上
的合法讀音,例如:

蔔 ㄅㄛ5
哪 ㄋㄚ5
訥 ㄋㄜ4
作 ㄗㄨㄛ
和 ㄏㄨㄛ5
簪 ㄗㄢ
刷 ㄕㄨㄚ4
挼 ㄖㄨㄛ2

因此,我建議可以修改 tabe_yin2zhi.h 將這些讀音加進去。

ps. 我們曾在 addtsi.c 中加入一個功能。當您用 addtsi 編譯 tsi.db
    時,加入 -v 的選項,則 addtsi 就會將 tsi.src 中不合法的讀音
    詞條列出來,這時您就會見到以上七個讀音無法被 libtabe 所接受。
    我建議我們應該要修正這個部分。

    除此之外,有很多口語化的輕聲音 libtabe 也無法接受,例如:

	大姊姊    ㄉㄚ4 ㄐㄧㄝ3 ㄐㄧㄝ5
				^^^^^^^ 最後一個輕聲

    然而,因為這個輕聲音在字典中沒有正式收錄,故我建議 libtabe
    就不必理會這種情況了。但由於這樣的口語化說法滿常見的,而且
    tsi.src 未來可能會有其他用途,故如果有網友在填補注音時加入
    這樣的口語化讀法,我目前的策略是保留 (當然 libtabe 在編譯它
    時會直接忽略掉)。不過,並非所有人在填補注音過程中都那麼小心
    地加入所有的口語化讀音,故這方面可以說尚無統一且強制的做法。

ps. 目前 tsi.src 的讀音尚有若干錯誤,您在 addtsi -v 選項中可以
    見到。我這邊已經修正過了,目前正在 commit 到 sourceforge 上,
    網路速度很慢,要等一些時候  :-))


T.H.Hsieh

To Unsubscribe: send mail to majordomo@linux.org.tw
with "unsubscribe xcin" in the body of the message



Follow-Ups:
Indexed By Date Previous: Chinese input method feature idea: fix the char under cursor
From: Dan Jacobson <jidanni@kimo.FiXcomTHiS.tw>
Next: Re: FYI: lsb
From: thhsieh@tlug.sinica.edu.tw
Indexed By Thread Previous: Re: Commiting libtabe into SourceForge
From: Pai-Hsiang Hsiao <phsiao@fas.harvard.edu>
Next: Re: Commiting libtabe into SourceForge
From: Pai-Hsiang Hsiao <phsiao@fas.harvard.edu>