Great Circle Associates

XCIN Mail-list
(December 2000)


Indexed By Date: [Previous] [Next] Indexed By Thread: [Previous] [Next]

Subject: Re[2]: [填補注音] 13001-14000
From: Zer Tsao <zer@technologist.com>
Date: Fri, 29 Dec 2000 15:57:13 +0800
To: xcin@tlug.sinica.edu.tw
Delivered-To: xcin-gate@tlug.sinica.edu.tw
Delivered-To: xcin-list@tlug.sinica.edu.tw
Reply-To: xcin@tlug.sinica.edu.tw

On Tue, 26 Dec 2000 08:36:56 +0800
thhsieh@tlug.sinica.edu.tw wrote:

thhsieh> : > 有沒有人玩過DOS時代的「自然輸入法」?
...
thhsieh> :   由於我一直以來都是用嘸蝦米,因此也不曉得有這種程式,能不能麻煩
thhsieh> :   Zer Tsao 先試一下,看效果如何?然後 ...,這支程式可以散佈嗎?
thhsieh> 嗯 .... 各位在填補注音時,主要是慢在什麼地方呢?
thhsieh> 是打字慢?還是要花時間去翻字典呢?
thhsieh> 如果是打字慢,那這支程式的確很有用。但我覺得就算是用程式將
thhsieh> 所有的音都填上了,最好還是將結果整個看一遍,因為多少還是會
thhsieh> 有錯誤的,並不見得是填注音的程式有問題,常常是詞庫本身有錯
thhsieh> 字、或者它原有的讀音有錯。在填補的過程中,這樣的情況屨見不
thhsieh> 顯。
thhsieh> 至於我的話,主要是花在查字典的時間。 :-))

沒有破音字的,效果不錯。但是有破音字的,沒有辦法同時提供各種破音字的注音。所以嚴格說起來,距離理想還有些距離。

至於散佈這隻程式,答案當然是否定的。因為這是商業軟體,雖然DOS版的自然注音目前已經停止單獨販售,但是在商業版的「自然注音」光碟中,還是有這套DOS版軟體。

所以,如果希望能夠完全沒有版權顧慮,XCIN應該考慮自己發展適合的工具。而需要的工具,說起來應該不難才對。

首先,我們應該先建出一個[國字-注音]的單字注音總表,這個表中應該包含各單字所有注音。破音字的所有注音並依照使用頻率加以前後安排。這個總表應該花最多的心力去完成最正確、最完整的建表。

然後,發展一支簡單的程式,自動幫沒有加上注音的詞庫檔,檢索以上建好的總表,加上正確的注音。遇有破音字者,自動以排列組合方式組出所有可能的讀音,但是另外儲存到一個破音字待審閱檔中,以利人工進行篩選。如此一來,我們要加什麼詞庫進來,都會變得很輕鬆,沒有破音字的,就自動歸到沒有問題的檔案中;剩下的只要審核瀏覽有破音字情況的檔案,做出正確的篩選即可。

同理,應該也可以應用到其他拆碼輸入法作為詞庫簡碼建檔。


敬祝
一切順心,萬事如意

──
【真心祝福●曹澤用箋】


To Unsubscribe: send mail to majordomo@linux.org.tw
with "unsubscribe xcin" in the body of the message



References:
Indexed By Date Previous: 加詞的問題
From: Tzu-hsien Yu <thyu@ck.tp.edu.tw>
Next: 不能輸入 " 這個符號 (help!)
From: cyclobenz@kimo.com.tw
Indexed By Thread Previous: Re: [填補注音] 13001-14000
From: Edward Lee <edward.@kimo.com>
Next: Re[2]: [填補注音] 13001-14000
From: Zer Tsao <zer@technologist.com>