Great Circle Associates

XCIN Mail-list
(January 2001)


Indexed By Date: [Previous] [Next] Indexed By Thread: [Previous] [Next]

Subject: Re: bims.c比較好點的patch版..
From: thhsieh@tlug.sinica.edu.tw
Date: Thu, 11 Jan 2001 00:49:46 +0800
To: xcin@linux.org.tw
Delivered-To: xcin-gate@tlug.sinica.edu.tw
Delivered-To: xcin-list@tlug.sinica.edu.tw
Reply-To: xcin@tlug.sinica.edu.tw
User-Agent: Mutt/1.2.5i

: 嗯 小弟我剛才又改了一下bims.c
: 這次改的比較完善了 也能避開大多數的破音字同詞頻的問題
: 我本來的改法只是改成每次都傳回字序中的第一個字
: 但這樣的話就喪失了原有詞頻的好處
: 所以現在改成如果選出來詞頻最高的字是破音字(有兩個以上的音)  
: 那就送出原字序的第一個
: 如果不是破音字的話就還是送出詞頻最高的字
: 剛才測試了一下,像"快","或"這些都沒問題
: 一般的字也都能選出出現頻率較高的
: 效果還不錯,請居士大大看看..^^
: 應該可以作為libtabe沒有完全改進前的緩衝用途

Hello, 這個 patch 我看過了,並做了一點修改,主要是改
進一點點 performance 而已,已進入 CVS 了,謝謝您 :-))

我想以後可能真的要做破音字各讀音的音頻資料了。這需要
一個語料庫才行。我想等我們的填補工作、加詞、刪詞、修
補等進行差不多了,需要重算詞頻的時候,再一起來弄吧 :-))


T.H.Hsieh

To Unsubscribe: send mail to majordomo@linux.org.tw
with "unsubscribe xcin" in the body of the message


Indexed By Date Previous: Re: tsi.src的一些bug...
From: thhsieh@tlug.sinica.edu.tw
Next: [hidetoshi.tajima@eng.sun.com: Re: IMdkit/onthespot method for xvim]
From: Tung-Han Hsieh <thhsieh@twcpro.phys.ntu.edu.tw>
Indexed By Thread Previous: Re: tsi.src的一些bug...
From: thhsieh@tlug.sinica.edu.tw
Next: [hidetoshi.tajima@eng.sun.com: Re: IMdkit/onthespot method for xvim]
From: Tung-Han Hsieh <thhsieh@twcpro.phys.ntu.edu.tw>