|
XCIN Mail-list
|
| Indexed By Date: [Previous] [Next] | Indexed By Thread: [Previous] [Next] |
| Subject: | Re: bims.c比較好點的patch版.. |
| From: | thhsieh@tlug.sinica.edu.tw |
| Date: | Thu, 11 Jan 2001 00:49:46 +0800 |
| To: | xcin@linux.org.tw |
| Delivered-To: | xcin-gate@tlug.sinica.edu.tw |
| Delivered-To: | xcin-list@tlug.sinica.edu.tw |
| Reply-To: | xcin@tlug.sinica.edu.tw |
| User-Agent: | Mutt/1.2.5i |
: 嗯 小弟我剛才又改了一下bims.c : 這次改的比較完善了 也能避開大多數的破音字同詞頻的問題 : 我本來的改法只是改成每次都傳回字序中的第一個字 : 但這樣的話就喪失了原有詞頻的好處 : 所以現在改成如果選出來詞頻最高的字是破音字(有兩個以上的音) : 那就送出原字序的第一個 : 如果不是破音字的話就還是送出詞頻最高的字 : 剛才測試了一下,像"快","或"這些都沒問題 : 一般的字也都能選出出現頻率較高的 : 效果還不錯,請居士大大看看..^^ : 應該可以作為libtabe沒有完全改進前的緩衝用途 Hello, 這個 patch 我看過了,並做了一點修改,主要是改 進一點點 performance 而已,已進入 CVS 了,謝謝您 :-)) 我想以後可能真的要做破音字各讀音的音頻資料了。這需要 一個語料庫才行。我想等我們的填補工作、加詞、刪詞、修 補等進行差不多了,需要重算詞頻的時候,再一起來弄吧 :-)) T.H.Hsieh To Unsubscribe: send mail to majordomo@linux.org.tw with "unsubscribe xcin" in the body of the message
| Indexed By Date | Previous: |
Re: tsi.src的一些bug... From: thhsieh@tlug.sinica.edu.tw |
|---|---|---|
| Next: |
[hidetoshi.tajima@eng.sun.com: Re: IMdkit/onthespot method for xvim] From: Tung-Han Hsieh <thhsieh@twcpro.phys.ntu.edu.tw> |
|
| Indexed By Thread | Previous: |
Re: tsi.src的一些bug... From: thhsieh@tlug.sinica.edu.tw |
| Next: |
[hidetoshi.tajima@eng.sun.com: Re: IMdkit/onthespot method for xvim] From: Tung-Han Hsieh <thhsieh@twcpro.phys.ntu.edu.tw> |