|
XCIN Mail-list
|
| Indexed By Date: [Previous] [Next] | Indexed By Thread: [Previous] [Next] |
| Subject: | Re: about xcin and addtsi.... |
| From: | thhsieh@linux.org.tw |
| Date: | Fri, 8 Dec 2000 21:51:46 +0800 |
| To: | xcin@tlug.sinica.edu.tw |
| Reply-To: | xcin@linux.org.tw |
: 之前我說錯了, 現在就是先上字頻比較高的字, : 應該是先上 "獨某音, 字頻最高的字" : 我想到的作法是, 根據詞庫以及詞庫中填的注音 : 統計每個字各種唸法出現的頻率, 用這個頻率來上字 : : 一個小問題是, 這功能是不是要放到 libtabe 中, 而不限於只在 bims 中 : 因為這看起來滿基本、常用的 是不是可以考慮一個簡單一點的做法? 例如,現在 libtabe 中已有某讀音中每個字字頻排序表,例如: ㄎㄜ4: 客 課 刻 克 .... 這是按照傳統倚天系統的順序的。然而,在 bims 中當我打 ㄎㄜ4 這個音,卻會出現 "可" 字,原因是就單詞而言,"可" 字比上述所 有的字詞頻都要高,而我們現在就要解決這個問題。 我提議的做法是,當我們輸入 ㄎㄜ4 時,如果前文沒有其他字可以 與它形成詞時,就應該去查該讀音中的字頻排序表,而將「客」抓 出來。如此,我們就不用再考慮一個字多種讀音時,各讀音的「音頻」 問題了。 還是說,在我們的詞庫中,要連這種「音頻」的資訊都建入呢? T.H.Hsieh To Unsubscribe: send mail to majordomo@linux.org.tw with "unsubscribe xcin" in the body of the message
| Indexed By Date | Previous: |
Re: 全民注音運動開始了 From: Gesctro.bbs@openbazaar.net (傑斯克洛) |
|---|---|---|
| Next: |
Re: about xcin and addtsi.... From: thhsieh@linux.org.tw |
|
| Indexed By Thread | Previous: |
Re: about xcin and addtsi.... From: Chih-Hao Tsai <hao520@yahoo.com> |
| Next: |
Re: about xcin and addtsi.... From: Chih-Hao Tsai <hao520@yahoo.com> |