|
XCIN Mail-list
|
| Indexed By Date: [Previous] [Next] | Indexed By Thread: [Previous] [Next] |
| Subject: | Re: about xcin and addtsi.... |
| From: | Chih-Hao Tsai <hao520@yahoo.com> |
| Organization: | Taiwan Linux User Group News Server |
| Date: | Fri, 08 Dec 2000 00:21:47 -0600 |
| To: | xcin@tlug.sinica.edu.tw |
| Reply-To: | xcin@linux.org.tw |
Kuang-che Wu wrote: > > 是說像 > 一了百了 6 [ㄧ4,ㄧ] ㄌㄧㄠ3 ㄅㄞ3 ㄌㄧㄠ3 > "ㄧ4"跟"ㄧ" 同時加權相同權重這樣不好嗎? > (單字詞直接略過不計) 主要是單字詞的問題。很多高頻單字詞剛好是破音字,在 tsi.src 裡是每個音都列在後面(正常的詞庫只列那個字作為單字詞的音)。 如果實際上很少用的音也同樣照字頻加權,那就不對了。所以本來就 不可以這樣加權。我試過用這種方式加,結果破音字的各個發音的順 序就很奇怪,頻率最高的反而不見得是常用的。我一下想不起來實際 的例子,通常是像某個高頻字有 A、B 兩個音,A 常用,B 不常用。 但那個字在某個高頻詞中,剛好就念 B。而 A 出現在比較多的詞, 但那些詞的詞頻都不夠高。所以如果單字詞的部分兩個音都用詞頻加 權,等於是把 B 多算好幾次,B 當然就贏了。除非單字詞標音的問 題能解決,不然無法避免這類結果出現。 -- Chih-Hao Tsai | ICQ#5734422 | http://www.geocities.com/hao520 To Unsubscribe: send mail to majordomo@linux.org.tw with "unsubscribe xcin" in the body of the message
| Indexed By Date | Previous: |
Re: about xcin and addtsi.... From: Kuang-che Wu <kcwu@camel.ck.tp.edu.tw> |
|---|---|---|
| Next: |
YOU CAN MAKE ALOT OF MONEY AT HOME, PART-TIME. From: friends@enterprises200iv.com |
|
| Indexed By Thread | Previous: |
Re: about xcin and addtsi.... From: Kuang-che Wu <kcwu@camel.ck.tp.edu.tw> |
| Next: |
Re: about xcin and addtsi.... From: thhsieh@linux.org.tw |