Great Circle Associates

XCIN Mail-list
(December 2000)


Indexed By Date: [Previous] [Next] Indexed By Thread: [Previous] [Next]

Subject: Re: about xcin and addtsi....
From: Chih-Hao Tsai <hao520@yahoo.com>
Organization: Taiwan Linux User Group News Server
Date: Fri, 08 Dec 2000 00:21:47 -0600
To: xcin@tlug.sinica.edu.tw
Reply-To: xcin@linux.org.tw

Kuang-che Wu wrote:
> 
> 是說像
> 一了百了 6  [ㄧ4,ㄧ] ㄌㄧㄠ3 ㄅㄞ3 ㄌㄧㄠ3
> "ㄧ4"跟"ㄧ" 同時加權相同權重這樣不好嗎?
> (單字詞直接略過不計)

主要是單字詞的問題。很多高頻單字詞剛好是破音字,在 tsi.src 
裡是每個音都列在後面(正常的詞庫只列那個字作為單字詞的音)。
如果實際上很少用的音也同樣照字頻加權,那就不對了。所以本來就
不可以這樣加權。我試過用這種方式加,結果破音字的各個發音的順
序就很奇怪,頻率最高的反而不見得是常用的。我一下想不起來實際
的例子,通常是像某個高頻字有 A、B 兩個音,A 常用,B 不常用。
但那個字在某個高頻詞中,剛好就念 B。而 A 出現在比較多的詞,
但那些詞的詞頻都不夠高。所以如果單字詞的部分兩個音都用詞頻加
權,等於是把 B 多算好幾次,B 當然就贏了。除非單字詞標音的問
題能解決,不然無法避免這類結果出現。



--
Chih-Hao Tsai | ICQ#5734422 | http://www.geocities.com/hao520
To Unsubscribe: send mail to majordomo@linux.org.tw
with "unsubscribe xcin" in the body of the message


References:
Indexed By Date Previous: Re: about xcin and addtsi....
From: Kuang-che Wu <kcwu@camel.ck.tp.edu.tw>
Next: YOU CAN MAKE ALOT OF MONEY AT HOME, PART-TIME.
From: friends@enterprises200iv.com
Indexed By Thread Previous: Re: about xcin and addtsi....
From: Kuang-che Wu <kcwu@camel.ck.tp.edu.tw>
Next: Re: about xcin and addtsi....
From: thhsieh@linux.org.tw