Great Circle Associates

XCIN Mail-list
(December 2000)


Indexed By Date: [Previous] [Next] Indexed By Thread: [Previous] [Next]

Subject: Re: about xcin and addtsi....
From: thhsieh@linux.org.tw
Date: Fri, 8 Dec 2000 21:51:46 +0800
To: xcin@tlug.sinica.edu.tw
Reply-To: xcin@linux.org.tw

: 之前我說錯了, 現在就是先上字頻比較高的字,
: 應該是先上 "獨某音, 字頻最高的字"
: 我想到的作法是, 根據詞庫以及詞庫中填的注音
: 統計每個字各種唸法出現的頻率, 用這個頻率來上字
: 
: 一個小問題是, 這功能是不是要放到 libtabe 中, 而不限於只在 bims 中
: 因為這看起來滿基本、常用的

是不是可以考慮一個簡單一點的做法?

例如,現在 libtabe 中已有某讀音中每個字字頻排序表,例如:

ㄎㄜ4:  客 課 刻 克 ....

這是按照傳統倚天系統的順序的。然而,在 bims 中當我打 ㄎㄜ4
這個音,卻會出現 "可" 字,原因是就單詞而言,"可" 字比上述所
有的字詞頻都要高,而我們現在就要解決這個問題。

我提議的做法是,當我們輸入 ㄎㄜ4 時,如果前文沒有其他字可以
與它形成詞時,就應該去查該讀音中的字頻排序表,而將「客」抓
出來。如此,我們就不用再考慮一個字多種讀音時,各讀音的「音頻」
問題了。

還是說,在我們的詞庫中,要連這種「音頻」的資訊都建入呢?


T.H.Hsieh
To Unsubscribe: send mail to majordomo@linux.org.tw
with "unsubscribe xcin" in the body of the message


Follow-Ups:
Indexed By Date Previous: Re: 全民注音運動開始了
From: Gesctro.bbs@openbazaar.net (傑斯克洛)
Next: Re: about xcin and addtsi....
From: thhsieh@linux.org.tw
Indexed By Thread Previous: Re: about xcin and addtsi....
From: Chih-Hao Tsai <hao520@yahoo.com>
Next: Re: about xcin and addtsi....
From: Chih-Hao Tsai <hao520@yahoo.com>