Great Circle Associates

XCIN Mail-list
(December 2000)


Indexed By Date: [Previous] [Next] Indexed By Thread: [Previous] [Next]

Subject: Re: [devel] tsi.src-20001105
From: Kuang-che Wu <kcwu@camel.ck.tp.edu.tw>
Organization: Taipei Chien-kuo Senior High School
Date: 2 Dec 2000 15:04:17 GMT
To: xcin@tlug.sinica.edu.tw
Reply-To: xcin@linux.org.tw

thhsieh@linux.org.tw 提到:
> : 另外之前討論的 "需要那些詞" 問題似乎沒有說明?
> : 譬如 人名, 地名 之類的...
> 有關要加那些詞的部分,我加了一段如下:
> ------------------------------
> 我們這次希望納入的新詞,主要以日常用語詞,以及字典上找得到的詞為主。我
> 們相信藉由這類新詞的擴充,可以增進 libtabe 猜字的正確性。至於其他的特
> 殊名詞、或不常用的人名、地名等,則暫不列入考慮,未來我們會另外想辦法來
> 處理這些特殊名詞。
有一類特殊的詞, 並非完整的正確的詞, 但常出現在句子的語句片斷中
譬如 "我不", "我要", "好嗎", "越來", "越來越" ,"為何不"
(我一時三刻想不到好的例子)
這類詞以"詞庫"的標準, 不應收錄, 因為這不是詞
但若以 bimsphone 的角度來看, 這些詞條有助於猜字(假設還是用現在的猜法的話)
因此我認為應該把這類詞從 libtabe 的詞庫抽出來,
bimsphone 自己弄一套特製化的詞庫, 專供注音猜字使用


可是從另一個角度來看, 在詞庫中加入這些詞條又有助於斷詞, 即使那不是真的詞
不曉得 Chih-Hao Tsai 兄對這個問題有何看法....
To Unsubscribe: send mail to majordomo@linux.org.tw
with "unsubscribe xcin" in the body of the message


Follow-Ups:
Indexed By Date Previous: Re: tsi.src 已完成
From: Kuang-che Wu <kcwu@camel.ck.tp.edu.tw>
Next: Re: 認養 tsi.src 2501~3000
From: thhsieh@linux.org.tw
Indexed By Thread Previous: Re: tsi.src 已完成
From: Kuang-che Wu <kcwu@camel.ck.tp.edu.tw>
Next: Re: [devel] tsi.src-20001105
From: Chih-Hao Tsai <hao520@yahoo.com>