|
XCIN Mail-list
|
| Indexed By Date: [Previous] [Next] | Indexed By Thread: [Previous] [Next] |
| Subject: | Re: [Fw: ] tsi-src2.patch....大家看一下...:) |
| From: | Pofeng Lee <pofeng@linux.org.tw> |
| Date: | Sat, 26 Aug 2000 00:22:48 +0800 (CST) |
| To: | xcin@linux.org.tw |
| Reply-To: | xcin@linux.org.tw |
> 我再舉一個例子說明為什麼不能這樣砍。假設「優惠」、「待遇」、
> 「優惠待遇」都在詞庫中,當使用者打 "you1 hui4 dai4 yu4" 時,程式
> 可以找到「優惠待遇」。但如果你把「優惠待遇」刪了,麻煩就來了
> 。「待遇」也許沒問題,但是「優惠」、「幽會」怎麼辦?當然在這
> 個例子裡,「優惠」的頻率比「幽會」高,靠頻率瞎猜也會猜對,但
> 你不會總是這麼幸運。
但是 tsi.src 有許多超長詞
# Tsi count ; Tsi length
138649 tsi.src
13097 1
75285 2
25884 3
22403 4
1179 5
529 6
213 7
56 8
3 9
人民大會堂
人民出版社
人民委員會
以上, 在語意上的確是獨立的詞 ..
但在 bimsphone 中可能是多餘的
--
Pofeng "informer" Lee, 李柏鋒, 886-928-554-335 ( 20:00-23:00 GMT+8 )
mailto:pofeng@linux.org-SPAM-tw, an_evil_anti-opensource_nerd@mobia.com.tw
Chang Gung Children's Hospital
To Unsubscribe: send mail to majordomo@linux.org.tw
with "unsubscribe xcin" in the body of the message
| Indexed By Date | Previous: |
Re: libtabe tsi.src improvement From: "Edward Lee" <edward.@kimo.com> |
|---|---|---|
| Next: |
Re: [Fw: ] tsi-src2.patch....大家看一下...:) From: Chih-Hao Tsai <hao520@yahoo.com> |
|
| Indexed By Thread | Previous: |
Re: [Fw: ] tsi-src2.patch....大家看一下...:) From: Chih-Hao Tsai <hao520@yahoo.com> |
| Next: |
Re: [Fw: ] tsi-src2.patch....大家看一下...:) From: Chih-Hao Tsai <hao520@yahoo.com> |