Great Circle Associates

XCIN Mail-list
(December 2000)


Indexed By Date: [Previous] [Next] Indexed By Thread: [Previous] [Next]

Subject: Re: [devel] tsi.src-20001105
From: Kuang-che Wu <kcwu@camel.ck.tp.edu.tw>
Organization: Taipei Chien-kuo Senior High School
Date: 3 Dec 2000 03:21:48 GMT
To: xcin@tlug.sinica.edu.tw
Reply-To: xcin@linux.org.tw

Chih-Hao Tsai <hao520@yahoo.com> 提到:
> Kuang-che Wu wrote:
>> 有一類特殊的詞, 並非完整的正確的詞, 但常出現在句子的語句片斷中
> 至於像「我/要」、「好/嗎」、「為何/不」這種經常同時出現的
> 單位,或許有助於猜詞。要實驗過才知道,我不是十分確定。或可暫
> 時保留,但加註記。

> 從詞庫的角度,是該把「詞」與「詞組」分開。但從程式的角度,似
> 乎不需要分成數個檔案。以目前單一檔案的型式,應該只要用加標記
> 的方式就好了。
還有一類錯誤詞, 是大家常誤唸或誤用錯別字
這類詞是否該收錄, 又該如何收錄
a.譬如 不共戴天, 假設大家常誤用為 不共載天
  1.不共載天 非詞, 不收錄
  2.為了斷詞應用, 收錄
  3.為了像 bims 使用, 在 不共載天 這詞條上注 不共戴天 的注音
  4.或是詞條上注音還是注 不共載天 自己的唸法
b.譬如 造詣(ㄧˋ), 假設常被唸為 造ㄓˇ
  1.為了 bims 容錯猜字, 在 造詣 這詞條上加注 造ㄓˇ
  2.還是錯誤的注音不考慮

在正確性與容錯兩者之間如何取捨
或是詞庫中一樣也加註標記區別呢?
To Unsubscribe: send mail to majordomo@linux.org.tw
with "unsubscribe xcin" in the body of the message


Follow-Ups:
References:
Indexed By Date Previous: 認養_tsi.src 6000-6200
From: matini_yt@kimo.com.tw (matini)
Next: Re: [devel] tsi.src-20001105
From: thhsieh@linux.org.tw
Indexed By Thread Previous: Re: [devel] tsi.src-20001105
From: Chih-Hao Tsai <hao520@yahoo.com>
Next: Re: [devel] tsi.src-20001105
From: Chih-Hao Tsai <hao520@yahoo.com>