|
XCIN Mail-list
|
| Indexed By Date: [Previous] [Next] | Indexed By Thread: [Previous] [Next] |
| Subject: | Re: [devel] tsi.src-20001105 |
| From: | Kuang-che Wu <kcwu@camel.ck.tp.edu.tw> |
| Organization: | Taipei Chien-kuo Senior High School |
| Date: | 3 Dec 2000 03:21:48 GMT |
| To: | xcin@tlug.sinica.edu.tw |
| Reply-To: | xcin@linux.org.tw |
Chih-Hao Tsai <hao520@yahoo.com> 提到: > Kuang-che Wu wrote: >> 有一類特殊的詞, 並非完整的正確的詞, 但常出現在句子的語句片斷中 > 至於像「我/要」、「好/嗎」、「為何/不」這種經常同時出現的 > 單位,或許有助於猜詞。要實驗過才知道,我不是十分確定。或可暫 > 時保留,但加註記。 > 從詞庫的角度,是該把「詞」與「詞組」分開。但從程式的角度,似 > 乎不需要分成數個檔案。以目前單一檔案的型式,應該只要用加標記 > 的方式就好了。 還有一類錯誤詞, 是大家常誤唸或誤用錯別字 這類詞是否該收錄, 又該如何收錄 a.譬如 不共戴天, 假設大家常誤用為 不共載天 1.不共載天 非詞, 不收錄 2.為了斷詞應用, 收錄 3.為了像 bims 使用, 在 不共載天 這詞條上注 不共戴天 的注音 4.或是詞條上注音還是注 不共載天 自己的唸法 b.譬如 造詣(ㄧˋ), 假設常被唸為 造ㄓˇ 1.為了 bims 容錯猜字, 在 造詣 這詞條上加注 造ㄓˇ 2.還是錯誤的注音不考慮 在正確性與容錯兩者之間如何取捨 或是詞庫中一樣也加註標記區別呢? To Unsubscribe: send mail to majordomo@linux.org.tw with "unsubscribe xcin" in the body of the message
| Indexed By Date | Previous: |
認養_tsi.src 6000-6200 From: matini_yt@kimo.com.tw (matini) |
|---|---|---|
| Next: |
Re: [devel] tsi.src-20001105 From: thhsieh@linux.org.tw |
|
| Indexed By Thread | Previous: |
Re: [devel] tsi.src-20001105 From: Chih-Hao Tsai <hao520@yahoo.com> |
| Next: |
Re: [devel] tsi.src-20001105 From: Chih-Hao Tsai <hao520@yahoo.com> |