Great Circle Associates

XCIN Mail-list
(January 2001)


Indexed By Date: [Previous] [Next] Indexed By Thread: [Previous] [Next]

Subject: 詞庫整體規畫
From: Kuang-che Wu <kcwu@ck.tp.edu.tw>
Date: Thu, 4 Jan 2001 01:38:21 +0800
To: xcin@tlug.sinica.edu.tw
Delivered-To: xcin-gate@tlug.sinica.edu.tw
Delivered-To: xcin-list@tlug.sinica.edu.tw
Reply-To: xcin@tlug.sinica.edu.tw
User-Agent: Mutt/1.2.4i

On Tue, Jan 02, 2001 at 11:14:19PM +0800, thhsieh@tlug.sinica.edu.tw wrote:
> :  學術專有名詞另做處理應該是一個方向,至於怎麼做?只有請大家
> :  討論看看了,而且也得考慮整體(xcin+libtabe)的規劃的問題。
> :  我想整體規劃可能會比較重要。
> 也許 libtabe 將來要支援多詞庫檔,如此我們就可以將這堆詞分門別類了。
話說原本 libtabe 0.2 的 TODO list 要支援 multiple database ;)

> 看大家現在有沒有想未雨綢繆,將詞庫拆成幾個檔,如:
> 1. 一般用語
> 2. 學科專有名詞
> 3. 人名、地名
> 4. Anti-LKK :-)
> 5. 成語、古彥
至少再加一類 "常用片段詞", 就是那種常輸入的非詞:)

考慮詞庫整體規畫, 我想可以把之前說的詞條來源也加上
(雖然現在比較沒有詞庫來源的問題)
詞條也加上詞性標注, 以及其他可能需要的屬性
像之前蕭大哥提出來建個 template 那樣來玩
http://www.linux.org.tw/mail-archie/xcin/xcin.200010/msg00052.html

> 還是,等我們現在的工作進行差不多了,再來考慮這個問題?
我是覺得可以先考慮, 預留欄位, 等到時候可以直接處理


To Unsubscribe: send mail to majordomo@linux.org.tw
with "unsubscribe xcin" in the body of the message



References:
Indexed By Date Previous: Re: addtsi
From: vgod.bbs@openbazaar.net (vgod)
Next: Re: 自動加詞..
From: Kuang-che Wu <kcwu@ck.tp.edu.tw>
Indexed By Thread Previous: Re: Add Tsi
From: thhsieh@tlug.sinica.edu.tw
Next: Re: Add Tsi
From: william.bbs@openbazaar.net (何陋居主)