馬上加入Android 台灣中文網,立即免費下載應用遊戲。
您需要 登錄 才可以下載或查看,沒有帳號?註冊
x
本帖最後由 bombduck 於 2026-6-8 09:51 編輯
OpenCC 是一個可被 C 和 Python 呼叫的簡轉繁套件,但是光是單字的轉換都會有些讓人難以忍受的錯誤,原因就是它的字表有很多繁簡共用文字,而且這些文字還會從常用的變成不常用的。我從教育部下載了字典,對這些字分類了一下,如果有版友會用 OpenCC,從些字表應該能派上用場。另外,OpenCC 也有詞彙轉換表,而且詞彙轉換比單字轉換優先,所以就算拿掉單字也不用擔心這些字完全不會被轉到。
純簡體 OpenCCS
其實是指沒有在字典出現的字,我不知道是不是真的純簡體字,而且有幾個字還是會在繁體書本掃到。共 3480 個字。
異體字 OpenCCV
在字典有出現,但被標為異體字,有些是繁體常用到的,如台字,有些則是繁體不常用的,如开字。這部分需要人工判斷要不要轉,但字數已經少到可以人工掃一下了。共 321 個字。
繁簡共通 OpenCCT
真的是繁簡共通的字,于、后等字都出現在這裡,但是也有些繁體少用字出現在這裡,比如厂(對應廠),因為我只看有沒有出現在字典,沒有去檢查含意和用法,所以還是人工要判斷一下。共 179 個字。
您好!您暫時不能瀏覽帖子的全部內容,請 登錄 | 沒有帳號? 註冊 |