綁定帳號登入

Android 台灣中文網

[教程] 迅速將SUP及SUB字幕轉成SRT格式與字幕亂碼轉換簡易教學

[複製連結] 查看: 22555|回覆: 11|好評: 1
cs0910552871 | 收聽TA | 顯示全部樓層 |閱讀模式
發表於 2014-11-5 15:17
影視
下載方式: 免空

馬上加入Android 台灣中文網,立即免費下載應用遊戲。

您需要 登錄 才可以下載或查看,沒有帳號?註冊

x
本帖最後由 cs0910552871 於 2016-11-25 11:42 編輯

網路上有許多種方法可以抽取藍光原盤字幕
這是本人測試最快的方法
(可能明天又會出更好的方法...誰曉得呢?)
但有人會想要問,原盤就有字幕了
為什麼還要抽取藍光原盤字幕?


1.因為SRT字幕支援平台較廣可以再編輯成ASS、SSA、SUB...等,實用性較好,也可搭配一些專業壓制組的Bluray720p、1080p...等等

2.一部片網路上可能會有很多譯者自行翻譯的版本。好壞見仁見智,畢竟都是辛苦翻譯。不過還是台版原汁原味的字幕比較好囉!


                               
登錄/註冊後可看大圖

                               
登錄/註冊後可看大圖


首先得要有幾個工具
1.MicrosoftOffice  2003或2007 Microsoft Office Document Imaging
(2010以後的Microsoft Office好像沒MODI這個選項)
2.JAVA
3.MKVToolNix+MKVExtract或tsMuxeR
(藍光原盤可能有AACS加密問題請自行網上搜索解決)
4.BDSup2Sub.jar
5.CHSOCR.msi
6.IdxSubOcr



                               
登錄/註冊後可看大圖

                               
登錄/註冊後可看大圖


以下用Win7(64位元)做示範


第一步安裝Microsoft Office SharePoint Designer 2007

(1).Microsoft Office 2007點擊SharePointDesigner執行安裝
官網:http://www.microsoft.com/zh-tw/download/details.aspx?id=21581
Google雲端,可放心前往
SharePointDesigner.zip

1.jpg

(2).選自訂安裝
2.jpg

(3).點左鍵選擇Office 工具
3.jpg

(4).點左鍵選擇Microsoft Office Document Imaging
4.jpg

(5).點右鍵並將選項改為"全部從我的電腦執行",這步驟非常重要,如果沒有安裝MODI整個OCR無法進行下去了,官網也是有分離程式可供下載,不過沒試過有興趣者可以試試
5.jpg

(6).等安裝完執行第二步驟
6.jpg

(7).如果本身已有安裝的可以到控制台/新增移除程式/Microsoft Office 2003或2007/點右鍵變更
選擇第一個新增或移除功能
7.jpg

(8).點左鍵選擇Microsoft Office Document Imaging
8.jpg

(9).點右鍵並將選項改為"全部從我的電腦執行",這步驟非常重要,如果沒有安裝MODI整個OCR無法進行下去了,官網也是有分離程式可供下載,不過沒試過有興趣者可以試試
9.jpg

(10).等修改完執行第二步驟
10.jpg


                               
登錄/註冊後可看大圖

                               
登錄/註冊後可看大圖


第二步安裝JAVA

(1).進入網頁後直接點"同意並開始免費下載"這步驟非常重要,沒安裝更新會開不了BDSup2Sub512.jar
http://java.com/zh_TW/
11.jpg
(2).點擊執行安裝下載的檔案JavaSetup-XXXX.exe
12.jpg

(3).如果有過舊版本會通知移除,點擊解除安裝
13.jpg

(4).等待解除安裝完畢
14.jpg

(5).解除安裝完畢點下一步
15.jpg

(6).解除安裝完畢點關閉
16.jpg

(7).解除完畢後JAVA會自動安裝新版,安裝完會跑出網頁驗證,點擊驗證Java版本
17.jpg

(8).驗證完畢執行第三步驟
18.jpg

(9).沒安裝更新JAVA開啟BDSup2Sub512.jar會變成下列圖樣
19.jpg


                               
登錄/註冊後可看大圖

                               
登錄/註冊後可看大圖


第三步執行tsMuxeR(如果是光碟要先轉為BDMV或BDISO到硬碟上字幕才抽的出來)
原版光碟因為有AACS加密是無法直接轉存出來的,請自行網上搜尋相關解密程式

(1).到官網下載tsMuxeR
http://www.videohelp.com/tools/tsMuxeR

(2).執行tsMuxerGUI.exe按add(檔案資料名與檔案名最好全是純英文和數字)
20.jpg

(3).開啟BDMV資料夾,開啟STREAM資料夾, 找檔案最大的m2ts開啟
21.jpg

(4).在Tracks中PGS就是字幕檔,在此可以選取你要的字幕,以選取繁體中文字幕為例,選取25 zho(這個就是台灣繁體中文字幕),16 zho(這個是香港繁體中文字幕),如果無法分辨可以兩種都選取,其他打勾都取消,在Output處點選Demux,按Browse選擇存放的資料夾,按Stardemuxing開始擷取
22.jpg

(5).擷取中...
23.jpg

(6).擷取完畢,點擊OK
24.jpg

(7).存放的資料夾可看到一個sup檔,即可執行第四步驟
25.jpg

(8).除了上述方法也可用MKVToolNix抽取字幕,先到官網下載主程式
(如果是光碟要先轉為BDMV或BDISO到硬碟上字幕才抽的出來)
原版光碟因為有AACS加密是無法直接轉存出來的,請自行網上搜尋相關解密程式

https://www.fosshub.com/MKVToolNix.html

(9).下載完開啟mkvmerge GUI,點加入(檔案資料名與檔案名最好全是純英文和數字)
26.jpg

(10).開啟BDMV資料夾,開啟STREAM資料夾, 找檔案最大的m2ts開啟
27.jpg

(11).選取打勾想要抽取的字幕檔,選語言,點瀏覽選擇輸出位置,設定好開始合成
28.jpg

(12).執行後會花點時間
29.jpg

(13).執行完畢點確定
30.jpg

(14).看輸出資料夾會多出一個MKS檔
31.jpg

(15).開啟MKVExtractGUI2
32.jpg

(16).加入MKS檔,選取打勾要抽取的字幕檔,點Extract輸出
33.jpg

(17).看到左下角顯示Extracted OK表示輸出完畢
34.jpg

(18).看到輸出資料夾會多出3個SUP檔,即可執行第四步驟
35.jpg


                               
登錄/註冊後可看大圖

                               
登錄/註冊後可看大圖


第四步執行BDSup2Sub

(1).到官網下載BDSup2Su
http://www.videohelp.com/tools/BDSup2Sub

(2).執行BDSup2Sub,導入從藍光光碟抽取出的SUP字幕,將SUP字幕先轉換為idx
執行BDSup2Sub512.jar,點擊File再點Load
36.jpg

(3).選擇要轉換的sup檔,點擊開啟,點擊確定
37.jpg

(4).選擇想要的影片畫格速率(畫幀數),設定好點擊OK
38.jpg

(5)檢查字幕有無問題並選擇輸出方式,確認無誤即可輸出
39.jpg

(6).確認後點擊左上角File,點擊Save/Export輸出sub&idx格式
40.jpg

(7).點擊Browse選擇想要存放的資料夾,選擇字幕的語系,設定好點擊Save開始轉換
41.jpg

(8).儲存完畢會看到存放的資料夾多出sub&idx兩個檔,即可執行第五步驟
42.jpg


                               
登錄/註冊後可看大圖

                               
登錄/註冊後可看大圖


第五步執行CHSOCR.msi→IdxSubOcr

(1).先到官網下載Microsoft Office Document Imaging 中文(簡體) OCR辨識引擎
Google雲端,可放心前往
中文(簡體) OCR辨識引擎 CHSOCR.msi

(2).下載完成執行CHSOCR.msi安裝,點下一步
43.jpg

(3).點擊同意,點下一步
44.jpg

(4).安裝完成點擊關閉(請勿移除CHSOCR.msi檔,不然無法修復)
45.jpg

(5).下載解壓執行IdxSubOcr.exe
Google雲端,可放心前往。IdxSubOcr.exe

(6).解壓完點擊IdxSubOcr.exe,點擊開啟idx檔案
46.jpg

(8).選擇要轉換的idx檔,點擊開啟
47.jpg

(9).選取字幕,點擊確定
48.jpg

(10).選擇OCR語系,點擊確定
49.jpg

(11).初次OCR會有不能辨識之文字,要事後修正
50.jpg

(12).大概初校完之後點儲存srt檔案,點擊關閉(儲存的SRT檔預設會跟所轉的IDX檔同一資料夾)
51.jpg

(13).沒安裝Microsoft Office Document Imaging(MODI)會變成以下圖樣
官網也是有分離程式可供下載,不過沒試過有興趣者可以試試
52.jpg


                               
登錄/註冊後可看大圖

                               
登錄/註冊後可看大圖


上述方法能快速將SUB字幕轉換成SRT格式。會有不能辨識或錯字符號等,還是要人工檢查校對。以下是關於OCR時可能會有的錯字

(干→幹/乾)、(凶→兇)、(后→後)、(片→月)、(企→全)、(年→無)、(成→感)、(感→鳳/戚/厭/成/獻/威/戚)、(次→吹)、(住→往)、(冷→泠/玲)、(尾→尼)、(我→找)、(私→和)、(車→準)、(取→服)、(扁→肩)、(很→根/領)、(待→特/持)、(後→復/候/援)、(恨→限)、(毒→養/餐)、(胃→冑/胄)、(捕→補)、(服→取)、(東→束/衷)、(板→扳/版)、(爸→畏/蒼)、(金→全)、(舍→合)、(祂→社)、(兒→充/兌)、(芮→茵)、(剎→刑)、(咬→姣/皎)、(咪→味/昧)、(扮→拎/紛)、(沉→況)、(狂→取/往)、(佩→侃/珮)、(兒→充/兌)、(咖→叻/助)、(和→私)、(固→因)、(往→狂/柱)、(披→彼/被)、(抵→柢)、(发→髮/發)、(合→閤)、(局→侷)、(巨→鉅)、(冲→衝/沖)、(夸→誇)、(胡→鬍)、(须→鬚)、(杰→傑)、(面→麵)、(挑→桃/挑)、(扮→拎/紛)、(沉→況)、(狂→取/往)、(佩→侃/珮)、(咖→叻/助)、(和→私)、(固→因)、(往→狂/柱)、(披→彼/被)、(抵→柢)、(拘→狗/枸)、(屌→厲/屬)、(珈→咖)、(個→佃)、(哦→峨)、(啥→哈/咯)、(師→帥)、(悔→侮)、(時→暗)、(狼→狠/彥)、(班→斑)、(祕→秘)、(哪→娜)、(託→托)、(浣→況/澆)、(紓→抒)、(啤→卑/脾/睥)、(基→塞)、(強→弦/條)、(情→情/晴/債/睛)、(惜→徣/借)、(掉→拌)、(推→堆/惟/雅/誰)、(救→枚/教)、(啟→玫/敔/敵/激)、(桿→稈)、(殺→股/殼)、(爽→夷/夾/炎/灸)、(怪→隆/勝)、(猜→精/睛)、(票→栗)、(袍→抱)、(貫→貴)、(貪→肯/責/貴)、(連→達)、(麻→嘛/蔴/痳)、(掐→招)、(猝→抨)、(傅→傳)、(喂→猬、餵、畏)、(喝→曷/暍/渴/鞨/餲)、(惡→噁)、(棟→楝)、(棵→探/稞/裸)、(牌→脾)、(等→箏)、(善→喜)、(街→接/衛)、(蛛→殊/珠)、(費→資)、(崽→患/惠)、(掰→冊/辦)、(債→倩/情)、(傲→倣)、(募→墓/慕)、(塌→榻/蹋/蹈)、(搞→稿)、(搏→博)、(搆→夠/構)、(暗→時)、(概→慨)、(裡→狸/袒/里)、(準→車)、(碎→砰/砰)、(資→責/貧/費/貿)、(遊→進/游)、(跩→踐/蹊)、(彆→憋/蹩)、(撤→徹/撒)、(摸→模)、(精→猜)、(開→闆/關/閉/聞/閒)、(聞→閃/開/闈/闖)、(間→閒/閒/聞/問)、(屌→屬/厲/屎)、(賓→盲/寶)、(領→頜)、(麼→曆/磨)、(熱→熟/然)、(衝→街)、踢→賜)、(養→吞/春/餐)、(噁→嗯/唸)、(憋→懲/態)、(擋→檔)、(撿→檢)、(蕩→盪)、(踹→端)、(舞→餐/盆/鑼/氈/籮/盤)、(餐→譽/賽/參/養)、(糗→糢)、(瞭→暸)、(總→媳)、(繞→燒)、(鎮→鎖)、(騙→編)、(爛→斕)、(蠟→蟻)、(飆→颯/諷/飄)、(戀→憑/巒)、(傲→倣)→(聽→嘉).........族繁不及備載

可參考:
漢語地區用詞差異列表 - 維基百科
=同實異名 - 兩岸萌典
海峽兩岸用語對照表
中華語文知識庫
兩岸地區常用詞彙對照表


                               
登錄/註冊後可看大圖

                               
登錄/註冊後可看大圖


已有藍光原盤或DVD原盤抽取之SUB與IDX檔可用以下幾種方法轉換成SRT

1.上述的IdxSubOc
2.SubRip+SubToSrt
3.SubtitleEdit

以上方法各有優缺點。



                               
登錄/註冊後可看大圖

                               
登錄/註冊後可看大圖


字幕亂碼問題

在別處下載了字幕打開卻發現是亂碼.......
會造成亂碼幾乎都是編碼問題。
只要把GBK轉換成BIG5就行了
另外也可轉換成UnicodeUTF-8通用較為廣泛
可以簡轉繁的方法有很多,請自行網上搜索
在此介紹幾個輕便轉換程式

Google雲端:SmartGet(SMG)作者-SRT.exe
SmartGet(SMG)作者-SRT.zip (343.15 KB, 下載次數: 11)
「用Android 就來APK.TW」,快來加入粉絲吧!
Android 台灣中文網(APK.TW)

評分

參與人數 18碎鑽 +18 經驗 +1 幫助 +18 收起 理由
moaii + 1 + 1 非常讃
franklin2002 + 1 + 1 非常讃
leon4700 + 1 + 1 非常讃
女人Candy1981 + 1 + 1 非常讃
scps9516 + 1 + 1 非常讃
madqoo + 1 + 1 非常讃
Lions + 1 + 1 非常讃
zaws8569 + 1 + 1 非常讃
pikacat818 + 1 + 1 神馬都是浮雲
garylwt + 1 非常讃

查看全部評分

用Android 就來Android 台灣中文網(https://apk.tw)
回覆

使用道具 舉報

babale | 收聽TA | 顯示全部樓層
發表於 2018-6-11 12:21
你說很簡單,我看得花碌碌,工程浩大,版大               
不過還是謝謝你,畢竟沒人翻譯,沒人轉換看片就沒輒


您好!您暫時不能瀏覽帖子的全部內容,請 登錄 | 沒有帳號? 註冊
用Android 就來Android 台灣中文網(https://apk.tw)
回覆 支持 反對

使用道具 舉報

hkwildboy | 收聽TA | 顯示全部樓層
發表於 2018-6-11 08:23
很有用的教學,深入淺出,菜鳥也能明,謝謝分享.


您好!您暫時不能瀏覽帖子的全部內容,請 登錄 | 沒有帳號? 註冊
用Android 就來Android 台灣中文網(https://apk.tw)
回覆 支持 反對

使用道具 舉報

ly0110720 | 收聽TA | 顯示全部樓層
發表於 2017-10-4 21:29
這教學也太詳細,完全解決我的問題,版大太厲害


您好!您暫時不能瀏覽帖子的全部內容,請 登錄 | 沒有帳號? 註冊
用Android 就來Android 台灣中文網(https://apk.tw)
回覆 支持 反對

使用道具 舉報

綺兒寶貝 | 收聽TA | 顯示全部樓層
發表於 2016-4-30 00:05
謝謝大大分享..真的超級好用


您好!您暫時不能瀏覽帖子的全部內容,請 登錄 | 沒有帳號? 註冊
用Android 就來Android 台灣中文網(https://apk.tw)
回覆 支持 反對

使用道具 舉報

龍馬 | 收聽TA | 顯示全部樓層
發表於 2016-3-21 10:10
由 手機網頁 發佈
感覺不是很迅速捏~XD


您好!您暫時不能瀏覽帖子的全部內容,請 登錄 | 沒有帳號? 註冊
用Android 就來Android 台灣中文網(https://apk.tw)
回覆 支持 反對

使用道具 舉報

fridavic4771 | 收聽TA | 顯示全部樓層
發表於 2015-9-23 13:52
jaerry 發表於 2015-9-23 10:08
鏡像字幕轉成srt!不僅耗時!每個轉換字幕都要一一比對有無錯字!
第一次完成花了快兩天
下 ...

這種辛苦我知道,尤其校對時間軸最痛苦。如果有一定的時間軌跡調整比較簡單,要是上一句調好下一句跑掉,那要欲哭無淚。記得要加入「世界大對戰」的其他種子。放在一起網友比較好選擇下載種子。


您好!您暫時不能瀏覽帖子的全部內容,請 登錄 | 沒有帳號? 註冊
用Android 就來Android 台灣中文網(https://apk.tw)
回覆 支持 1 反對 0

使用道具 舉報

jaerry | 收聽TA | 顯示全部樓層
發表於 2015-9-23 10:08
fridavic4771 發表於 2015-4-4 23:34
我只會用到第四步「BDSup2Sub」抽出sub字幕後就沒輒了,沒想到後面還有解決的辦法,我的office是2010版的, ...

鏡像字幕轉成srt!不僅耗時!每個轉換字幕都要一一比對有無錯字!
第一次完成花了快兩天
167388833.gif 下次不幹了~哪有那麼多時間啊


您好!您暫時不能瀏覽帖子的全部內容,請 登錄 | 沒有帳號? 註冊

評分

參與人數 1碎鑽 +1 幫助 +1 收起 理由
fridavic4771 + 1 + 1 非常讃

查看全部評分

用Android 就來Android 台灣中文網(https://apk.tw)
回覆 支持 反對

使用道具 舉報

jaerry | 收聽TA | 顯示全部樓層
發表於 2015-4-16 14:53
會累死人啊!
製作一次字幕!光檢查字體的錯誤就花好多時間了
做好丟出去給別人使用!不感激就算了
還會遇到有人嫌棄耶!




您好!您暫時不能瀏覽帖子的全部內容,請 登錄 | 沒有帳號? 註冊

點評

有些會做OCR的高手,就算是上千條字幕他們也是一字一句去做校對修改,所以共勉之~ 對於有人嫌棄這點,倒是別太在意,您的辛苦大家有目共睹^^  發表於 2015-4-16 15:05

評分

參與人數 1碎鑽 +1 幫助 +1 收起 理由
cs0910552871 + 1 + 1 讚一個!

查看全部評分

用Android 就來Android 台灣中文網(https://apk.tw)
回覆 支持 反對

使用道具 舉報

fridavic4771 | 收聽TA | 顯示全部樓層
發表於 2015-4-4 23:34
本帖最後由 fridavic4771 於 2015-4-4 23:35 編輯

我只會用到第四步「BDSup2Sub」抽出sub字幕後就沒輒了,沒想到後面還有解決的辦法,我的office是2010版的,看來要加裝Microsoft Office SharePoint Designer 2007了,有時間再來慢慢研究,感謝版主的這篇教學,獲益良多。


您好!您暫時不能瀏覽帖子的全部內容,請 登錄 | 沒有帳號? 註冊

點評

有些地方有很多OCR高手,有不懂地方可以去請教他們唷^^  發表於 2015-4-9 12:17
用Android 就來Android 台灣中文網(https://apk.tw)
回覆 支持 反對

使用道具 舉報

您需要登錄後才可以回帖 登錄 | 註冊

本版積分規則