Archive for 2014

【Ubuntu/Linux】文字檔編碼轉換

相信很多人在開啟一些「來路不明」的文字檔的時候,常常會有編碼錯誤,造成的亂碼現象,而要解決這樣的問題也很簡單,我們只需要先辨識出原本的編碼,再使用相對應的編碼進行開啟就行了, 或是,為了方便以後的開啟使用,辨識編碼以後,使用將文件使用另外一種編碼進行重新儲存也是另外一種不錯的作法。

對於未知編碼的檔案,開啟亂碼

偵測編碼

一般我們可以使用 "file" 這個程式來檢查目標檔案的編碼為何,但是當目標對象是中文的時候,問題就便得很複雜了。

我們得到了 "Non-ISO extended-ASCII text, with CRLF line terminators" ,意思為:非 ISO 規範的延伸 ASCII 文字,我們可以如此翻譯「這個文字的編碼超過 8 位元,其他的我不知道,不認識。」 那這樣怎麼辦,此路不通,只好換條路來走。
推薦大家使用另一個可以偵測編碼的程式 "enca" 這個程式在 Ubuntu 中預設是沒有安裝的,請輸入
sudo apt-get install enca 進行安裝。

我們可以看到 enca 順利的找到字型了。

開啟及更改編碼

開啟終端機輸入 gedit --encoding=gb2312 test.srt,若是仍舊會亂碼,則將 gb2312 改成 gbk,就可以了

成功開啟檔案以後,就可以另存新檔,將目前的編碼改成 "UTF-8"(預設) ,方便以後使用。
2014年1月24日 星期五
Posted by Unknown
技術提供:Blogger.

- Copyright © 迪蘭帝的聊天室 -Metrominimalist- Powered by Blogger - Designed by Johanes Djogan -