電子郵件“亂碼”現象解析及處理
當前位置:點晴教程→知識管理交流
→『 技術文檔交流 』
收到遠方友人的電子郵件,當然是一件令人高興的事,但當你滿懷欣喜地打開的時候,面對的卻是一堆亂碼,掃興之余更是著急。想必這樣的情形每一個上網的用戶都曾遇到過。的確,電子郵件的亂碼問題是困擾中文電子郵件用戶一件頭疼的事,但并非每個用戶都知道如何解決這個問題。下面筆者就從三個方面對E-mail 亂碼問題進行一下探討,同時提出具體的解決辦法。
電子郵件軟件常用的編碼方式及判別方法 要解決電子郵件亂碼的問題,我們很有必要了解一下電子郵件是如何進行編碼的,以便可以“對癥下藥”,盡快解決問題。我們知道,由于歷史原因,E-mail 只允許傳送字符,而且是7位字符的E-mail 網關時,毫無疑問地會出現問題。這些7位的E-mail 網關把漢字內碼第8位的1全部變成了0,于是形成了一些不可讀的文字。好在現在越來越多的E-mail 網關已能處理8位字符,國內更是如此。所以,直接傳送中文問題不大,但是要和國外的朋友通信就另當別論了,本文后面詳述。 為了解決E-mail 傳輸8位字符以及二進制文件的問題,出現了各種各樣的編碼方式,概括地說,可分為對E-mail 正文的編碼和對E-mail 附帶文件的編碼兩類。對E-mail 正文的編碼有Usenet 上專門針對中文的HZ 碼等,對E-mail 附帶文件的編碼則有UUENCODE,BINBEX 等。而在Internet 上標準的編碼方式卻是MIME(Multi -purpose Internet Mail Exten—sions 多用途Internet 郵件擴展),它對E-mail 傳送多媒體信息(諸如聲音、圖像、二進制文件等)進行了一系列詳細而復雜的定義,包括了對E-mail 正文的編碼和對E-mail 的附帶文件的編碼。現在絕大多數的電子郵件軟件如ENDORA、Foxmail、THE-BAT!等都支持MIME 編碼方式。 純中文方式編碼:這就是我們通常看到的一般文本,沒有經過任何編碼,任何軟件都能準確識別,因而不會出現任何亂碼(在指定了正確的字符集后)。 UUENCODE 編碼:一些較老的郵件服務器上這種編碼使用較多,目前的Ftp Mail 等服務器也是使用此編碼(如Mr—Cool 下載的文件等)。UUENCODE 編碼的主要特征是編碼首行由BeginXXX 開始,結束一行為End ,且通常其中的每一行的開始均為“M”,只要有了以上幾個特征,就能確定是UUEN—CODE 編碼。 QUOTED -PRINTABLE 編碼:該種編碼是將7FH以上的ASCII 字符(即漢字)用它對應的文字串表達出來,即如一個ASCII 編碼為0ABH 的字符,將用=AB 來代表它。它的典型特征是文本中有大量的這種用“=”來構成的符號,即=XX=XX=XX 等,只要有這種符號,即可確認。 BASE64編碼:BASE64 編碼的判斷較復雜,但它也有一個明顯的特征,由于BASE64是通過“=”來實現行對齊,因而假如你在一個排列非常規則(每行字符數相同,一般為63 個),沒有任何可識別內容的編碼,且若最后一行未滿并有一至三個“=”之類字符時即可確認它是BASE64編碼;特別的一點是,“.”不屬于BASE64 編碼后的字符,也就是說一個用BAS64正確編碼后的信件將決不可能在信體部分有“.”出現,否則就是誤編碼。 HZ 編碼:這是國外的中國人發明的一種編碼方式,它把漢字的最高位去掉,然后用一特定符號來表明哪些編碼經過了處理。這種編碼也極易識別:在它信的內容中通常會有這樣的一組符號:“~{”和“}~”,其中的內容是不可讀的(亂碼),而在這一組分界符外的都是可讀的英文字符。 Bit7碼:這并非一種編碼,而是網絡傳輸誤碼。它是由于網絡不支持8位傳輸引起的,通常在局域網的接入方案中較為常見。它跟HZ 編碼類似,只是沒有標明哪些內容是截去了最高位的,識別辦法跟HZ 類似,如果一段信件中英文部分是正常的話,即為此種誤碼。該種誤碼無法解碼,只能要求對方用7位編碼(如以上的各種編碼)重新發送。 由此可見,我們一旦知道了郵件的編碼方式后,就可以使用相對應的解碼軟件將其解開。 E-mail 出現亂碼的最根本原因就在于:編碼與解碼方式的不一致。當你收到一封充滿亂碼的E-mail 時怎么辦呢?自己如何動手進行解決呢?下面我們來分析一下這方面的原因及解決方法。 E-mail 亂碼的種類、產生原因及解決方法 1、中文內碼不一致的“亂碼”,最為常見的是BIG5碼與GB碼 現象:信件內容有空格、日文、偏旁部首、個別漢字等等。 原因:這種“亂碼”是由于發信的計算機的中文內碼不是國標碼(GB)所造成的,如香港、臺灣地區和海外使用的漢字系統多數是BIG5碼。如果用此內碼發送中文信件,國內使用的國標碼的用戶閱讀時就會出現“亂碼”現象。 解決方法一:在系統上加掛多內碼語言顯示平臺,如四通利方的RichWin97(http ://www.srsnet .com)、南極星1.60(http ://www.njstar .com)、Magic Win98(http ://www.jtwin .coom.my/magicein)及兩岸通都是不錯的選擇。 解決方法二:選用支持BIG5碼與GB碼轉換功能的E-mail 軟件,如Fox—mail、方正飛揚等,缺點是有時效果不是很理想。 2、部分亂碼 現象:收到的郵件中有的句子能正常顯示,但是有的句子仍出現“亂碼”。 原因一:發信人在輸入漢字時不留意輸入了某個控制鍵或者折行不正確,產生半個漢字的現象。眾所周知,在計算機里,漢字是由兩個字節組成的,如果不正確地折行,前一行最后一個字的前半部分留在本行,而后半部分則被折到了下一行。結果,后半部分與后面一個字的前半部分組成了一個新的漢字,如此類推,于是,整行漢字就成了天書。 解決方法:將郵件保存,用Word、WPS97等文字處理軟件在漢字與亂碼之間插入一個空格或者刪除一個“亂碼”字符。這樣,郵件內容雖然少了一個字,但剩下的部分恢復正常,況且我們憑上下文也可基本猜到這個字了。 原因二:E-mail 軟件(尤其是英文軟件)以及郵件傳輸過程中也可能造成這種不正常的折行。英文E-mail 軟件的自動折行是依據英文單詞間的空格來判斷的,但中文卻沒有空格。因此,E-mail 軟件在進行折行處理時,出錯就在所難免了。而在E-mail 的傳輸過程中,E-mail 網關對長行的處理方法也不盡相同,有時會使行末的半個漢字丟失,從而造成了半漢字現象。 解決方法:要徹底解決這個問題,最好是在每個漢字后加入空格,也就是利用漢字輸入法字間加空的功能,這樣就不會出現錯誤的折行了?,F在的中文系統如RichWin 等,都提供了字間加空的選擇。 原因三:有時漢字系統調用出錯也會造成這種亂碼,盜版的漢字平臺出現這種方面問題的概率較高。 解決方法:使用正版軟件,或者將系統內碼先改為BIG5,這時看到全文“亂碼”,再將內碼改為國標碼即可;或者重新調用漢字系統。 3、附件采用MIME 格式的“亂碼” 現象:看到的信件內容全是大小寫英文字母而且字符排列很整齊。 原因:之所以造成這種“亂碼”,原因是發信人的E-mail 軟件設置中使用的不全是8位格式,而且MIME 格式所造成的。 解決方法:將自己的E-mail 軟件的附件格式設置成MIME 格式再閱讀信件。 4、七位碼的中文“亂碼” 現象:看到的信件內容全是大小寫英文字母中間還有西文大括號。 原因:發信者的E-mail 軟件設置中使用的是7位格式。 解決方法:通知對方重發郵件。 5、UNEDCODE 類型的“亂碼” 說明:其實,嚴格來說不能將其稱為亂碼,但是許多網友(尤其是一些網上新手)在面對這儼如天書的UNENCODE 編碼的郵件時,往往無所適從,所以在此筆者也把它歸為“亂碼”了。 原因:時下,許多網友喜歡用Mr .COOL“下載”軟件,或者中間通過E-mail 索取軟件,而這些FTP Mail 服務器采用的是UNEDCODE 編碼,所以接到的郵件就是一些文不成書的怪字符了。 解決方法一:選用支持UNENCODE解碼功能的E-mail 軟件,如ENDORA、THEBAT!等; 解決方法二:用Wincode、WinZip6.3等軟件解碼。對于拆分的郵件必須分別保存,然后將它們用DOS 的Copy 命令合成為一個以*.uu 為擴展名的文件,具體操作如下:copy 文件1+文件2+…文件N 文件名.uu ,然后再用上述軟件解碼即可。 6、非上述原因造成的“亂碼” 現象:郵件的全文皆為亂碼。 原因:E-mail 軟件或郵件傳輸出錯所造成的。這種問題出現的概率不是很高,但是在目前情況下仍然存在。比如,文件太長造成文件的丟失或少了一截,你的ISP 的收發郵件的服務器出現故障等等。 解決方法:如果是發信人E-mail 軟件的問題,你可以請對方重新調整或更換一個E-mail 軟件。至于諸如服務器故障之類的原因,就不是用戶所能處理的了,最好咨詢一下你的ISP,等故障排除后,請對方重發一次。 如何向海外的朋友發送中文E-mail 方法一:這是最簡單、最直接的辦法:要求對方使用簡體中文Windows ,或者至少加掛一個多內碼語言平臺,如Rich—Win97、南極星等。但是,很顯然,這種方法不太可行。 方法二:將漢字文本轉換成圖形,在電子郵件程序中以附件的形式發送,具體可以采取以下兩種方法: 1、在Windows 的“畫圖”程序(Brush)中輸入信件的內容,然后存成一個BMP等格式的圖像文件; 2、用普通的文本編輯軟件(如Win—dows 下的記事本、寫字板、Word 等)輸入信件內容,然后用HyperSnap 等截圖軟件保存為圖像文件。 方法三:用TXT2EXE 等軟件將信件的內容制成一個可執行文件,以附件的形式發送給對方。 該文章在 2012/2/17 0:15:16 編輯過 |
關鍵字查詢
相關文章
正在查詢... |