UTF16,UTF32,UNICODE,ANSI,CP54936編碼字符串轉(zhuǎn)換工具.例如:在工具中輸入"我是中國(guó)人",UTF16,UTF32,UNICODE,ANSI,CP54936各欄中會(huì)相應(yīng)顯示對(duì)應(yīng)的編碼數(shù)據(jù).在一些開發(fā)編碼相關(guān)方面會(huì)有用到簡(jiǎn)單好用.本人就常用,很方便.感謝原作者.
CodeView怎么用?
我在工作中經(jīng)常需要查看幾個(gè)字的編碼,或者查看幾個(gè)編碼對(duì)應(yīng)的字符,所以寫了這個(gè)工具。用戶可以在文本欄輸入文本,或者在編碼欄輸入對(duì)應(yīng)的編碼。在您輸入的同時(shí),其它各欄會(huì)同步變化。輸入編碼格式是固定的:必須用兩個(gè)16進(jìn)制數(shù)字表示一個(gè)字節(jié)。每個(gè)字節(jié)用一個(gè)空格分隔。
CodeView有一點(diǎn)特色,就是用戶可以設(shè)置要顯示的代碼頁(yè)(兩個(gè)左邊有按鈕的編碼欄)。點(diǎn)擊代碼頁(yè)按鈕,在彈出的對(duì)話框選擇代碼頁(yè):
可以用編碼欄右側(cè)的保存按鈕將數(shù)據(jù)保存到文件,可以選擇是否需要加BOM。BOM的概念可以見 淺談文字編碼和Unicode(下) 的4.2.4節(jié)。如果您不熟悉UTF16-LE、UTF16-BE等概念,可以看看這篇文章的的4.2節(jié)。
請(qǐng)注意:當(dāng)某個(gè)編碼欄不支持特定字符時(shí),CodeView會(huì)顯示默認(rèn)編碼,通常是3F。
用CodeView解決“字符實(shí)體”類型亂碼
CodeView 是一個(gè)查看文本編碼的小工具。我們用它來解決這個(gè)亂碼問題。
2.1 得到CP1252字符
首先要得到命名實(shí)體對(duì)應(yīng)的亂碼,即CP1252字符。
à′DÅêÕμ½£¬D»D»
如果你的郵件已經(jīng)是這個(gè)樣子,就可以跳過這步。如果你的郵件是
À´ÐÅÊÕµ½£¬Ð»Ð»
你就新建一個(gè)文本文件,內(nèi)容如下:
À´ÐÅÊÕµ½£¬Ð»Ð»
BODY標(biāo)簽之間粘貼上要轉(zhuǎn)換的命名實(shí)體。保存到html文件,用瀏覽器打開,就可以看到:
à′DÅêÕμ½£¬D»D»
復(fù)制這些CP1252字符。
2.2 由CP1252字符得到對(duì)應(yīng)編碼
打開CodeView。CodeView有兩行是可以自己設(shè)置編碼的。把第二行設(shè)置成CP1252,將最后一行設(shè)置成CP936,即GBK。 然后把前面復(fù)制的字符粘貼到文本行
這樣就可以從CP1252行得到CP1252字符對(duì)應(yīng)的編碼文本。在CP1252行點(diǎn)右鍵,在右鍵菜單選擇“復(fù)制全部”復(fù)制這行編碼文本。
2.3 將編碼當(dāng)作GBK編碼轉(zhuǎn)換到文本
先刪除掉最后一行的文本,然后將復(fù)制的CP1252編碼文本粘貼到最后一行,即CP936行。這時(shí)在文本行就可以看到對(duì)應(yīng)的文本。
3 結(jié)束語(yǔ)
如果把CP1252編碼當(dāng)作GBK編碼,文本行還是亂碼,你可以再試試Big5,即把最后一行設(shè)置成CP950。 這種類型的亂碼郵件還是比較容易處理的,你可以自己動(dòng)手解決它。