在任意字符集下正常显示网页的方法

上一篇 / 下一篇  2006-11-10 09:15:11

通常情况下,我们的网页要指定一个编码字符集,如 GB2312、UTF-8、ISO-8859-1 等,这样我们就可以在网页上显示我们指定编码的文字了。但是我们很可能会遇到这种情况,那就是我们可能希望在 ISO-8859-1 编码的网页上显示汉字,或者在 GB2312 编码的网页上显示韩文等。当然一种解决办法就是我们不用 ISO-8859-1 或者 GB2312 编码,而统统都采用 UTF-8 编码,这样我们只要在这种编码下,就可以混合显示各国文字了,这是现在很多网站采用的方法。
j+M(H#VG |b~0
2p,W H.`-Gv+|0而我这里所说的并非上面这种方法,因为上面这种方法必须要指定字符集为 UTF-8 才可以,一旦用户手工指定为其他字符集,或者可能因为某些原因,那个字符集设置没起作用,而浏览器又没有正确自动识别的话,我们看到的网页还是乱码,尤其是在某些用框架作的网页中,某个框架中的页面如果字符集设置没起作用,在 firefox 中显示乱码而且还没法改变(我是说在不装RightEncode插件的情况下)。PHPChina 开源社区门户B'Z+F"MnD

Xt._$W%{)GB }w/?0而我这里介绍的方法即使是把网页指定为 ISO-8859-1 字符集,也能够正确显示汉字、日文等。原理很简单,就是把除了 ISO-8859-1 编码中前128个字符以外的所有其他的编码都用 NCR(Numeric character reference) 来表示。比如“汉字”这两个字,如果我们写成“汉字”这种形式,那么它在任意字符集下都可以正确显示。根据这个原理,我写了下面这个程序,它可以把现有的网页转化为在任意字符集下都能显示的网页。你只需要指定源网页的字符集和源网页,点提交按钮,就可以得到目标网页了。你也可以只转化某些文字,只需要把文字填写到文本框中,并指定这些文字原来的字符集,点提交按钮,就会在页面上面显示编码后的文字了。另外我还编写了 WordPress 的插件,现在我的 Blog 已经可以在任意字符集下都能正确显示了。PHPChina 开源社区门户'QJ s8^J tmkG
PHPChina 开源社区门户;K-t.k"IZ!v[;I
转化程序地址:http://test.coolcode.cn/nochaoscode/PHPChina 开源社区门户4hfc/l [0F?%nK

-V$lq/n"a2x!RM0下载: nochaoscode.phpPHPChina 开源社区门户2@.Q,sn'~i
<?php 
OMb$fB2jG0function nochaoscode($encode, $str, $isemail = false) { 
o/{3Cl_+e6P.j7z0    $str = iconv($encode, "UTF-16", $str); PHPChina 开源社区门户oD5zwQ:Wz5B
    for ($i = 0; $i < strlen($str); $i++,$i++) { 
_? B%s{0        $code = ord($str{$i}) * 256 + ord($str{$i + 1}); 
9k)igP5x Z0        if ($code < 128 and !$isemail) { 
Vi/t9T{dk&]-I0            $output .= chr($code); 
s Vj7RwQ*VJ3n-N L0        } else if ($code != 65279) { 
#? t4[ G]b5`_0            $output .= "&#".$code.";"; PHPChina 开源社区门户/g%C5~2Nsn%B3~
        } PHPChina 开源社区门户r[ Yd a-^Nh R
    } 
YK.Q)a6c[F@0    return $output; 
5nCtwrV8t1F5}0} PHPChina 开源社区门户 k(Io6b^)_*?:~6O
$encode = $_POST['encode']; PHPChina 开源社区门户%@g_!NR7ia
if ($encode == '') $encode = 'UTF-8'; PHPChina 开源社区门户U&e&Z!i(yI!A4dy
if ($_FILES['file']['size'] > 0) { PHPChina 开源社区门户"E?'~|*F$S.\;{%s w
    $data = nochaoscode($encode, file_get_contents($_FILES['file']['tmp_name'])); PHPChina 开源社区门户%Sj@q8Q*B
    header ("Content-type: application/octet-stream;"); PHPChina 开源社区门户T~'N#RQv7j
    header ("Content-length: ".strlen($data)); PHPChina 开源社区门户$sH/m T xX]]
    header ("Content-Disposition: attachment; filename=".$_FILES['file']['name']); PHPChina 开源社区门户m&s$m;M u^v
    echo $data; 
N@r{!^[0} else { PHPChina 开源社区门户*wE;hL(av
    header ("Content-type: text/html; charset=UTF-8"); PHPChina 开源社区门户*Gb2z(Kj$t
    if ($_POST['email']) { PHPChina 开源社区门户@G?-Q4Fr
        echo htmlentities(nochaoscode($encode, $_POST['email'], true)); PHPChina 开源社区门户b } dh6i3?z
    } 
.U9ggOK0f0    else { 
s&^\7@&| P0        echo htmlentities(nochaoscode($encode, $_POST['content'])); PHPChina 开源社区门户%u)|f)s'} d c0l
    } 
_x gBP2?W0?>

{:H$^*m v7Iyk0
<form enctype="multipart/form-data" method="POST">
5i M`~+g0encode: <input type="text" name="encode" value="UTF-8" /><br />PHPChina 开源社区门户Dc3y0K ]/z |9m
file: <input type="file" name="file" /><br />PHPChina 开源社区门户i j#q7{v q_+hG
<input type="submit" />PHPChina 开源社区门户e4s:m(s{lr/D
</form>
-P+E4DMKX+V0<form method="POST">PHPChina 开源社区门户&t a'zwF O [ y\
encode: <input type="text" name="encode" value="UTF-8" /><br />
oH#Pe9Z2|AE0content: <textarea name="content"></textarea><br />
q0|G}Hz0<input type="submit" />PHPChina 开源社区门户e6V~7hY
</form>
\.GB$u;|0<form method="POST">
1~BL5@nsz m0encode: <input type="text" name="encode" value="UTF-8" /><br />
}a(Tq;A)u0email: <input name="email" /><br />
)A5AItnPL:L B0<input type="submit" />PHPChina 开源社区门户-c.b1p@'?M t [9?
</form>PHPChina 开源社区门户-[[#Z.U0],m
<?php PHPChina 开源社区门户&^3wu qp
} PHPChina 开源社区门户5e` |yN[:W7U
?>
PHPChina 开源社区门户)@E:g$c7WgH)V

TAG:

 

评分:0

我来说两句

显示全部

:loveliness: :handshake :victory: :funk: :time: :kiss: :call: :hug: :lol :'( :Q :L ;P :$ :P :o :@ :D :( :)

数据统计

  • 访问量: 28502
  • 日志数: 99
  • 图片数: 1
  • 建立时间: 2006-10-25
  • 更新时间: 2007-02-06

RSS订阅

Open Toolbar