请教Unicode的编码格式
UTF-8代表什么,如何编码?
java中的char是16位的,只能表示6万多个字符,好像汉字就有几万个吧,它怎么表示世界各国的语言字符?
好像有更多位的编码格式,但是怎么放在char里面,系统如何识别它?
这太复杂了,如果你感兴趣,可以看看
http://www.unicode.org
> UTF-8代表什么,如何编码?
UTF = Unicode transformation format
UTF-8 是www上普遍应用的encoding,因为它采用变长编码,兼容ascii
此外还有UTF-16, UTF-32等等
> java中的char是16位的,只能表示6万多个字符,好像汉字就?> 几万个吧,它怎么表示世界各国的语言字符?
不用操心了,java 支持unicode,unicode支持全部CJK字符,大概7万多,16位是肯定不够的了。
Unicode编码向UTF-8编码转换的规则可以参考J2SDK1.4的API文档,在java.io.DataInputStream类的描述中。
那么,如果我想写一个支持国际化的程序,数据库里面可能会有多种语言
数据库编码采用什么比较合适?(UTF8?)
Web层读参数的时候是否需要额外编码,如request.setCharactorEncoding("xx")
如果是,采用什么合适?
前面已经讨论过了,用Unicode有一个坏处,就是不能按照拼音顺序对汉字进行order by。
不然浏览器怎么知道用UTF-8发送
robbin, 我觉得unicode是一个大字符集的定义,而utf-8是对应这种字符集的一个encoding。类似的encoding还有utf-16/32等等。unicode本身不是encoding,你说呢?
JSP里面需要
《meta http-equiv="Content-Type" content="text/html; charset=utf-8"》
吗
不然浏览器怎么知道用UTF-8发送
在服务器端是用UTF-8来读的
你说的对,其实我们通常意义上说的unicode是指UTF-16,你可以把unicode看成两层含义,广义指所有的抽象意义的字符集定义,狭义的是指UTF-16,我比较习惯把UTF-16称做unicode。
>>JSP需要吗?
<%@ page contentType="text/html;charset=UTF-8" %> |
明白了,我比较较真, 呵呵。