[问题] InputStreamReader的read()

楼主: OoShiunoO (机机勋)   2015-02-08 18:10:41
最近在看欧莱里的JAVA网络程式设计
里面有讲到这段code:
InputStreamReader r = new InputStreamReader(in, "MacCyrillic");
StringBuilder sb = new StringBuilder();
int c;
while((c=r.read()) != -1) sb.append((char) c);
return sb.toString();
他是读取某个输入串流in,并以MacCyrillic编码转换为unicode字串输出。
其中read()会回传0~65535的int,这代表Unicode字符,
我的问题是为什么只会回传0~65535而已?Unicode编码不是有好几百万个吗?
另外,(char)这个强制转型是把int转成char,它的转换标准是依据什么呢?
作者: mozzan (mozzan)   2015-02-08 20:01:00
Unicode就是可以表达所有的字,2 bytes的确就足够你说得几百万指的是UTF-8吗?UTF-8用4 bytes是因为要弥补unicode在显示ascii code也是用2 bytes的缺陷,他是可变长度,不代表他真的使用到2的32次方的字符

Links booklink

Contact Us: admin [ a t ] ucptt.com