各位大大好,在下是Python新手,想要确认一下我编码的基础概念有没有问题
,所以举了一个例子,想请各位看看我的想法是否有误~
https://imgur.com/a/iDdl0,这张图是我目前概念的整理
举例如下 :
<文字编辑器Atom的编码设定为'ascii',stdin.encoding == utf-8
,stdout.encoding == utf-8>
1.当我在文字编辑器上输入字串时
,我的字串会被sys.stdin的编码'utf-8'转成unicode code point,然后sys.stdout
再将这些unicode code point编码成字节,再利用字节在萤幕上渲染出字型
,而当我要存盘时,unicode code point会被'ascii'编码系统转成字节并储存在
内存中,当我要开启档案时,文字编辑器Atom就会把存在内存中的字节以'ascii'
的方式解码成unicode code point
2.Python内部是以unicode code point进行处理
3.(问题)
当我输入字串'伥',时,sys.stdin就会把它encoding成unicode code point,但是
当我直接输入伥的unicode code point '\u5000'时,sys.stdin会怎么做呢?
以上三点就是我的问题,新手第一次发问,如果有不对的发问方式,请各位不吝指教
,谢谢~