[问题] 关于binary档案 / text档案

楼主: noapaov (单身汉)   2015-05-18 08:43:32
请问一下各位大大, 想请问一下我的理解是否有错误
档案类型一般分二进制档案(binary file)与文字档(text file)
文字档案存的是档案编码后的资料例如UTF-8编码, 存的内容是UTF-8编码资料,
我们看会出现中文是因为编辑器根据编码进行了对照表的转换
二进制档案存的是二进制的内容也就是(0101), 因方便阅读,
编辑器打开二进制有时会转换成16进制(\u5f35)
但电脑要读取时, 会将文字档案再转换成二进制档案,
而二进制档案则可直接读取档案内容,
(1) 我的理解有问题吗?
(2) 如果是我上述的方式, 那我想请问(binary file)是根据什么编码进行转换成机器码的?
(3) unicode档案(文字档案) 转成二进制档案是直接将unicode编码(\u5f35)转成二进进制吗?
作者: pttworld (批踢踢世界)   2015-05-18 10:27:00
在本板讨论会多一层虚拟机器指令,但你以一般计概知识,电脑只看懂二进制机器码,看懂指的是电位高低。文字档的部分大致理解是对的。讲一下转换吧,如果你要谈互转,文字档转二进制没什么技巧,因为二进制就是内存资料写入,把文字档资料读进内存再从内存把资料写到档案就是,程式语言搭配作业系统会帮你处理好。反之,二进制转文字档或其他的档案的要看转成什么档案看格式的规格怎定。文字档最简单的至少换行就要看平台吧,还有你已知道的编码转换,跟人是否看懂有关。
楼主: noapaov (单身汉)   2015-05-18 10:59:00
那请问二进制档案是依据ASCII产生的吗?来是依照作业系统默认的编码 ? 如MS950是如何转成0101的
作者: pttworld (批踢踢世界)   2015-05-18 13:03:00
MS950和ASCII同样都是编码让人看懂。二进制档案储存其来源看你要何种档案格式如何转这已经是程式语言牵涉到system call要了解作业系统的,理论上你在这找不到答案,因为这边不会有相关知识背景的人存在,或该相关人士不会来这参与讨论,google吧,希望你找得到答案。
楼主: noapaov (单身汉)   2015-05-18 13:13:00
了解 谢谢你
作者: ssccg (23)   2015-05-18 13:46:00
机器码是binary,binary不需要转成机器码所有档案都是binary,文字档只是档案中的binary是文字资料经过某种编码的结果而已
作者: realmeat (真肉)   2015-05-18 16:28:00
机器码应该是machine code...脑中突然想到asm...

Links booklink

Contact Us: admin [ a t ] ucptt.com