后来看懂了,说明放在最下面。
_____________________________________________________
想写一个小program,可以检测某个ttf或otf档(字型)
有没有完整支援一段utf8编码的字串
但我现在在看“fc-query xxx.ttf”出来的内容
在charset的部份,看起来是十六进制,但我没办法跟unicode编码的十六进制
连结起来,以下是fc-query出来的部份片段
﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍
charset:
0000: ffffffff ffffffff ffffffff 7fffffff 00000000 ffffffff ffffffff ffffffff
0001: 0c0f000f 00000f00 000cf198 00003f00 00040000 00018003 1fffe000 03000000
0002: 00000000 00000000 00020000 00000002 00000000 00000000 02000e80 00000000
0003: 00000000 00000000 00000000 00000000 fffe0000 fffe03fb 000003fb 00000000
0004: ffff0002 ffffffff 0002ffff 00000000 00000000 00000000 00000000 00000000
然后我找到一篇文章,底下的解答有如何看是否有对应charset
﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍
It shows the supported character ranges, although it doesn't which block it
belongs to (you have to know which range belongs to which block).
For example, the fourth column of 0000, which corresponds to U+0060 - U+007F,
has a hex value of 7fffffff. This has a bit value of
0111 1111 1111 1111 1111 1111 1111 1111
, where the right most bit is U+0060, and the left most is U+007F.
This means that U+007F is not supported in this font.
﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍
但我还是不懂,他如何看出0000那行的第四栏是介于unicode编码的U+0060 ~U+007F
那其他行跟其他栏是要如何跟unicode编码对应?
﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍
说明:
utf8最广泛的是1到3 byte,所以以3 byte来说,范例中的每一row(0000,0001,0002....)
的开头(冒号左边)代表3 byte中的前2 byte开头,冒号右边的八组column
代表剩下1 byte的16*16个尾数(ex. 0000 row 是从000000到0000ff)
所以每个column负责32个尾数,而如果把每个column decode 到二进制
就有32个二进制值,例如row 0000的第四栏7fffffff的二进制就是
0111-1111-1111-1111-1111-1111-1111-1111,这是从000060 ~ 00007f
代表000060到00007e都有这个字型,但最左边的0(from 0111)代表00007f没支援
没错,是从右边数来,到左边最大值,最右边是000060,最左是00007f