intel 手册我很早就印出来拜读, 所以我的版本没有 64 bit 部份, 我大部份的心力都放
在 16/32 bit 环境下。
这次我们来看看特例的例子:
address_mode.S
1 # practice x86 machine code
3 .code32
4 .text
5 .global begin
6 begin:
7 mov 0x1234,%esi
address_mode.S L7 仅仅使用 displacement 这个字段。这是把 0x1234 位址的 4 个
byte 复制到 %esi。
objdump -d address_mode.elf
1 descent@w-linux:x86_machine_code$ objdump -d address_mode.elf
2
3 address_mode.elf: file format elf32-i386
4
5
6 Disassembly of section .text:
7
8 00000100 <_text>:
9 100: 8b 35 34 12 00 00 mov 0x1234,%esi
来看看 machine code, 8b 就不提了, 应该很简单。
8b 查这个表
http://pdos.csail.mit.edu/6.828/2006/readings/i386/appa.htm (
http://goo.gl/ioQbT1 )
-> Gv, Ev
E
A modR/M byte follows the opcode and specifies the operand. The operand is
either a general register or a memory address. If it is a memory address,
the address is computed from a segment register and any of the following
values: a base register, an index register, a scaling factor, a
displacement.
G
The reg field of the modR/M byte selects a general register; e.g., ADD (
http://goo.gl/qiBRQP ) (00).
v
Word or double word, depending on operand size attribute.
感觉好像是 Ev, word 是 2 byte, double word 是 4 byte。
modrm: 35
mod: 00
reg: 110
r/m: 101
reg: 110 -> esi
mod:00
r/m: 101
结果可不是 ebp base register, 如果是 ebp base register, 那组合语言就是
mov (%ebp),%esi
不过范例中的组合语言不是这个, 这是一个例外, 很意外吗?不过还有另外一个例外。
这是表示后面接 displacement。所以 34 12 00 00 就是 0x1234 displacement。
那 mov (%ebp),%esi 会产生什么样的 machine code 呢?
8b 75 00 mov 0x0(%ebp),%esi
modrm: 75
mod: 01
reg: 110 -> esi
r/m: 101
mod:01
r/m: 101
查表http://goo.gl/mL4AgR (
http://pdos.csail.mit.edu/6.828/2006/readings/i386/s17_02.htm ) 得到 ->
disp8[ebp]
00 是 8bit displacement, 所以还是可以使用 ebp 当 base register, 只不过
displacement 要为 0, 比其他的 base register 多出一个 byte。和 epb 搭配的默认
segment register 是 ss, 在处理 stack 时会用到。
一次只谈简单的例子, 这样应该很容易理解。
// 本文使用 Blog2BBS 自动将Blog文章转成缩址的BBS纯文字 http://goo.gl/TZ4E17 //
blog 原文:
descent-incoming.blogspot.tw/2013/06/x86-machine-code-2-displacement-only.html