【笔记】汇编语言

发表于 2022-04-02 更新于 2026-06-06 阅读次数：

前言

汇编语言学习笔记

准备工作

edit.com：编辑器
masm.exe：汇编程序
link.exe：链接程序
debug.exe：调试程序

DOSBox

虚拟的16位8086环境

挂载真实磁盘并跳转

在DOSBox中直接操作

c：挂在后的虚拟盘符
<dir>：真实环境中的目录路径，不能包含中文

1 2	mount c <dir> c:

将挂载和跳转加入到启动选项

Windows上配置文件在软件根目录下（C:\Program Files (x86)\DOSBox-0.74-3\），双击启动选项批处理文件（DOSBox 0.74-3 Options.bat）后，会自动使用记事本打开配置文件（%LocalAppData%\DOSBox\dosbox-0.74-3.conf），在文件末尾追加配置

%LocalAppData%\DOSBox\dosbox-0.74-3.conf

1 2	mount c <dir> c:

MacOS上的配置文件路径：~/Library/Preferences/DOSBox 0.74-3 Preferences

全屏

Windows：alt+enter
MacOS：option+return

edit.com的使用

启动edit

edit

存盘

alt+f->save

启动edit时编辑文件

如果文件存在，则直接编辑；如果文件不存在，则创建新文件开始编辑

<name>：文件名

1	edit <name>

编辑汇编程序

创建一个.asm汇编源文件

注释

在;后写注释

;注释

段定义

创建汇编程序第一步是段定义，告诉操作系统程序需要几个段（最多只能定义4个段）
段定义时需要指明段名，段名实际上就是段地址的符号地址
- 段的类型是由段关联和段地址传送决定的，而不是段名本身
段名命名规则
- 只能存在字母、数字、下划线
- 不能以数字开头
- 字符不能超过8个，超过8个末尾将被舍去
段名命名习惯
- 只要符合命名规则，段名可以任意定义
- 通常将代码段命名为code
- 通常将数据段命名为data
- 通常将堆栈段命名为stack

1
2
3

段名 segment
    ...
段名 ends

段关联

段关联语句必须打在段定义指令后的第一行

段名 segment
    assume 寄存器:段名

段名 ends

段地址传送

除了代码段，其他段都需要段传送后，才可以决定段的类型
通过mov指令实现段地址传送，但是mov不允许将立即数存放到寄存器，所以需要借助通用寄存器

段名 segment
    assume 寄存器:段名
    
    mov ax,data
    mov ds,ax
    
段名 ends

符号地址

在指令之前写标号，标号是用于指向该指令所存放的地址的符号，被称作符号地址
标号可以卸载指令正前方，也可以写在指令正上方
不是每一个指令前都需要写标号，只有在需要获取其内存地址时才写标号，程序的第一个指令前一定要有标号
代码执行之前需要书写开始标号，执行结束需要书写结束标号，开始标号通常使用start命名

段名 segment
    assume 寄存器名:段名
    
    标号1:
    指令 目的操作数,源操作数
    
    标号2:指令 目的操作数,源操作数
    
段名 ends

    end 标号1
    end 标号2

指令

伪指令：除了具体操作数的指令
指令：具体操作数的指令
- 双操作指令
  - 指令目的操作数,源操作数
- 单操作指令
  - 指令目的操作数
  - 指令源操作数
- 无操作数指令
  - 指令

代码段

代码段通常放在所有段之后
代码段不需要段地址传送

code segment
    assume cs:code
    
    start:
    
    ...
    
code ends

    end start

数据段

数据段需要在代码段中定义段关联和段地址传送
当需要存储数据时，可以定义数据段

data segment
    
    ...
    
data ends

code segment
    assume cs:code,ds:data
    
    start:
    mov ax,data
    mov ds,ax
    
    ...
    
code ends

    end start

定义数据

数据定义伪指令
- 字节数据定义伪指令
  - 字节数据伪指令使用db关键字，每次开辟1个字节的空间
- 字数据定义伪指令
  - 字数据定义伪指令使用dw关键字，每次开辟2个字节的空间
- 双字数据定义定义伪指令
  - 字数据定义伪指令使用dd关键字，每次开辟4个字节的空间
多字节数据存储原则
- 高字节存放在高地址
- 低字节存放在低地址

开辟空间并存入数据

1
2
3

db 0,0,0
dw 0,0,0
dd 0,0,0

存入字符数据

dw 'a'

只开辟空间不存入数据

只开辟空间不存入数据，使用?作为占位符

1
2
3

db ?,?,?
dw ?,?,?
dd ?,?,?

利用重复伪指令开辟更多空间

1
2
3

db 重复次数 dup(?)
dw 重复次数 dup(?)
dd 重复次数 dup(?)

获取数据

定义数据前加上符号地址，通过符号地址即可获取数据，符号地址可以自定义名称

data segment
    
    符号地址 db 重复次数 dup(?)
    符号地址 dw 重复次数 dup(?)
    符号地址 dd 重复次数 dup(?)
    
data ends

code segment
    assume cs:code,ds:data
    
    start:
    mov ax,data
    mov ds,ax
    
    mov ax,符号地址
    
code ends

    end start

编译的过程

源文件 -汇编> 目标文件 -链接> 可执行文件

汇编

把.asm源文件汇编成.obj目标文件

<file>：.asm汇编源文件，.asm可省略

masm <file>

Object filename:
Source listing:
Cross-reference:

Object filename:：询问生成的.obj文件名，如果直接回车不指定，则使用默认文件名
Source listing:：询问生成的列表文件名，如果直接回车不指定，则不会生成列表文件
Cross-reference:：询问生成的调试文件名，如果直接回车不指定，则不会生成调试文件

链接

把.obj目标文件链接成.exe可执行文件

<file>：.obj目标文件，.obj可省略

link <file>

Run File:
List File:
Libraries:

Run File:：询问生成的.exe文件名，如果直接回车不指定，则使用默认文件名

执行

<file>：.exe可执行文件，.exe可省略

<file>

debug.exe的使用

使用debug将可执行程序载入内存

<file>：.exe可执行文件

1	debug <file>

debug的命令

退出

-q

查看寄存器的值

-r

得到的值

得到的除了所有寄存器的值，还有CPU下一条将要执行的指令

1	段地址:偏移地址代码的机器语言代码对应指令目的操作数,源操作数

从当前代码段开始向下反汇编

-u

执行一条语句

从下一条将要执行的语句执行一条语句

-g

执行到断点地址

从下一条将要执行的与执行到断点地址之前

-g偏移地址

查看内存空间

多次输入d，每次只显示一段

当前数据段

-d

查看指定内存地址

1
2
3

-d偏移地址

-d物理地址:偏移地址

寻址方式

寻找数据的方式

直接寻址

直接通过内存中的地址，从内存中寻找数据

寄存器寻址

直接通过寄存器名，从寄存器中寻找数据

间接寻址（寄存器间接寻址）

将内存中地址值存放到寄存器，通过寄存器中存放的地址值间接寻找内存地址
可以存放地址的寄存器有：BX、BP、SI、DI

立即数寻址

直接通过立即数获取数据

汇编指令

汇编指令实质上就是机器语言的助记符，与机器语言没有本质区别，只不过程序员编程不需要记住复杂的二进制代码
汇编指令不区分大小写

存数

通过符号地址

1	mov 目的操作数,源操作数符号地址

通过符号地址+偏移量

1	mov 目的操作数,源操作数符号地址+偏移量

通过真实地址

源操作数真实地址：可以是真实地址值，也可以是寄存器中存储的内存真实地址

1
2
3

mov 目的操作数,[源操作数真实地址]

mov 目的操作数,[DS:0000]

重复伪指令

将一部分代码重复执行

1	重复次数 dup (需要重复的代码)

加法指令

把源操作数与目的操作数相加，得到的结果放到目的操作数中
源操作数可以是立即数，目的操作数不可以是立即数
目的操作数是寄存器的时候，最好给寄存器初始化（mov 寄存器,0）
不可以在两个存储器间直接操作，必须借助寄存器，将立即数存到内存除外

1	add 目的操作数,源操作数

减法指令

目的操作数减源操作数，得到的结果放到目的操作数中

1	sub 目的操作数,源操作数

目的操作数减源操作数，得到的结果不放到目的操作数中，结果只用作影响寄存器标识位

1	cmp 目的操作数,源操作数

将地址存到寄存器

lea 可以存放地址的寄存器,符号地址

;获取地址所指向的数
mov 寄存器,[可以存放地址的寄存器]

中断

中断号只能向AH寄存器中存放

1 2	mov AH,中断号 int 中断地址

常见的DOS中断

21H：DOS功能中断

返回DOS

在Windows平台下，写完8086汇编代码后，需要返回DOS，如果不写返回DOS的代码，DOS将中止
仿真环境下不需要返回DOS

1 2	mov ah,4ch int 21h

DOS键盘输入

获取键盘输入的一个字符，将ASCII码值存到AL寄存器中
ASCII码转数字：-30H，数字转ASCII码：+30H

带回显的输入

1 2	mov ah,01h int 21h

不带回显的输入

1 2	mov ah,07h int 21h

DOS屏幕输出

在屏幕上显示DL寄存器中存的数据

1 2	mov ah,02h int 21h

按任意键退出程序

无阻塞中断，不会打断程序运行
如果按下任意键，al的值为FF，如果没按下，al的值为00

1 2	mov ah 0bh int 21h

将数据保存在系统堆栈段

想堆栈段存取，必须是1字节（16位）的数据

压栈

push 源操作数

弹栈

pop 目标作数

交换数据

1	XCHG 操作数1,操作数2

push 操作数1
push 操作数2
pop 操作数1
pop 操作数2

自增自减

自增1

inc 操作数

自减1

dec 操作数

逻辑运算指令

逻辑移位指令

循环左移

最高位移到最低位，其他各位左移一位
- 例如10000001左移后为00000011
先将移动次数存储在cl寄存器，再根据次数向左移

1 2	mov cl,移动次数 rol 目的操作数,存储次数的寄存器

如果只循环一次可以简写

1	rol 目的操作数,1

循环右移

最低位移到最高位，其他各位右移一位
- 例如10000001左移后为11000000
先将移动次数存储在cl寄存器，再根据次数向右移

1 2	mov cl,移动次数 ror 目的操作数,存储次数的寄存器

如果只循环一次可以简写

1	ror 目的操作数,1

控制转移指令

设置跳转点

符号地址:

代码
代码

无条件跳转

直接跳转到符号地址处代码

1	jmp 跳转点符号地址

条件跳转（jump）

通过判断标识位，实现比较数值，然后跳转
- z：等于判断，通常用于有符号数，也可用于无符号数
- g：有符号数的大于判断
- l：有符号数的小于判断
- e：等于判断，通常用于无符号数，也可用于有符号数
- a：有符号数的大于判断
- b：有符号数的小于判断
- n：非判断

有符号数的判断

有符号数

jz：等于
jg：大于
jl：小于
jnz：不等于
jng：不大于
jnl：不小于
jgz：大于等于
jlz：小于等于
jngz：不大于等于、小于等于
jnlz：不小于等于、大于等于

无符号数

je：等于
ja：大于
jb：小于
jne：不等于
jna：不大于
jnb：不小于
jaz：大于等于
jbz：小于等于
jnaz：不大于等于、小于等于
jnbz：不小于等于、大于等于

举例：判断相等

cmp在这里的目的只是用于改变寄存器标识位
判断标识位中

1 2	cmp 操作数1,操作数2 jz 跳转点符号地址

条件跳转（loop）

在进入循环之前，在cx寄存器设置一个循环初值（只能用cx寄存器存循环初值），每次循环cx自减1，直到cx寄存器值为0时，跳出循环

1 2	mov cx,源操作数 loop 跳转点符号地址

loop循环与dec+jnz循环

loop循环完全等价于dec+jnz循环

1 2	dec cx jnz 跳转点符号地址

按位逻辑运算

原理

任意数，和0相与，都变为0
任意数，和1相与，数字不变

任意数，和1相或，都变为1
任意数，和0相或，数字不变

按位相与

1	and 目标操作数,源操作数

按位相或

1	or 目标操作数,源操作数

按位相非

1	not 目标操作数,源操作数

按位相异或

1	xor 目标操作数,源操作数

接口编程

向接口芯片写入B口数据

如果写入的数据大于FFH，那么需要用寄存器传递

1
2
3

mov al,数据
mov dx,接口地址
out dx,al

从接口芯片A口读取数据

将读取的数据存储到dx寄存器

1 2	mov al,接口地址 in dx,al

无限循环

通过符号地址

1	符号地址: jmp 符号地址

简写

jmp $

软件方式实现减速

利用空循环实现减速
如果减速速度不够，可以使用多层嵌套循环
这种方法只能实现不精确的减速

mov ax,100
a:
dcc ax
cmp ax,0
jnz a

子程序

封装常用的代码块，如果需要反复使用相同的代码，可以直接调用子程序

定义子程序

子程序定义需要在代码段内定义，可以放在代码段内的任意位置，通常放在代码段末尾（返回DOS之后）

属性

far：远属性，允许跨段调用
near：近属性，只允许在相同段内调用

子程序名 proc 属性

    ...
    
    ret
子程序名 endp

调用子程序

call 子程序名