C语言的编译分为如下几个部分:预处理器、编译器、汇编器、链接器。
编译流程如下图所示:
预编译器
C语言预编译完成如下工作(文本处理工作):
- 处理所有的注释,以空格代替
- 将所有的#define删除,并且展开所有的宏定义
- 处理条件编译指令:#if,#ifdef,#elif,#else,#endif
- 处理#include,展开被包含的文件
- 保留编译器需要使用的#pragma指令
只使用预处理指令:
gcc -E file.c -o file.i
预编译示例
deepinout.com.h
/*
This is a header file.
*/
char* p = "deepinout.com";
int i = 0;
deepinout.com.c
#include "deepinout.com.h"
// Begin to define macro
#define GREETING "Hello deepinout.com!"
#define INC(x) x++
// End
int main()
{
p = GREETING;
INC(i);
return 0;
}
预编译后的中间文件deepinout.com.i
# 1 "deepinout.com.c"
# 1 "<built-in>"
# 1 "<command-line>"
# 1 "/usr/include/stdc-predef.h" 1 3 4
# 1 "<command-line>" 2
# 1 "deepinout.com.c"
# 1 "deepinout.com.h" 1
# 9 "deepinout.com.h"
char* p = "deepinout.com";
int i = 0;
# 2 "deepinout.com.c" 2
# 11 "deepinout.com.c"
int main()
{
p = "Hello deepinout.com!";
i++;
return 0;
}
编译器
编译阶段主要对预处理后的文件进行词法分析、语法分析和语义分析(将源程序翻译为汇编代码)
- 词法分析:分析关键字、标识符、立即数等是否合法
- 语法分析:分析表达式是否遵循语法规则
- 语义分析:在语法分析的基础上进一步分析表达式是否合法
分析结束后进行代码优化生成相应的汇编代码文件。
编译指令示例:
gcc -S file.i -o file.s
上面的示例,执行 gcc -S deepinout.i -o deepinout.s
打开 deepinout.s
文件:
.file "deepinout.com.c"
.globl p
.section .rodata
.LC0:
.string "deepinout.com"
.data
.align 8
.type p, @object
.size p, 8
p:
.quad .LC0
.globl i
.bss
.align 4
.type i, @object
.size i, 4
i:
.zero 4
.section .rodata
.LC1:
.string "Hello deepinout.com!"
.text
.globl main
.type main, @function
main:
.LFB0:
.cfi_startproc
pushq %rbp
.cfi_def_cfa_offset 16
.cfi_offset 6, -16
movq %rsp, %rbp
.cfi_def_cfa_register 6
movq .LC1, p(%rip)
movl i(%rip), %eax
addl1, %eax
movl %eax, i(%rip)
movl $0, %eax
popq %rbp
.cfi_def_cfa 7, 8
ret
.cfi_endproc
.LFE0:
.size main, .-main
.ident "GCC: (GNU) 4.8.5 20150623 (Red Hat 4.8.5-39)"
.section .note.GNU-stack,"",@progbits
汇编器
汇编器将汇编代码转变为机器可执行指令,每条汇编语句几乎都对应一条机器指令。
汇编指令示例:
gcc -c file.s -o file.o
一个.c
文件就会产生一个.o
文件,.o
文件无法直接执行,还需要连接过程才能产生真正的可执行文件。
总结
编译过程分为预处理、编译、汇编三个阶段
- 预处理:处理注释、宏以及已经以#开头的符号
- 编译:进行词法分析、语法分析、语义分析
- 汇编:将汇编代码翻译成机器指令的目标文件