预处理命令和预处理器(CPP),C语言预处理命令和预处理器概述

C 语言编程过程中,经常会用到如 #include、#define 等指令,这些标识开头的指令被称为预处理指令,预处理指令由预处理程序(预处理器)操作。较之其他编程语言,C/C++ 语言更依赖预处理器,故在阅读或开发 C/C++ 程序过程中,可能会接触大量的预处理指令。

预处理指令及分类

C/C++ 程序中的源代码中包含以 # 开头的各种编译指令,这些指令称为预处理指令。预处理指令不属于 C/C++ 语言的语法,但在一定意义上可以说预处理扩展了 C/C++。

ANSI C 定义的预处理指令主要包括:文件包含宏定义条件编译特殊控制等 4 类。

1) 文件包含:#include 是 C 程序设计中最常用的预处理指令。例如,几乎每个需要输入输出的 C 程序,都要包含 #include<stdio.h> 指令,表示把 stdio.h 文件中的全部内容,替换该行指令。

包含文件的格式有 #include 后面跟尖括号 <> 和双引号 "" 之分。两者的主要差别是搜索路径的不同。
  • 尖括号形式:如 #include<math.h>,预处理器直接到系统目录对应文件中搜索 math.h 文件,搜索不到则报错。系统提供的头文件一般采用该包含方式,而自定义的头文件不能采用该方式。
  • 双引号形式:如 #include"cal.h",首先到当前工作目录下查找该文件,如果没有找到,再到系统目录下查找。包含自定义的头文件,一般采用该方式。虽然系统头文件采用此方式也正确,但浪费了不必要的搜索时间,故系统头文件不建议采用该包含方式。

2) 宏定义:包括定义宏 #define 和宏删除 #undef。

以 #define 开头,可以定义无参数宏和带参的宏定义。程序中经常使用无参宏定义来定义符号常量。例如:
#define PI 3.1416 //定义无符号宏,或定义符号常量 PI
#undef 表示删除已定义的宏,例如:
#undef PI //删除前面该宏的定义
3) 条件编译:主要是为了有选择性地执行相应操作,防止宏替换内容(如文件等)的重复包含。常见的条件编译指令有 #if、#elif、#else、#endif、#ifdef、#ifndef。

4) 特殊控制:ANSI C 还定义了特殊作用的预处理指令,如 #error、#pragma。

#error:使预处理器输出指定的错误信息,通常用于调试程序。

#pragma:是功能比较丰富且灵活的指令,可以有不同的参数选择,从而完成相应的特 定功能操作。调用格式为:#pragma 参数。

其中,参数可以有 message 类型、code_seg、once、warning、pack 等。通常使用如下的预处理指令来设定内存以 n 字节对齐方式。

#pragma pack (n) //其中 n 称为对齐系数,取 1、2、4、8...

预处理器及其工作原理

C预处理器(C Pre-Processor)也常简写为 CPP,是一个与 C 编译器独立的小程序,预编译器并不理解 C 语言语法,它仅是在程序源文件被编译之前,实现文本替换的功能。

目前预编译器巳集成到集成开发环境中,一般并没有执行预处理操作的选项,而包含在了编译操作中,即选择编译操作时,首先调用的是预处理器,处理源程序文件中的预处理指令,预处理器的输出再送给编译器,编译器从 C 语言语法角度检查程序是否正确,如果正确,则生成目标代码文件或机器指令文件。

C 预处理器及 C 编译器的执行顺序及输入输出文件类型,如图 1 所示。

图 1 预处理与编译