# Linux下gcc生成和使用静态库和动态库详解 ## 一、基本概念 ### 1.1 什么是库 `在windows平台和linux平台下都大量存在着库`。 本质上来说库是一种可执行代码的二进制形式,可以被操作系统载入内存执行。 由于windows和linux的平台不同(主要是编译器、汇编器和连接器的不同),因此二者库的二进制是不兼容的。 ## 1.2库的种类 > linux下的库有两种:静态库和共享库(动态库)。 二者的不同点在于代码被载入的时刻不同。静态库的代码在编译过程中已经被载入可执行程序,因此体积较大。共享库的代码是在可执行程序运行时才载入内存的,在编译过程中仅简单的引用,因此代码体积较小。 ## 1.3库存在的意义 库是别人写好的现有的,成熟的,可以复用的代码,你可以使用但要记得遵守许可协议。现实中每个程序都要依赖很多基础的底层库,不可能每个人的代码都从零开始,因此库的存在意义非同寻常。共享库的好处是,不同的应用程序如果调用相同的库,那么在内存里只需要有一份该共享库的实例。 ## 1.4库文件是如何产生的在linux下 静态库的后缀是.a,它的产生分两步 1. 由源文件编译生成一堆.o,每个.o里都包含这个编译单元的符号表 2. ar命令将很多.o转换成.a,成为静态库 **动态库的后缀是.so,它由gcc加特定参数编译产生。** ## 1.5库文件是如何命名的,有没有什么规范 在linux下,库文件一般放在/usr/lib和/lib下,静态库的名字一般为libxxxx.a,其中xxxx是该lib的名称动态库的名字一般为libxxxx.so.major.minor,xxxx是该lib的名称,major是`主版本号`, minor是副版本号 ## 1.6如何知道一个可执行程序依赖哪些库 `ldd`命令可以查看一个可执行程序依赖的共享库 例如: ``` ex@Ex:~/test$ ldd a.out linux-vdso.so.1 (0x00007ffd66ca6000) libc.so.6 => /lib/x86_64-linux-gnu/libc.so.6 (0x00007f7e5e261000) /lib64/ld-linux-x86-64.so.2 (0x00007f7e5e854000) ``` ## 1.7可执行程序在执行的时候如何定位共享库文件 当系统加载可执行代码时候,能够知道其所依赖的库的名字,但是还需要知道绝对路径。此时就需要系统动态载入器(dynamic linker/loader) 对于elf格式的可执行程序,是由ld-linux.so*来完成的,它先后搜索elf文件的 DT_RPATH段,然后是环境变量`LD_LIBRARY_PATH`、/etc/ld.so.cache文件列表、`/lib`、`/usr/lib`目录找到库文件后将其载入内存 如: ``` bash export LD_LIBRARY_PATH=$(pwd) ``` 上面的命令就是将当前文件目录添加为共享目录 ## 1.8在新安装一个库之后如何让系统能够找到他 如果安装在/lib或者/usr/lib下,那么ld默认能够找到,无需其他操作。如果安装在其他目录,需要将其添加到/etc/ld.so.cache文件中,步骤如下 1.编辑/etc/ld.so.conf文件,加入库文件所在目录的路径 2.运行ldconfig 目录名字,该命令会重建/etc/ld.so.cache文件 # 二、用gcc生成静态和动态链接库的示例 我们通常把一些公用函数制作成函数库,供其它程序使用。函数库分为静态库和动态库两种。静态库在程序编译时会被连接到目标代码中,程序运行时将不再需要该静态库。 动态库在程序编译时并不会被连接到目标代码中,而是在程序运行是才被载入,因此在程序运行时还需要动态库存在。本文主要通过举例来说明在Linux中如何创建静态库和动态库,以及使用它们。 ## 2.1 准备好测试代码 `add.c` 文件,里面有公用函数 add() 函数。 `main.c` 为测试库文件的主程序,在主程序中调用了公用函数add 。 三个程序放在文件夹~/demo 中 ### 程序1: add.h ``` c++ #ifndef ADD_H #define ADD_H int add(int a, int b); #endif ``` ### 程序2: add.c ``` c++ int add(int a, int b) { return a + b; } ``` ### 程序3:main.c ``` c++ #include #include "add.h" int main() { int a, b; a = 1; b = 2; printf("a + b = %d\n", add(a, b)); return 0; } ``` ## 2.2问题的提出 > 注意:这个时候,我们编译好的add.o是无法通过gcc –o 编译的,这个道理非常简单,add.c是一个没有main函数的.c程序,因此不够成一个完整的程序,如果使用gcc –o 编译并连接它,GCC将报错。 无论静态库,还是动态库,都是由.o文件创建的。因此,我们必须将源程序hello.c通过gcc先编译成.o文件。 这个时候我们有三种思路: 1. 通过编译多个源文件,直接将目标代码合成一个.o文件。 2. 通过创建静态链接库libadd.a,使得main函数调用add函数时可调用`静态链接库`。 3. 通过创建动态链接库libadd.so,使得main函数调用add函数时可调用`动态链接库`。 ## 2.3思路一:编译多个源文件 在系统提示符下键入以下命令得到 `add.o` 文件。 ``` bash gcc -c add.c -o add.o ``` 运行实例如下: ``` ex@Ex:~/demo$ gcc -c add.c -o add.o ex@Ex:~/demo$ ls add.c add.h add.o main.c ex@Ex:~/demo$ readelf -s add.o Symbol table '.symtab' contains 9 entries: Num: Value Size Type Bind Vis Ndx Name 0: 0000000000000000 0 NOTYPE LOCAL DEFAULT UND 1: 0000000000000000 0 FILE LOCAL DEFAULT ABS add.c 2: 0000000000000000 0 SECTION LOCAL DEFAULT 1 3: 0000000000000000 0 SECTION LOCAL DEFAULT 2 4: 0000000000000000 0 SECTION LOCAL DEFAULT 3 5: 0000000000000000 0 SECTION LOCAL DEFAULT 5 6: 0000000000000000 0 SECTION LOCAL DEFAULT 6 7: 0000000000000000 0 SECTION LOCAL DEFAULT 4 8: 0000000000000000 20 FUNC GLOBAL DEFAULT 1 add ``` 在`ls`命令结果中,我们看到了add.o文件,本步操作完成。用`readelf`命令可以看到该文件中有`add函数`。 为什么不使用`gcc -o add add.c`这个道理我们之前已经说了,使用`-c`是什么意思呢?这涉及到gcc 编译选项的常识。 > `gcc` 中 `-o` 选项是制定输出文件文件名,`gcc` 默认编译之后就立刻开始链接成可执行程序,在链接成可执行程序的时候,libc的会调用main函数,因为main函数要作为函数入口,如果此时你的程序当中没有main函数的就会链接失败,而 `-c` 参数只编译不链接 ,所以不会出现链接问题。 > 这包括调用作为GCC内的一部分真正的C编译器(ccl),以及调用GNU C编译器的输出中实际可执行代码的外部GNU汇编器(as)和连接器工具(ld)。gcc -c是使用GNU汇编器将源文件转化为目标代码之后就结束,在这种情况下,只调用了C编译器(ccl)和汇编器(as),而连接器(ld)并没有被执行,所以输出的目标文件不会包含作为Linux程序在被装载和执行时所必须的包含信息,但它可以在以后被连接到一个程序。 ### 同理编译main ``` bash gcc -c main.c -o main.o ``` **将两个文件链接成一个.o文件。** ``` bash gcc add.o main.o -o main ``` ### 编译和运行 ``` ex@Ex:~/demo$ gcc -c add.c -o add.o ex@Ex:~/demo$ ls add.c add.h add.o main.c ex@Ex:~/demo$ gcc -c main.c -o main.o ex@Ex:~/demo$ ls add.c add.h add.o main.c main.o ex@Ex:~/demo$ gcc add.o main.o -o main ex@Ex:~/demo$ ls add.c add.h add.o main main.c main.o ex@Ex:~/demo$ ./main a + b = 3 ex@Ex:~/demo$ ``` 但是我们一般不会这样做,我们一般都会直接把两个文件链接起来,像下面这样。 ``` ex@Ex:~/demo$ gcc main.c add.c -o main ex@Ex:~/demo$ ./main a + b = 3 ex@Ex:~/demo$ ``` ## 2.4思路二:静态链接库 **下面我们先来看看如何创建静态库,以及使用它。** `静态库文件名的命名规范是以lib为前缀,紧接着跟静态库名,扩展名为.a`。 例如:我们将创建的静态库名为`add`,则静态库文件名就是libadd.a。在创建和使用静态库时,需要注意这点。创建静态库用`ar`命令。 在系统提示符下键入以下命令将创建静态库文件`libadd.a`。 ``` bash ar rcs libadd.a add.o ``` `rcs` 参数的说明如下: ``` r Insert the files member... into archive (with replacement). This operation differs from q in that any previously existing members are deleted if their names match those being added. If one of the files named in member... does not exist, ar displays an error message, and leaves undisturbed any existing members of the archive matching that name. By default, new members are added at the end of the file; but you may use one of the modifiers a, b, or i to request placement relative to some existing member. The modifier v used with this operation elicits a line of output for each file inserted, along with one of the letters a or r to indicate whether the file was appended (no old member deleted) or replaced. c Create the archive. The specified archive is always created if it did not exist, when you request an update. But a warning is issued unless you specify in advance that you expect to create it, by using this modifier. s Add an index to the archive, or update it if it already exists. Note this command is an exception to the rule that there can only be one command letter, as it is possible to use it as either a command or a modifier. In either case it does the same thing. ``` **静态库制作完了,如何使用它内部的函数呢?** 只需要在使用到这些公用函数的源程序中包含这些公用函数的原型声明,然后在用gcc命令生成目标文件时指明静态库名,gcc将会从静态库中将公用函数连接到目标文件中。`注意,gcc会在静态库名前加上前缀lib`,然后追加扩展名.a得到的静态库文件名来查找静态库文件,因此,我们在写需要连接的库时,只写名字就可以,如libadd.a的库,只写:`-l add`,gcc 的 `-l` 参数是告诉链接器要引用什么库。 在程序main.c中,我们包含了add的头文件 add.h,这个主要是告诉编译器add()函数的参数以及返回值是什么,否则可能会生成一些奇奇怪怪的汇编代码 下面是使用静态库的一条命令, `-L` 是指定库文件的路径。 ``` bash gcc -o main main.c -L ./ -l add ``` 主程序`main`中直接调用公用函数`add()`。我们来运行`main`程序看看结果如何。 ``` ex@Ex:~/demo$ ls add.c add.h main.c ex@Ex:~/demo$ gcc -c add.c -o add.o ex@Ex:~/demo$ ls add.c add.h add.o main.c ex@Ex:~/demo$ ar rcs libadd.a add.o ex@Ex:~/demo$ ls add.c add.h add.o libadd.a main.c ex@Ex:~/demo$ gcc -o main main.c -L ./ -l add ex@Ex:~/demo$ ls add.c add.h add.o libadd.a main main.c ex@Ex:~/demo$ ./main a + b = 3 ex@Ex:~/demo$ rm -f libadd.a ex@Ex:~/demo$ ls add.c add.h add.o main main.c ex@Ex:~/demo$ ./main a + b = 3 ex@Ex:~/demo$ ``` 从上面可以看出,即使删除静态库文件,`main`也不会受到影响。 > 静态链接库的一个缺点是,如果我们同时运行了许多程序,并且它们使用了同一个库函数,这样,在内存中会大量拷贝同一库函数。这样,就会浪费很多珍贵的内存和存储空间。使用了共享链接库的Linux就可以避免这个问题。 共享函数库和静态函数在同一个地方,只是后缀有所不同。比如,在一个典型的Linux系统,标准的共享数序函数库是/usr/lib/libm.so。 当一个程序使用共享函数库时,在连接阶段并不把函数代码连接进来,而只是链接函数的一个引用。当最终的函数导入内存开始真正执行时,函数引用被解析,共享函数库的代码才真正导入到内存中。这样,共享链接库的函数就可以被许多程序同时共享,并且只需存储一次就可以了。共享函数库的另一个优点是,它可以独立更新,与调用它的函数毫不影响。 ## 2.5思路三、动态链接库(共享函数库) 我们继续看看如何在Linux中创建动态库。我们还是从.o文件开始。 动态库文件名命名规范和静态库文件名命名规范类似,也是在动态库名增加前缀lib,但其文件扩展名为.so。例如:我们将创建的动态库名为add,则动态库文件名就是libadd.so。用gcc来创建动态库。 在终端下键入以下命令,得到动态库文件libadd.so。 ``` bash gcc -shared add.c -o libadd.so ``` `-shared` 参数是生成动态链接文件。 在程序中使用动态库和使用静态库完全一样,也是在使用到这些公用函数的源程序中包含这些公用函数的原型声明,然后在用gcc命令生成目标文件时指明动态库名进行编译。我们先运行gcc命令生成目标文件,再运行它看看结果。 用下面的命令进行编译,并连接: ``` bash gcc main.c -L ./ -l add -o main ``` > 使用`-l add`标记来告诉GCC驱动程序在连接阶段引用共享函数库libadd.so。`-L ./` 标记告诉GCC要查询的函数库文件路径。 运行实例: ``` ex@Ex:~/demo$ ls add.c add.h main.c ex@Ex:~/demo$ gcc -shared add.c -o libadd.so ex@Ex:~/demo$ ls add.c add.h libadd.so main.c ex@Ex:~/demo$ gcc main.c -L ./ -l add -o main ex@Ex:~/demo$ ls add.c add.h libadd.so main main.c ex@Ex:~/demo$ ./main ./main: error while loading shared libraries: libadd.so: cannot open shared object file: No such file or directory ex@Ex:~/demo$ ``` `错误提示`,找不到动态库文件libadd.so。程序在运行时,会查找需要的动态库文件,顺序参考后文介绍。若找到,则载入动态库,否则将提示类似上述错误而终止程序运行。既然连接器会搜寻`LD_LIBRARY_PATH`所指定的目录,那么我们可以将这个环境变量设置成当前目录。 ``` ex@Ex:~/demo$ ls add.c add.h libadd.so main main.c ex@Ex:~/demo$ ./main ./main: error while loading shared libraries: libadd.so: cannot open shared object file: No such file or directory ex@Ex:~/demo$ export LD_LIBRARY_PATH=$(pwd) ex@Ex:~/demo$ ./main a + b = 3 ex@Ex:~/demo$ ``` ## 2.6编译参数解析 最主要的是GCC命令行的一个选项: 1. **-shared**: 该选项指定生成动态连接库(让连接器生成T类型的导出符号表,有时候也生成弱连接W类型的导出符号),不用该标志外部程序无法连接。相当于一个可执行文件 2. **-fPIC**: 表示编译为位置独立的代码,不用此选项的话编译后的代码是位置相关的所以动态载入时是通过代码拷贝的方式来满足不同进程的需要,而不能达到真正代码段共享的目的。 3. **-L** : 表示要连接的库路径。 4. **-l**: 表示要连接的库名,编译器查找动态连接库时有隐含的命名规则,即在给出的名字前面加上lib,后面加上.so来确定库的名称。 5. **`LD_LIBRARY_PATH`** : 这个环境变量指示动态连接器可以装载动态库的路径。 ## 2.7 静态库链接时搜索路径顺序: 1. ld会去找GCC命令中的参数`-L` 2. 再找gcc的环境变量`LIBRARY_PATH` 3. 再找内定目录 `/lib` 、 `/usr/lib` 、 `/usr/local/lib` 这是当初compile gcc时写在程序内的 ## 2.9 有关环境变量: 1. `LIBRARY_PATH`环境变量:指定程序静态链接库文件搜索路径 2. `LD_LIBRARY_PATH`环境变量:指定程序动态链接库文件搜索路径 # 三、linux开发之文件夹和应用程序 ### 1. 应用程序(Applications) 应用程序通常都有固定的文件夹,系统通用程序放在`/usr/bin`,日后系统管理员在本地计算机安装的程序通常放在`/usr/local/bin`或者`/opt`文件夹下。除了系统程序外,大部分个人用到的程序都放在`/usr/local`下,所以保持`/usr`的整洁十分重要。当升级或者重装系统的时候,只要把`/usr/local`的程序备份一下就可以了。 GNU的编译器GCC,通常放置在`/usr/bin`或者`/usr/local/bin`中,不同的Linux版本可能位置稍有不同。可以通过`which` 命令来查看。 ### 2. 头文件(Head Files) 在C语言和其他语言中,头文件声明了系统函数和库函数,并且定义了一些常量。对于C语言,头文件基本上散落于`/usr/include`和它的子文件夹下。其他的编程语言的库函数分布在编译器定义的地方,比如在一些Linux版本中,GNU C++的库函数分布在`/usr/include/g++`。这些系统库函数的位置对于编译器来说都是“标准位置”,即编译器能够自动搜寻这些位置。 如果想引用位于标准位置之外的头文件,我们需要在调用编译器的时候加上`-I`标志,来显式的说明头文件所在文件夹。比如 ``` bash gcc -I $(pwd)/include main.c -o main ``` 会告诉编译器除了标准位置外,还要去当前目录下的`include`文件夹看看有没有所需的头文件。详细情况见编译器的使用手册(man gcc)。 ### 3. 库函数(Library Files) 库函数就是函数的仓库,它们都经过编译,重用性不错。通常,库函数相互合作,来完成特定的任务。比如操控屏幕的库函数(cursers和ncursers库函数),数据库读取库函数(dbm库函数)等。 系统调用的标准库函数一般位于`/lib`以及`/usr/lib`。C编译器(精确点说,连接器)需要知道库函数的位置。默认情况下,它只搜索标准C库函数。 库函数文件通常开头字母是`lib`。后面的部分标示库函数的用途(比如C库函数用c标识, 数学库函数用m标示),小数点后的后缀表明库函数的类型: 1. .a 指静态链接库 2. .so 指动态链接库 去`/usr/lib`看一下,你会发现,库函数都有动态和静态两个版本。 ### 静态链接库(Static Libraries) 最简单的函数库就是一些函数的简单集合。调用库函数中的函数时,需要在调用函数中include定义库函数的头文件。我们`用-l选项添加标准函数库之外的函数库`。