2.6 结构体与联合体

2.6.1 结构体

数组中保存的是一组相同类型的数据，而结构体中可以保存一组不同类型的数据，他是一类数据的聚合。

// 元素 A 和 B 占用不同存储空间.
struct _A_STRUCT
{
    short A;    // 内部元素 A.
    char B;     // 元素 B.
    int C;      // 元素 C.
}AStruct = {15, 8, 32};

struct _A_STRUCT* pAStruct = &AStruct;  // pAStruct 是一个结构体指针.

printf("%d\n", sizeof(AStruct));    // AUnion 的长度为 8（涉及到内存对齐）.
printf("A=%d\n", AStruct.A);        // 输出 15.
printf("B=%d\n", pAStruct->B);      // 输出 8.

结构体变量使用 “.” 来访问内部元素，而结构体指针使用 “->” 来访问内部元素。

我们看到，上面定义结构体指针的方法非常繁琐，我们有更简单的方式：

struct _A_STRUCT
{
    short A;
    char B;
    int C;
}A_STRUCT;      // 通过 typedef 将 A_STRUCT 定义成了 struct _A_STRUCT 类型.

A_STRUCT AStruct = {15, 8, 32};     // 这样用起来就方便了.
A_STRUCT* pAStruct = &AStruct;      // 嗯，确实方便多了.

2.6.2 联合体

联合体则为同一地址空间起了两或多个名字。

// 元素 A 和 B 占用同一存储空间.
union _A_UNION
{
    short A;
    char B;
}AUnion;

printf("%d\n", sizeof(AUnion));     // AUnion 的长度为 2.

访问联合体内部元素的方法与结构体类似。

联合体也支持 typedef，方法与结构体一致。

2.6.3 结构体、联合体混合使用

结构体中可以嵌套联合体：

typedef struct _SuperHero
{
    char* name;
    char* actor;
    union
    {
        unsigned short ShieldLevel;
        unsigned short IronLevel;
    };      // 结构体中允许使用匿名联合体.
}SuperHero;

void InitSuperHero(SuperHero* hero)
{
    if(0==strcmp("Captain America", hero->name))
    {
        hero->ShieldLevel = 3;
    }
    else if(0==strcmp("Iron Man", hero->name))
    {
        hero->IronLevel = 4;
    }
}

除了结构体嵌套联合体外，还允许结构体嵌套结构体、联合体嵌套联合体、联合体嵌套结构体等，由此可以组合成复杂的数据结构。

2.6.4 结构体、联合体、数组混合使用

可以创建结构体数组，联合体数组，或更加复杂数据结构类型的数组。

typedef struct _SuperHero
{
    char* name;
    char* actor;
    union
    {
        unsigned short ShieldLevel;
        unsigned short IronLevel;
    };      // 结构体中允许使用匿名联合体.
}SuperHero;

SuperHero MarvelHeros[8000];     // 听说漫威有 7000 多个超级英雄，多余空位预留吧！

MarvelHeros[0].name = "Black Widow";
MarvelHeros->actor = "Scarlett Johansson";

2.6.5 结构体与内存对齐

计算机有一个特点，如果访问的内存地址是自然对齐的（由计算机地址总线位宽决定），那么访问速度就比较快。如果不是自然对齐的，访问速度就会慢一些。基于此特性，编译器会对我们的程序进行一些优化，使得没有特殊的情况下，变量总是自然对齐。

编译器的这个特性造成了一些奇怪的现象。

struct
{
    char a;
    char b;
}sta;

struct
{
    char a;
    short b;
    char c;
}stb;

struct
{
    char a;
    short b;
    char c;
    int d;
}stc;

printf("%d\n", sizeof(sta));    // 输出 2.
printf("%d\n", sizeof(stb));    // 输出 6.
printf("%d\n", sizeof(stc));    // 输出 12.

由于 stb 中元素 b 需要对齐到 2 倍数地址上，所以在元素 a 和元素 b 之间需要空出一个字节。另外，由于结构体自身对齐值为其元素中最大的那个，造成 stb 也需要对齐到 2 倍数的地址上，因此其最后一个元素 c 后面也要保留一个字节。这对于结构体 stc 来说也是一样的。

某些情况下需要取消默认对齐，通常是要求结构体按字节对齐，方法如下：

#pragma pack(push, 1)

struct
{
    char a;
    short b;
    char c;
    int d;
}stc;

#pragma pack(pop)

printf("%d\n", sizeof(stc));    // 输出 8.

需要注意的是，不同编译器下，修改对齐的方法可能不同。

总结一下结构体对齐的原则：

数据类型自身的对齐值：char型数据自身对齐值为1字节，short型数据为2字节，int/float型为4字节，double型为8字节。
结构体或类的自身对齐值：其成员中自身对齐值最大的那个值。
指定对齐值：#pragma pack (value)时的指定对齐值value。
数据成员、结构体和类的有效对齐值：自身对齐值和指定对齐值中较小者。

2.6.6 位域

在结构体中，有一种特别的进行位操作的方法：

struct
{
    char bit0:1;
    char bit1:3;
    char bit2:4;
    char bit3:2;
}reg;


printf("%d\n", sizeof(reg));    // 输出 2.

其中，bit0 占 1 位，bit1 占 3 位，bit2 占 4 位，bit3 占 2 位。从 bit0 到 bit2 共占据一个字节空间，bit3要占据一个字节的两位，其余位空置，因此结构体变量 reg 的长度为 2。位域比较适合应用在嵌入式系统中描述寄存器，因为嵌入式系统中，很多设备的寄存器功能都是按位划分的。

练习

一个 RS485 通讯报文如下：

Byte	Description
0	CMD ID
1	Fun/Dir/Type
2	Dst Addr
3	Data[0]
4	Data[1]
5	Data[2]
6	Data[3]
7	Data[4]
8	Data[5]
9	Data[6]
10	Data[7]
11	CRC L
12	CRC H

当 CMD ID 为 0 时，Fun 功能有效；当 CMD ID 为 1 时，Dir 功能有效；当 CMD ID 为 2 时，Type 功能有效（Type 的 0 位代表使能，1位表示读/写，2位表示多功能设备）。请根据报文结构实现 RS485 数据发送程序。

5.8 KiB Raw Blame History Unescape Escape