泛型栈

第六课

泛型栈的接口及实现

栈是最基本的抽象数据类型之一,这一节探讨了在 C 语言环境下,如何利用无类型指针和内存操作实现一个通用的栈 (Generic Stack) — 即可以放进任何类型数据的栈。

Interfaces

typedef struct {
  void *elems;       // 指向栈内数据的无类型指针
  int elemSize;     // 每个数据单元的大小 (字节数)
  int loglength;    // 栈内数据的个数
  int alloclength;    // 为栈分配的动态内存空间能够储存的数据的个数
} stack;

void StackNew(stack *s, int elemSize);     // 创建栈
void StackDispose(stack *s);            // 回收栈
bool StackEmpty(stack *s);            // 查询栈是否为空
void StackPush(stack *s, void *elemAddr);    // 入栈
void StackPop(stack *s, void *elemAddr);    // 出栈

StackNew、StackDispose、StackEmpty、StackPush、StackPop 定义了栈最基本的接口,保证了栈实现的隔离 (Information Hiding)

Implementations

StackNew

创建栈时,使用者需要指定栈内数据单元的大小。知道了数据单元的大小后,只需要直接按照相应大小对内存中的字节直接操作即可完成对不同数据类型的支持

void StackNew(stack *s, int elemSize) {
  s->elemSize = elemSize;
  s->loglength = 0;
  s->alloclength = 4;
  s->elems = malloc(4 * elemSize);
}

StackDispose

StackDispose 只是回收栈中为存储数据动态分配的内存空间,而不是回收栈结构本身。

void StackDispose(stack *s) {
  free(s->elems);
}

StackEmpty

bool StackEmpty(stack *s) {
  return s->loglength == 0;
}

StackPush

StackGrow 采用每次倍增栈内数据的存储空间。由于分配存储空间的复杂度为 O(n) ,因此这种操作应当尽量避免或者能被均摊 (amortized),而倍增策略在均摊情形下是可以达到 O(1) 的,因此这是一种广泛被采用的扩容策略。

StackPush 利用 “指鹿为马” 的黑科技直接将数据源地址中的字节直接拷贝到栈顶。

static void StackGrow(stack *s) {
  s->alloclength *= 2;
  s->elems = realloc(s->elems, s->alloclength * s->elemSize);
}

void StackPush(stack *s, void *elemAddr) {
  if (s->loglength == s->alloclength) {
    StackGrow(s);
  }
  void *destAddr = (char *) s->elems + s->loglength * s->elemSize;
  memcpy(destAddr, elemAddr, s->elemSize);
  s->loglength++;
}

StackPop

基本可以理解为 StackPush 实现的逆操作。值得一提的是,这里的接口设计要求使用者负责创建和回收存储出栈数据的内存空间,从而减少犯错的几率。

void StackPop(stack *s, void *elemAddr) {
  s->loglength--;
  void *sourceAddr = (char *) s->elems + s->loglength * s->elemSize;
  memcpy(elemAddr, sourceAddr, s->elemSize);
}

例子:字符串栈

int main(int argc, char** argv) {
  const char *friends[] = {"Al", "Bob", "Carl"};
  stack stringStack;


  StackNew(&stringStack, sizeof(char *));
  for (int i = 0; i < 3; i++) {
    char *copy = strdup(friends[i]);
    StackPush(&stringStack, &copy);
  }
  // 1. 
  char *name;
  for (int i = 0; i < 3; i++) {
    StackPop(&stringStack, &name);
    printf("%s \n", name);
    free(name);
  }
  StackDispose(&stringStack);

  // 2. 
  // StackDispose(&stringStack);
}

使用通用栈来存放字符串数据与原始类型数据有所不同。存放原始类型数据不涉及动态类型的数据,压入栈中的是该原始数据本身,而存放字符串数据、以及其它自定义结构数据时,压入栈中的是指向字符串或自定义结构数据的指针。如示例中的*copy所示,传入StackPush的是指向字符串的指针的指针,压入栈中的是指向字符串的指针,同理,传入StackPop的是指向字符串的指针的指针,从栈中弹出的是指向字符串的指针。

通用栈中存放指针时,通常还涉及到动态分配内存空间的释放。当指向字符串的指针被压入栈中时,字符串空间释放的责任就从栈的使用方转移到了栈的实现方,而当指向字符串的指针从栈中被弹出时,字符串空间释放的责任又从栈的实现方转移回到了栈的使用方。由于我们无法保证栈的使用者每次都在栈为空的情况下调用StackDispose,因此,栈本身需要知道如何释放栈中元素 — 某指针指向的动态空间。

为了达到上述目的,我们需要修改通用栈的部分接口:

// stack.h
typedef struct {
  void *elems;
  int elemSize;
  int loglength;
  int alloclength;
  void (*freefn)(void *); // 空间释放函数,由栈的使用方提供
} stack;

void StackNew(stack *s, int elemSize, void(*freefn)(void *)); // 传入空间释放函数

// stack.c
void StackNew(stack *s, int elemSize, void (*freefn)(void *)) {
  s->elemSize = elemSize;
  s->loglength = 0;
  s->alloclength = kInitialAllocationSize;
  s->elems = malloc(kInitialAllocationSize * elemSize);
  s->freefn = freefn;
}

void StackDispose(stack *s) {
  // s->freefn == NULL, means there is no dynamically allocated resources
  // s->freefn != NULL, means there is dynamically allocated resources which
  // should be handled properly by s->freefn provided by clients
  if (s->freefn != NULL) {
    for (int i = 0; i < s->loglength; i++) {
      s->freefn((char *)s->elems + i * s->elemSize);
    }
  }
  free(s->elems);
}

这时候,使用 stringStack 就需要传入释放函数:

void StringFree(void *elem) {
  free(*(char **) elem);
}

StackNew(&stringStack, sizeof(char *), StringFree);

参考

Last updated