<C++的空间配置器>——《C++高阶》
目录
1. 什么是空间配置器
2. 为什么需要空间配置器
3. SGI-STL空间配置器实现原理
3.1 一级空间配置器
3.2 二级空间配置器
3.2.1 内存池
3.2.2 SGI-STL中二级空间配置器设计
3.2.3 SGI-STL二级空间配置器之空间申请
3.2.4 SGI-STL二级空间配置器之空间回收 编辑
3.3 空间配置器的默认选择
3.4 空间配置器的再次封装
3.5 对象的构造与释放
4. 与容器结合
后记:●由于作者水平有限,文章难免存在谬误之处,敬请读者斧正,俚语成篇,恳望指教!
——By 作者:新晓·故知
1. 什么是空间配置器
空间配置器,顾名思义就是为各个容器高效的管理空间(空间的申请与回收)的,在默默地工作。虽然在常规使用STL时,可能用不到它,但站在学习研究的角度,学习它的实现原理对我们有很大的帮助。
STL之空间配置器:
2. 为什么需要空间配置器
前面在模拟实现vector、list、map、unordered_map等容器时,所有需要空间的地方都是通过new申请的,虽然代码可以正常运行,但是有以下不足之处:
- 空间申请与释放需要用户自己管理,容易造成内存泄漏
- 频繁向系统申请小块内存块,容易造成内存碎片
- 频繁向系统申请小块内存,影响程序运行效率
- 直接使用malloc与new进行申请,每块空间前有额外空间浪费
- 申请空间失败怎么应对
- 代码结构比较混乱,代码复用率不高
- 未考虑线程安全问题
因此需要设计一块高效的内存管理机制。使用空间配置器:在频繁申请小块内存时:1.效率高。2.一定程度缓解内存碎片的问题。外碎片问题与内碎片问题:
3. SGI-STL空间配置器实现原理
以上提到的几点不足之处,最主要还是:频繁向系统申请小块内存造成的。那什么才算是小块内存?SGI-STL以128作为小块内存与大块内存的分界线,将空间配置器其分为两级结构,一级空间配置器处理大块内存,二级空间配置器处理小块内存。3.1 一级空间配置器
一级空间配置器原理非常简单,直接对malloc与free进行了封装,并增加了C++中set_new_handle思想。template <int inst> class __malloc_alloc_template { private: static void* oom_malloc(size_t); public: // 对malloc的封装 static void* allocate(size_t n) { // 申请空间成功,直接返回,失败交由oom_malloc处理 void* result = malloc(n); if (0 == result) result = oom_malloc(n); return result; } // 对free的封装 static void deallocate(void* p, size_t /* n */) { free(p); } // 模拟set_new_handle // 该函数的参数为函数指针,返回值类型也为函数指针 // void (* set_malloc_handler( void (*f)() ) )() static void (*set_malloc_handler(void (*f)()))() { void (*old)() = __malloc_alloc_oom_handler; __malloc_alloc_oom_handler = f; return(old); } }; // malloc申请空间失败时代用该函数 template <int inst> void* __malloc_alloc_template<inst>::oom_malloc(size_t n) { void (*my_malloc_handler)(); void* result; for (;;) { // 检测用户是否设置空间不足应对措施,如果没有设置,抛异常,模式new的方式 my_malloc_handler = __malloc_alloc_oom_handler; if (0 == my_malloc_handler) { __THROW_BAD_ALLOC; } // 如果设置,执行用户提供的空间不足应对措施 (*my_malloc_handler)(); // 继续申请空间,可能就会申请成功 result = malloc(n); if (result) return(result); } } typedef __malloc_alloc_template<0> malloc_alloc;
3.2 二级空间配置器
二级空间配置器专门负责处理小于128字节的小块内存。如何才能提升小块内存的申请与释放的方式呢?SGI-STL采用了内存池的技术来提高申请空间的速度以及减少额外空间的浪费,采用哈希 桶的方式来提高用户获取空间的速度与高效管理。3.2.1 内存池
内存池就是:先申请一块比较大的内存块已做备用,当需要内存时,直接到内存池中去去,当池中空间不够时,再向内存中去取,当用户不用时,直接还回内存池即可。避免了频繁向系统申请小块内存所造成的效率低、内存碎片以及额外浪费的问题。请大家思考一下几个问题:1. 当用户需要空间时,能否直接从内存池中大块空间中直接截取?为什么?2. 对用户归还的空间能否直接拼接在大块内存前?3. 对用户归还的空间如何进行管理?4. 不断切割会有什么后果?3.2.2 SGI-STL中二级空间配置器设计
SGI-STL中的二级空间配置器使用了内存池技术,但没有采用链表的方式对用户已经归还的空间进行管理(因为用户申请空间时在查找合适的小块内存时效率比较低),而是采用了哈希桶的方式进行 管理。那是否需要128桶个空间来管理用户已经归还的内存块呢?答案是不需要,因为用户申请 的空间基本都是4的整数倍,其他大小的空间几乎很少用到。因此:SGI-STL将用户申请的内存块 向上对齐到了8的整数倍(同学们请思考为什么是8的整数倍,而不是4)。借助哈希桶(基础结构为指针数组)将其管理起来,这样在申请空间时就可以将其挂在桶下,实现内存的分配。
3.2.3 SGI-STL二级空间配置器之空间申请
1. 前期的准备// 去掉代码中繁琐的部分 template <int inst> class __default_alloc_template { private: enum { __ALIGN = 8 }; // 如果用户所需内存不是8的整数倍,向上对齐到8的整数倍 enum { __MAX_BYTES = 128 }; // 大小内存块的分界线 enum { __NFREELISTS = __MAX_BYTES / __ALIGN }; // 采用哈希桶保存小块内存时所需桶的个数 // 如果用户所需内存块不是8的整数倍,向上对齐到8的整数倍 static size_t ROUND_UP(size_t bytes) { return (((bytes)+__ALIGN - 1) & ~(__ALIGN - 1)); } private: // 用联合体来维护链表结构----同学们可以思考下此处为什么没有使用结构体 union obj { union obj* free_list_link; char client_data[1]; /* The client sees this. */ }; private: static obj* free_list[__NFREELISTS]; // 哈希函数,根据用户提供字节数找到对应的桶号 static size_t FREELIST_INDEX(size_t bytes) { return (((bytes)+__ALIGN - 1) / __ALIGN - 1); } // start_free与end_free用来标记内存池中大块内存的起始与末尾位置 static char* start_free; static char* end_free; // 用来记录该空间配置器已经想系统索要了多少的内存块 static size_t heap_size; // ... };
2. 申请空间
// 函数功能:向空间配置器索要空间 // 参数n: 用户所需空间字节数 // 返回值:返回空间的首地址 static void* allocate(size_t n) { obj* __VOLATILE* my_free_list; obj* __RESTRICT result; // 检测用户所需空间释放超过128(即是否为小块内存) if (n > (size_t)__MAX_BYTES) { // 不是小块内存交由一级空间配置器处理 return (malloc_alloc::allocate(n)); } // 根据用户所需字节找到对应的桶号 my_free_list = free_list + FREELIST_INDEX(n); result = *my_free_list; // 如果该桶中没有内存块时,向该桶中补充空间 if (result == 0) { // 将n向上对齐到8的整数被,保证向桶中补充内存块时,内存块一定是8的整数倍 void* r = refill(ROUND_UP(n)); return r; } // 维护桶中剩余内存块的链式关系 *my_free_list = result->free_list_link; return (result); };
3. 填充内存块
4. 向内存池中索要空间
template <int inst> char* __default_alloc_template<inst>::chunk_alloc(size_t size, int& nobjs) { // 计算nobjs个size字节内存块的总大小以及内存池中剩余空间总大小 char* result; size_t total_bytes = size * nobjs; size_t bytes_left = end_free - start_free; // 如果内存池可以提供total_bytes字节,返回 if (bytes_left >= total_bytes) { result = start_free; start_free += total_bytes; return(result); } else if (bytes_left >= size) { // nobjs块无法提供,但是至少可以提供1块size字节内存块,提供后返回 nobjs = bytes_left / size; total_bytes = size * nobjs; result = start_free; start_free += total_bytes; return(result); } else { // 内存池空间不足,连一块小块村内都不能提供 // 向系统堆求助,往内存池中补充空间 // 计算向内存中补充空间大小:本次空间总大小两倍 + 向系统申请总大小/16 size_t bytes_to_get = 2 * total_bytes + ROUND_UP(heap_size >>4); // 如果内存池有剩余空间(该空间一定是8的整数倍),将该空间挂到对应哈希桶中 if (bytes_left > 0) { // 找对用哈希桶,将剩余空间挂在其上 obj** my_free_list = free_list +FREELIST_INDEX(bytes_left); ((obj*)start_free)->free_list_link = *my_free_list; *my_ree_list = (obj*)start_free; } // 通过系统堆向内存池补充空间,如果补充成功,递归继续分配 start_free = (char*)malloc(bytes_to_get); if (0 == start_free) { // 通过系统堆补充空间失败,在哈希桶中找是否有没有使用的较大的内存块 int i; obj** my_free_list, * p; for (i = size; i <= __MAX_BYTES; i += __ALIGN) { my_free_list = free_list + FREELIST_INDEX(i); p = *my_free_list; // 如果有,将该内存块补充进内存池,递归继续分配 if (0 != p) { *my_free_list = p->free_list_link; start_free = (char*)p; end_free = start_free + i; return(chunk_alloc(size, nobjs)); } } // 山穷水尽,只能向一级空间配置器求助 // 注意:此处一定要将end_free置空,因为一级空间配置器一旦抛异常就会出问题 end_free = 0; start_free = (char*)malloc_alloc::allocate(bytes_to_get); } // 通过系统堆向内存池补充空间成功,更新信息并继续分配 heap_size += bytes_to_get; end_free = start_free + bytes_to_get; return(chunk_alloc(size, nobjs)); } }
3.2.4 SGI-STL二级空间配置器之空间回收
// 函数功能:用户将空间归还给空间配置器 // 参数:p空间首地址 n空间总大小 static void deallocate(void* p, size_t n) { obj* q = (obj*)p; obj** my_free_list; // 如果空间不是小块内存,交给一级空间配置器回收 if (n > (size_t)__MAX_BYTES) { malloc_alloc::deallocate(p, n); return; } // 找到对应的哈希桶,将内存挂在哈希桶中 my_free_list = free_list + FREELIST_INDEX(n); q->free_list_link = *my_free_list; *my_free_list = q; }
3.3 空间配置器的默认选择
SGI-STL默认使用一级还是二级空间配置器,通过USE_MALLOC宏进行控制:#ifdef __USE_MALLOC typedef malloc_alloc alloc; typedef malloc_alloc single_client_alloc; #else // 二级空间配置器定义 #endif
在SGI_STL中该宏没有定义,因此:默认情况下SGI_STL使用二级空间配置器3.4 空间配置器的再次封装
在C++中,用户所需空间可能是任意类型的,有单个对象空间,有连续空间,每次让用户自己计算所需空间总大小不是很友好,因此SGI-STL将空间配置器重新再封装了一层:3.5 对象的构造与释放
一切为了效率考虑,SGI-STL决定将空间申请释放和对象的构造析构两个过程分离开,因为有些对象的构造不需要调用析构函数,销毁时不需要调用析构函数,将该过程分离开可以提高程序的性 能:// 归还空间时,先先调用该函数将对象中资源清理掉 template <class T> inline void destroy(T* pointer) { pointer->~T(); } // 空间申请好后调用该函数:利用placement-new完成对象的构造 template <class T1, class T2> inline void construct(T1* p, const T2& value) { new (p) T1(value); }
注意:1. 在释放对象时,需要根据对象的类型确定是否调用析构函数(类型萃取)2. 对象的类型可以通过迭代器获萃取到以上两步在实现时稍微有点复杂,有兴趣的同学可参考STL源码
4. 与容器结合
本例子给出list与空间配置器是如何结合的,大家参考可给出vector的实现。template <class T, class Alloc = alloc> class list { // ... // 实例化空间配置器 typedef simple_alloc<list_node, Alloc> list_node_allocator; // ... protected: link_type get_node() { // 调用空间配置器接口先申请节点的空间 return list_node_allocator::allocate(); } // 将节点归还给空间配置器 void put_node(link_type p) { list_node_allocator::deallocate(p); } // 创建节点:1. 申请空间 2. 完成节点构造 link_type create_node(const T& x) { link_type p = get_node(); construct(&p->data, x); return p; } // 销毁节点: 1. 调用析构函数清理节点中资源 2. 将节点空间归还给空间配置器 void destroy_node(link_type p) { destroy(&p->data); put_node(p); } // ... iterator insert(iterator position, const T& x) { link_type tmp = create_node(x); tmp->next = position.node; tmp->prev = position.node->prev; (link_type(position.node->prev))->next = tmp; position.node->prev = tmp; return tmp; } iterator erase(iterator position) { link_type next_node = link_type(position.node->next); link_type prev_node = link_type(position.node->prev); prev_node->next = next_node; next_node->prev = prev_node; destroy_node(position.node); return iterator(next_node); } // ... };