【STL】vector的模拟实现
目录
- vector简介
- 模拟实现需要注意的问题
- 1. Capacity增长问题
- 2. 使用memcpy拷贝问题
- 3. 迭代器失效问题
- 代码实现
vector简介
- vector是表示可变大小数组的序列容器。
- 就像数组一样,vector也采用的连续存储空间来存储元素。也就是意味着可以采用下标对vector的元素 进行访问,和数组一样高效。但是又不像数组,它的大小是可以动态改变的,而且它的大小会被容器自 动处理。
- 本质讲,vector使用动态分配数组来存储它的元素。当新元素插入时候,这个数组需要被重新分配大小 为了增加存储空间。其做法是,分配一个新的数组,然后将全部元素移到这个数组。就时间而言,这是
一个相对代价高的任务,因为每当一个新的元素加入到容器的时候,vector并不会每次都重新分配大小。- vector分配空间策略:vector会分配一些额外的空间以适应可能的增长,因为存储空间比实际需要的存 储空间更大。不同的库采用不同的策略权衡空间的使用和重新分配。但是无论如何,重新分配都应该是
对数增长的间隔大小,以至于在末尾插入一个元素的时候是在常数时间的复杂度完成的。- 因此,vector占用了更多的存储空间,为了获得管理存储空间的能力,并且以一种有效的方式动态增 长。
- 与其它动态序列容器相比(deques, lists and forward_lists), vector在访问元素的时候更加高效,在 末尾添加和删除元素相对高效。对于其它不在末尾的删除和插入操作,效率更低。比起lists和 forward_lists统一的迭代器和引用更好。
优点:
支持下标的随机访问,可以很好的支持很多算法,如二分、排序等
缺点:
1.插入删除的效率较低,因为需要挪动数据,效率为O(n ),不支持头插。
2.因为是顺序结构,所以空间不够时需要增容,而增容需要申请新空间,将数据拷贝到新空间,释放旧空间,造成了效率的低下。
模拟实现需要注意的问题
1. Capacity增长问题
在Windows的vs环境下,capacity的增长接近于1.5倍,而在Linux的g++环境下,capacity的增长是2倍。不要固化的认为,顺序表增容都是2倍,具体增长多少是根据具体的需求定义的
如果按2倍增长capacity:能减少申请的次数,因为每次申请新空间都需要重新拷贝数据,所有这样可以提高效率,但也可能因为申请的空间过多造成资源的浪费。
如果按1.5倍增长capacity:比起2倍更不容易造成资源浪费,但如果需求的空间过大,就需要多次扩容,因为扩容的次数过多,导致效率低。
到底是以时间换空间,还是以空间换时间需要看具体的应用场景
2. 使用memcpy拷贝问题
memcpy是内存的二进制格式拷贝,将一段内存空间中内容原封不动的拷贝到另外一段内存空间中,一个字节一个字节的拷贝。
如果拷贝的是自定义类型的元素,memcpy即高效又不会出错,但如果拷贝的是自定义类型元素,并且自定义类型元素中涉及到资源管理时,就会出错,因为memcpy的拷贝实际是浅拷贝。
如果vector的元素是string类,当拷贝string时,拷贝_size和_capacity都没有问题,但是拷贝_str时他就直接把str的地址拷贝过去了,这时当释放原空间时,_str也被释放掉,而新数据中的_str指向一个被释放的空间,当调用析构函数,会导致空间被重复释放,会出现错误。
3. 迭代器失效问题
迭代器的主要作用就是让算法能够不用关心底层数据结构,其底层实际就是一个指针,或者是对指针进行了封装,比如:vector的迭代器就是原生态指针T*。因此迭代器失效,实际就是迭代器底层对应指针所指向的空间被销毁了,而使用一块已经被释放的空间,造成的后果是程序崩溃(即如果继续使用已经失效的迭代器,程序可能会崩溃)
1. 会引起其底层空间改变的操作,都有可能是迭代器失效,比如:resize、reserve、insert、assign、push_back等。
int main()
{
vector<int> v{ 1,2,3,4,5,6 };
auto it = v.begin();
// 将有效元素个数增加到100个,多出的位置使用8填充,操作期间底层会扩容
v.resize(100, 8);
while(it != v.end())
{
cout<< *it << " " ;
++it;
}
cout<<endl;
return 0;
}
resize操作,都有可能会导致vector扩容,也就是说vector底层原理旧空间被释放掉, 而在打印时,it还使用的是释放之间的旧空间,在对it迭代器操作时,实际操作的是一块已经被释放的空间,而引起代码运行时崩溃。
解决方式:在以上操作完成之后,如果想要继续通过迭代器操作vector中的元素,只需给it重新赋值即可。
2. 指定位置元素的删除操作–erase
int main()
{
int a[] = { 1, 2, 3, 4 };
vector<int> v(a, a + sizeof(a) / sizeof(int));
//找到3的位置并删除
vector<int>::iterator pos = find(v.begin(), v.end(), 3);
v.erase(pos);
cout << *pos << endl; // 此处会导致非法访问
return 0;
}
erase删除pos位置元素后,pos位置之后的元素会往前搬移,没有导致底层空间的改变,理论上讲迭代器不应该会失效,但是:如果pos刚好是最后一个元素,删完之后pos刚好是end的位置,而end位置是没有元素的,那么pos就失效了。因此删除vector中任意位置上元素时,vs就认为该位置迭代器失效
了。
迭代器失效解决办法:在使用前,对迭代器重新赋值即可
代码实现
#pragma once
#define _CRT_SECURE_NO_WARNINGS
#include <iostream>
#include <assert.h>
#include <vector>
#include <algorithm>
using namespace std;
namespace lc
{
//类模板
template<class T>
class vector
{
public:
//Vector的迭代器是一个原生指针
typedef T* iterator;
typedef const T* const_iterator;
//迭代器
iterator begin()
{
return _start;
}
iterator end()
{
return _finish;
}
const_iterator cbegin()
{
return _start;
}
const_iterator cend() const
{
return _finish;
}
vector()
: _start(nullptr)
, _finish(nullptr)
, _endOfStorage(nullptr)
{
}
vector(size_t n, const T& value = T())
// :_start(nullptr)
// , _finish(nullptr)
// , _endOfStorage(nullptr)
//{
// reserve(n);
// while (n--)
// {
// *_finish = value;
// _finish++;
// }
//}
{
//直接用resize就可以,功能一样
resize(n, value);
}
vector(int n, const T& value = T())
:_start(nullptr)
, _finish(nullptr)
, _endOfStorage(nullptr)
{
reserve(n);
while (n--)
{
*_finish = value;
_finish++;
}
}
// 若使用iterator做迭代器,会导致初始化的迭代器区间[first,last)只能是vector的迭代器
// 重新声明迭代器,迭代器区间[first,last)可以是任意容器的迭代器
template <class InputIterator>
vector(InputIterator first, const InputIterator last)
:_start(nullptr)
, _finish(nullptr)
, _endOfStorage(nullptr)
{
while (first != last)
{
push_back(*first);
++first;
}
}
void swap(vector<T>& v)
{
std::swap(_start, v._start);
std::swap(_finish, v._finish);
std::swap(_endOfStorage, v._endOfStorage);
}
//拷贝构造
vector(vector<T>& v)
:_start(nullptr)
, _finish(nullptr)
, _endOfStorage(nullptr)
{
//构造一个临时对象,然后交换
vector<T> tmp(v.begin(), v.end());
swap(tmp);
}
//赋值拷贝
vector<T>& operator= (vector<T> v)
{
swap(v);
return *this;
}
~vector()
{
delete[] _start;
_start = _finish = _endOfStorage = nullptr;
}
size_t size() const
{
return _finish - _start;
}
size_t capacity() const
{
return _endOfStorage - _start;
}
void reserve(size_t n)
{
size_t sz = size();
if (n > capacity())
{
T* tmp = new T[n];
//这里不能像string一样使用strcpy或者memcpy,因为这两个都是按照字节拷贝,如果vector内部元素是string类,浅拷贝就会出问题
//if (_start)
//{
// memcpy(tmp, _start, sizeof(T) * size());
// delete[] _start;
//}
if (_start)
{
for (size_t i = 0; i < sz; i++)
{
tmp[i] = _start[i];
}
delete[] _start;
}
_start = tmp;
_finish = _start + sz;
_endOfStorage = _start + n;
}
}
void resize(size_t n, const T& value = T())
{
if (n > capacity())
{
reserve(n);
}
if (n > size())
{
while (_finish < _start + n) {
*_finish = value;
_finish++;
}
}
else
{
_finish = _start + n;
}
}
T& operator[](size_t pos)
{
assert(pos < size());
return *(_start + pos);
}
const T& operator[](size_t pos)const
{
assert(pos < size());
return *(_start + pos);
}
void push_back(const T& x)
{
//if (size() == capacity())
//{
// reserve(capacity() == 0 ? 4 : 2 * capacity());
//}
//*_finish = x;
//_finish++;
insert(end(), x);
}
void pop_back()
{
assert(_finish > _start);
_finish--;
}
iterator insert(iterator pos, const T& x)
{
assert(pos <= _finish);
assert(pos >= _start);
if (size() == capacity())
{
size_t len = pos - _start;
reserve(capacity() == 0 ? 4 : capacity() * 2);
pos = _start + len;
}
iterator p = _finish;
while (p >= pos)
{
*p = *(p - 1);
p--;
}
*pos = x;
_finish++;
return pos;
}
iterator erase(iterator pos)
{
assert(pos >= _start);
assert(pos < _finish);
iterator it = pos + 1;
while (it < _finish)
{
*(it - 1) = *it;
it++;
}
_finish--;
return pos;
}
T& front()
{
assert(size() > 0);
return *_start;
}
T& back()
{
assert(size() > 0);
return *(_finish - 1);
}
private:
iterator _start; // 指向数据块的开始
iterator _finish; // 指向最后一个数据的下一个位置
iterator _endOfStorage; // 指向存储容量的尾
};