内存管理

jsj...@sohu.com

unread,

Oct 21, 2005, 8:31:16 AM10/21/05

to 字符创造世界

这里将比较广泛地讨论内存管理的一些概念以及在程序中可能会出现的一些有争议的东西。

jsj...@sohu.com

unread,

Oct 21, 2005, 8:34:03 AM10/21/05

to 字符创造世界

我们在编写一段程序的时候，常常要用声明变量、动态分配等方式分配一块内存中的区域，在其中存储特定的值以备程序中使用。那么，这些被分配的内存区域在内存空间中是怎样存放的呢？本文将就此给出一些个人的理解，欢迎大家探讨！

一．存空间的对齐规则

首先看一段例子：
……
int i1;
char c1;
char c2;
int i2;

cout << "i1:" <<&i1 << "\n";
cout << "c1:" <<(void *)&c1 << "\n";
cout << "c2:" <<(void *)&c2 << "\n";
cout << "i2:" <<&i2 << "\n";
……
输出结果如下：
i1:0012FF4C
c1:0012FF48
c2:0012FF44
i2:0012FF40
是不是有些奇怪？
我们知道char类型的变量是只占用一个字节的，用sizeof(char)得到的结果也会是1。但在这里我们看到，c1和c2都被分配了4个字节的存储空间，尽管我们用c1、c2只能访问其中的一个！
Windows确实是这样做的。在为变量/对象分配内存的时候，总是以4字节对齐，无论你的变量类型是什么。也就是说，任何一个变量/对象的存储空间都是以4的整数倍的地址开始的。
为什么会这样？我不知道，大概这跟操作系统的位数有关吧！本人系统是Win2000，以上结果也是在2000中得到的。在DOS6.22/7.0下是什么情况？我想应该是两字节（16位）对齐，但是没试过。如果哪位大虾感兴趣的话可以试一试，别忘了把结果跟我说一下！^_^

下面我们稍微做一下改动，将四个变量声明到一个结构中：
struct test
{
int i1;
char c1;
char c2;
int i2;
};
然后在main()中执行以下语句：

test s;
cout << "s.i1:" <<&s.i1 << "\n";
cout << "s.c1:" <<(void *)&s.c1 << "\n";
cout << "s.c2:" <<(void *)&s.c2 << "\n";
cout << "s.i2:" <<&s.i2 << "\n";
结果如下：
s.i1:0012FF50
s.c1:0012FF54
s.c2:0012FF55
s.i2:0012FF58
晕了~~~~~~~~~~~~~~~~这里的c1怎么就给分配了一个字节的空间？上面不是说总是4字节对齐吗？怎么这里又不舍的给那三个字节了？再看c2，更晕了!@#$%^&*怎么给它老人家三个字节空间？
看来在结构中，结构成员的内存分配不总是4字节对齐的了，而是跟变量本身的大小有关了。例如sizeof(char)=1,
所以char
型变量以1字节对齐；sizeof(short)=2，所以short型变量以2字节对齐等等。经过实验证明，在类中也是这样做的。
但是要注意，对于一个结构实例/类实例而言，它们是作为一个对象而存在的，所以为他们分配的空间还是要以4字节对齐。

二．栈内存与堆内存

我们都知道，当我们想得到一块特定大小的存储区域的时候，可以用声明变量来获取，也可以用new操作符获取。例如我想获得一块存储4个整数的空间，以下方式都可以得到：
int iArray[4];
int pPointer = new int[4];
这两种方式是不相同的。声明变量/数组的方式，是在栈中分配内存。程序中的每一个函数都有自己的栈，用于为函数作用域内的变量/对象分配存储空间。当调用完此函数返回的时候，栈空间自动被收回，其中的内容也就全部无效了。而new是在堆中分配内存的，而且一经分配则永久保留，直到显式的以delete运算符来释放掉。如果不进行delete，则会造成内存泄露。
C函数库中的malloc/free也是在堆中分配内存的，与new/delete相比，二者在为对象分配空间的时候有所区别。关于这个此处不做过多解释，有兴趣的读者可以去查阅相关资料。
下面举一个例子，来演示堆内存和栈内存的使用。
char *GetMemory(void)
{
char p [] ="Hello world";
return p;
}
void Test(void)
{
char *str =NULL;
str =GetMemory();
printf(str)}
{
建立一个完整的程序，调用以上的Test函数，然后看看输出了什么？

Hello world

哈哈……成功！~~~~~~~~~~~~~~~
再运行一遍，乱码！！！
再来一遍？一半正确，一般是乱码！！！
有鬼呀~~~~~~~~~~~~~~

呵呵……是栈内存在作怪。
char p [] =="Hello
world";是在栈中分配的存储区域，它在GetMemory返回时已经失效了，里面的内容可能任何值但是已经没有了意义。
将以上程序改动一下：
char *GetMemory(void)
{
char str[] = "Hello world";
int isize = strlen(str) + 1;
char *p = new char[isize];
memcpy(p, str, isize);
return p;
}
编译，运行……
Hello world
再来一遍？来十遍都不会错了！这里返回的是指向堆内存的指针，即使函数结束了也不会释放。当然，如果你在程序结束前不用delete释放掉它的话，它就永远在哪儿了
。这也应该叫做“常驻内存”吧？哈哈……

jsj...@sohu.com

unread,

Oct 24, 2005, 9:04:51 AM10/24/05

to 字符创造世界

[常量数据（const data）区：]
常量数据区存储字符串等在编译期间就能确定的值。类对象不能存在于这个区域中。在程序的整个生存周期内，区域中的数据都是可用的。

区域内所有的数据都是只读的，任何企图修改本区域数据的行为都会造成无法预料的后果。之所以会如此，是因为在实际的实现当中，即使是最底层的内部存储格式也受制于所实现的特定的优化方案。例如，一种编译器完全可以把字符串存放在几个重叠的对象里面――只要实现者愿意的话。

[栈（stack）区：]
栈区存储自动变量（automatic
variables）。一般来说，栈区的分配操作要比动态存储区（比如堆（heap）或者自由存储区（free
store））快得多，这是因为栈区的分配只涉及到一个指针的递增，而动态存储区的分配涉及到较为复杂的管理机制。栈区中，内存一旦被分配，对象就立即被构造好了；对象一旦被销毁，分配的内存也立即被收回（译注：这里作者用了“去配（deallocate）”一词，鄙人一律翻译为“回收”）。因此，在栈区中，程序员没有办法直接操纵那些已经被分配但还没有被初始化的栈空间（当然，那些通过使用显式（explicit）析构函数（destructor）和new运算符而故意这么做的情况不算在内）。

[自由存储区（free store）：]
自由存储区（free
store）是C++两个动态内存区域之一，使用new和delete来予以分配和释放（freed）。在自由存储区（free
store）中，对象的生存周期可以比存放它的内存区的生存周期短；这也就是说，我们可以获得一片内存区而不用马上对其进行初始化；同时，在对象被销毁之后，也不用马上收回其占用的内存区。在对象被销毁而其占用的内存区还未被收回的这段时间内，我们可以通过void*型的指针访问这片区域，但是其原始对象的非静态成员以及成员函数（即使我们知道了它们的地址）都不能被访问或者操纵。

[堆（heap）区：]

堆（heap）区是另一个动态存储区域，使用malloc、free以及一些相关变量来进行分配和回收。要注意，虽然在特定的编译器里缺省的全局运算符new和delete也许会按照malloc和free的方式来被实现，但是堆（heap）与自由存储区（free
store）是不同的――在某一个区域内被分配的内存不可能在另一个区域内被安全的回收。堆（heap）中被分配的内存一般用于存放在使用new的构造过程中和显式（explicit）的析构过程中涉及到的类对象。堆中对象的生存周期与自由存储区（free
store）中的类似。

[全局/静态区（Global/Static）：]

全局的或静态的变量和对象所占用的内存区域在程序启动（startup）的时候才被分配，而且可能直到程序开始执行的时候才被初始化。比如，函数中的静态变量就是在程序第一次执行到定义该变量的代码时才被初始化的。对那些跨越了翻译单元（translation
unit）的全局变量进行初始化操作的顺序是没有被明确定义的，因而需要特别注意管理全局对象（包括静态类对象）之间的依赖关系。最后，和前面讲的一样，全局/静态区（Global/Static）中没有被初始化的对象存储区域可以通过void*来被访问和操纵，但是只要是在对象真正的生存周期之外，非静态成员和成员函数是无法被使用或者引用的。

Reply all

Reply to author

Forward