CPU体系架构-寄存器

CPU通用寄存器作为CPU体系架构的一部分,不可或缺。通用寄存器是CPU的算术逻辑运算操作最直接,频繁的位置。对于RISC体系的CPU,算术逻辑运算甚至只能够操作CPU通用寄存器中的数据。我们的目的不在于详尽的说明每一种CPU体系的寄存器情况,而在于将常用而且在不同CPU体系下容易混淆的寄存器做一个总结。下面就以8086处理器,ARM7内核,MIPS32内核为例说明。

8086处理器通用寄存器

8086处理器,是学习X86处理器的基础(严格意思上来说,8086处理器还不能够算作x86处理器。参考intel处理器发展历史了解更多),所以作为很多大学微机原理课程的教学内容。8086的通用寄存器分为通用数据寄存器和通用地址指针寄存器。

通用数据寄存器为AX,BX,CX,DX。这4个寄存器都是16位寄存器,每个寄存器可以分为高低8位寄存器使用,例如AX可以分为AH和AL两个8位寄存器。

通用地址指针寄存器为SP,BP,SI,DI。通用地址指针寄存器只能够使用16位,用于存放存储器段内16位偏移地址值。

和通用地址指针寄存器相对应,8086还有4个16位的段寄存器,分别为CS,DS,SS,ES。4个16位的段寄存器和4个地址指针寄存器产生20位的地址,用于存储器寻址。

然后就是标志寄存器FLAGS,也是16位。相当于ARM7中的程序状态寄存器cpsr。

最后,就是16位的指令指针寄存器IP,用于存放当前将要执行指令的16位偏移地址。相当于RISC处理器中的程序计数器PC寄存器。

ARM7处理器通用寄存器

ARM7处理器内核使用的是ARMv4指令集,也是现在很多人学习ARM的首选。其实,下面介绍的通用寄存器并不局限于ARM7内核,基本上所有的ARM内核都是相同的。这里选择代表性的ARM7内核作为示例。

ARM7的通用寄存器分为数据寄存器和程序状态寄存器,由于ARM内核可以工作于多种模式下,我们选择最一般,也是最常用的用户模式。在用户模式下,一共有16个数据寄存器r0~r15,1个程序状态寄存器cpsr。这些寄存器都是32位。

16个数据寄存器中,最后3个寄存器(r13,r14,r15)是有特殊用途的。其实,r13和r14有的时候还可以用作通用寄存器。

当然,ARM处理器还可能切换到其它的运行模式,寄存器的数目和使用略有不同。

MIPS32处理器通用寄存器

MIPS处理器,以MIPS32指令集的处理器最为成功和常见,下面就以MIPS32指令集处理器为例说明MIPS的通用寄存器情况。MIPS32拥有32个通用寄存器\(0~\)31,都是32位。

下面就一些特殊用途的,和X86以及ARM处理器有对比关系的寄存器列举出来。

除此之外,MIPS还针对子程序的调用,将寄存器的使用做了明确的划分。例如,利用寄存器\(2,\)3来作为子程序返回值传递的寄存器,利用寄存器\(4~\)7作为向子程序传递参数用的寄存器。所以,要理解MIPS寄存器的使用,还需要经常联系到软件编译的相关知识。

下面,我们就X86,ARM,MIPS中几个常用的,特殊的寄存器做一个详尽的说明。

堆栈指针寄存器sp

可以看到,X86,ARM,MIPS下面都有堆栈指针寄存器。X86为通用地址指针寄存器中的堆栈指针SP,ARM为第14个通用寄存器r13作为堆栈指针寄存器sp,MIPS为第30个通用寄存器$29作为堆栈指针寄存器sp。sp中存放的是堆栈的栈顶地址。稍稍有点区别的是,X86由于地址产生方式的不同,堆栈指针sp(16位)和堆栈段寄存器(16位)共同产生堆栈栈顶地址(20位)。

X86的堆栈指针寄存器是一个特殊用途寄存器,因为该寄存器专门为堆栈设计,并且还有专门的指令pop和push来升降堆栈(入栈,出栈)。而ARM,MIPS的堆栈指针寄存器本质上是一个通用数据寄存器,和其他的通用数据寄存器的地位是一样的。堆栈的升降(入栈,出栈)也没有像X86中的专门的指令来操作,而是使用普通的算术指令(add,sub)来操作。

ARM的寄存器r13(sp)在具体的应用场合,就可以当做通用寄存器使用。--《ARM嵌入式系统开发-软件设计与优化》沈建华 译 P17

另外,需要说明的一点是,堆栈本质上是一个计算机程序(软件)的概念。CPU是为了支持程序运行(你可能会笑,CPU有不运行程序、软件?但是没有找到更好的表述方式),所以设计了堆栈指针寄存器。堆栈指针,从这个名字就可以看出,该寄存器中存放的是一个地址,而且一般是指向存储器的地址。该存储器就是为了来存放程序运行需要保存到堆栈的中数据的。如果程序中不需要使用到堆栈(例如没有函数调用,没有现场保护,或者不使用堆栈这种方式保存),那么完全可以不要堆栈指针寄存器(sp)。这也是为什么RISC处理器的堆栈指针寄存器sp还可以当做通用的数据寄存器使用。

什么程序不需要使用堆栈这种保存方式呢?关键字:跟踪调用链。编程语言的跟踪调用链需要解决的问题有:函数直接如何调用,函数调用之后如何返回等。解决以上问题经典的机制是堆栈中的活动过程记录,例如C语言就是使用该机制。有些语言,如Mesa和Cedar,它们的过程记录以链表的形式分配在堆中,就不需要使用到堆栈。

某些功能特殊,或者结构很简单的芯片上,可能也有堆栈的概念。例如规定,使用了一个深度为2的堆栈来进行分支跳转(汇编语言上),所以嵌套的分支跳转不能够超过2次。这里说的堆栈就是使用硬件实现的。和我们通常意义上使用的堆栈有很大的区别。

如果你想更详尽的理解堆栈和堆栈指针sp的关系,那么,强烈推荐利用C语言的函数调用为实例进行试验。在后面的实例中也会有详细的介绍。

链接寄存器lr/返回地址寄存器ra

ARM的链接寄存器lr和MIPS的返回地址寄存器ra本质上是一样的,都是一个通用寄存器,被当做特殊用途,存放跳转时候的返回地址。这里的跳转是指需要返回的跳转指令,例如MIPS的jal,bal等。并不是指函数的跳转(应该叫做函数的调用更加准确)。

X86是没有专门的寄存器来存放跳转指令的返回地址的。那么,X86的跳转指令的返回是如何做到的呢?X86的跳转返回必须借助于堆栈,也就是说,在调用call指令跳转的时候,返回地址被自动保存到堆栈中了(对应RISC的,返回地址被自动保存到返回寄存器中),返回的时候,调用返回指令ret之后,返回地址被自动加载到指令指针寄存器ip中(对应的RISC中,就是使用jr $ra这种条状来返回,并没有向对应的返回指令。

帧指针寄存器fp

帧指针寄存器fp是MIPS中出现的一个比较特殊的寄存器。这个寄存器涉及到C语言函数的调用活动记录。在本质上还是为了支持计算机程序中的堆栈概念,和堆栈指针寄存器SP是一样的。

在MIPS中,第九个通用寄存器$8,又叫做帧指针(frame pointer,fp),在X86和ARM中都没有使用这样一个名字的寄存器。但是,这本不代表在X86和ARM中就没有相应功能的一个寄存器。在X86中,使用的是通用地址寄存器中的机制指针寄存器BP当做帧指针。ARM是否也有这样的寄存器呢?

那么,帧指针寄存器到底是用来做什么的呢?有关fp/sp(MIPS),ebp/esp(X86)的相关内容,请参考C语言-Stack的相关内容。涉及堆栈帧(stack frame),活动记录(active record),调用惯例(call convention)等相关概念。建议参考《程序员的自我修养-链接、装载与库》的第10.2节-栈和调用惯例。

程序计数寄存器

X86和ARM都有程序寄存器,X86的程序寄存器其实就是指令指针寄存器ip,而ARM的程序寄存器是一个通用寄存器r15。MIPS没有程序寄存器。

程序寄存器pc就是用来指示程序执行的位置,具体来说,就是当前执行指令的下一条指令的地址,告诉CPU要到哪里去取下一条指令。那么,为什么MIPS没有程序寄存器呢?MIPS又是如何知道下一条指令的地址呢?MIPS没有程序计数寄存器,其实是说MIPS的程序计数PC对程序员是不可见的。MIPS的CPU在运行的时候,当然也需要知道当前指令的位置,并且知道下一条指令要到哪个地址去取。当然,MIPS为了优化流水线,所以没有设计程序计数寄存器PC,另外,为了优化流水线,也遗留了加载延迟槽和跳转延迟槽等问题。

全局指针寄存器

全局指针寄存器(gp)是MIPS的通用寄存器$28,X86和ARM都没有这个寄存器,也没有涉及到这样功能的寄存器。gp寄存器的用途主要有两种:

  1. 在PIC中,gp用来指向GOT(Global Offset Table)。注意,这里的PIC是指的Linux中共享库的PIC,而在很多BSP的boot loader中PIC只是简单的代码和地址无关,并不涉及到共享库,所以BSP中的gp的用法并不属于此类。
  2. 在嵌入式开发中,gp用来指向链接时决定的静态数据的地址。这样,对在gp所指地址正负各32K范围内数据的load和store(其实就是ld和sw指令),就可使用gp作为基址寄存器。在romInit()函数向C函数romStart()函数跳转以及usrStart()函数最开始都有gp的初始化。代码如下所示。
    la	gp, _gp			# set global ptr from compiler
    

那么,_gp是什么呢?反汇编查看bootrom的符号表,可以看到,_gp就是链接器在链接时确定的一个静态数据的存放地址。在我们的代码中,大概是0x801656a0。

学习心得

处理器的通用寄存器的设计,直接决定了逻辑处理的流程(例如出入栈,数据Load和store)以及算术处理的过程。而这些流程的确定,也就决定了汇编语言应该如何来组织。这也就要求编译器如何将更加高级的语言(例如C语言)转化成符合处理器架构的汇编语言。下面是摘自《ARM嵌入式系统开发-软件设计与优化》对RISC和CISC在编译器和处理器的关系。

RISC的设计重点在于降低由硬件执行的指令的复杂度,这是因为软件比硬件容易提供更大的灵活性和更高的智能。因此,RISC设计对编译器有更高的要求;相反,传统的复杂指令集的计算机(CISR)则更侧重于硬件执行指令的功能性,使CISC指令变得更复杂。

我们可以用下面的图来概括和理解上面这段话的意思。

CPU结构体系进化主要有两点,一是芯片硬件设计的复杂性,二是编译器的优化。有些人把“RISC”缩写调侃为“Relegate the Impossible Stuff to the Compiler”,即“把不可能完成的任务丢给编译器”。这也正好反映了上图中想要说明的问题。

寄存器的学习和指令集的学习是相互联系的。不过,在寄存器和指令集之间,还有一个常常被人忽略的东西,那就是寻址方式。下一节,我们就来学习寻址方式,为其后的指令集的学习做准备。