实现Lua中数据类型的源码分享

概述

    在Lua中有8种基础类型:nil、boolean、number、string、userdata、function、thread和table。可以使用函数type查看某个变量或值的类型,返回相应的类型名称。像其他动态语言一样,在语言中没有类型定义的语法,每个值都携带了它自身的类型信息。下面将通过Lua 5.2.1的源码来看类型的实现。

   源码实现

     Lua将值表示成带标志的联合结构,代码如下(lobject.h):

 90 /* 
 91 ** Union of all Lua values 
 92 */ 
 93 typedef union Value Value; 
100 /* 
101 ** Tagged Values. This is the basic representation of values in Lua, 
102 ** an actual value plus a tag with its type. 
103 */ 
104  
105 #define TValuefields  Value value_; int tt_ 
400 struct lua_TValue { 
401  TValuefields; 
402 }; 

可以看出结构体有两个成员:

    一个是整型的tt_用来表示数据类型,Lua中所有的数据类型定义如下(lua.h):

78 #define LUA_TNIL    0 
79 #define LUA_TBOOLEAN    1 
80 #define LUA_TLIGHTUSERDATA 2 
81 #define LUA_TNUMBER   3 
82 #define LUA_TSTRING   4 
83 #define LUA_TTABLE   5 
84 #define LUA_TFUNCTION    6 
85 #define LUA_TUSERDATA    7 
86 #define LUA_TTHREAD   8 

可以看到实现了9种数据类型,其中把语法中userdata分为LUA_TLIGHTUSERDATA和LUA_TUSERDATA,其中前一种类型即为轻量级userdata(light userdata),轻量级userdata是一种表示C指针的值,对Lua虚拟机来说,这种数据类型不需要GC(垃圾回收),其指向的内存由用户分配和释放;后一种userdata类型完全userdata(full userdata),内存是由Lua虚拟机分配,并有GC机制负责处理。

 结构体lua_TValue另一个数据成员是value_,它是一个联合体,代码如下(lobject.h):

 96 #define numfield  lua_Number n;  /* numbers */ 
103 typedef LUA_NUMBER lua_Number;(lua.h) 
392 #define LUA_NUMBER   double(luaconf.h) 
391 union Value {  
392  GCObject *gc;  /* collectable objects */ 
393  void *p;     /* light userdata */ 
394  int b;      /* booleans */ 
395  lua_CFunction f; /* light C functions */ 
396  numfield     /* numbers */ 
397 }; 

通过注释,可以很容易理解每个成员的含义,但有必要对以下几个成员说明:

    numfield:用来表示所有数值,其实质对应的是double类型。包括整型也是用这个来表示。另外在Lua 5.3实现,分开了整型和浮点数的表示。

    GCObject *gc:用来指向那些需要垃圾回收的对象,包括string、table、function、完全userdata和thread类型。GCObject用来表示可以垃圾回收的对象,它也是一个联合体,其代码如下(lstate.h)

185 union GCObject { 
186  GCheader gch; /* common header */ 
187  union TString ts; 
188  union Udata u; 
189  union Closure cl; 
190  struct Table h; 
191  struct Proto p; 
192  struct UpVal uv; 
193  struct lua_State th; /* thread */ 
194 }; 

其中成员GCheader gch主要用于GC回收机制使用。其他成员比如TString ts才是真正存储值的结构,而这些数据结构也会有GCheader,用于GC管理。

    总的来说,Lua中各种数值类型结构如下:

    最后,关于Lua的数据类型实现,值得指出使用带标志的结构体来表示Lua的数值类型,使得Lua中任何一种数据类型至少占用的空间是个16字节(结构体还需要对其),就算nil类型,也会占用8个字节的空间,因此拷贝Lua值是比较耗时的。下一篇文章将讨论Lua字符串的实现。

以上所述就是本文的全部内容了,希望大家能够喜欢。