月度归档：2011年06月

让用户可以扩展属性的应用设计

在我们的一些应用中，我们可能不能完全设想到用户需要什么样的属性。比如给你一个用户个人信息记录页面，你可能能想到常用的信息，比如


用户名	xxxxx
邮箱	xxxx@xxxxx.com
电话	13xxxxxxxxx

但后来用户发现，他可能想记录下自己工作的地址，这样可以方便别人找到自己，那怎么办呢？我们系统开始没有设计这个属性呢。这时候，我们就需要一种方案来轻松的让用户扩展属性。目前gmail的联系人里面就有这个功能。我们的扩展不能去修改原来的表结构，那样不安全，而且由于每个人的需求不一样，很难做到满足大众的个性化需求。这样，我们可以设计一个表来专门支持属性扩展。

我们设计的表结构如下，（oracle）


create table C_Dic
(
   /* 主键 */
   id                   Integer                        not null,
   /* 表名 */
   tableName            varchar2(50)                   null,
   /* 所扩展表的主键，可以两种格式存储，json和索引算法。
      json 格式简单，易读，但查询效率较低，索引算法生成的串不可读
，
    但效率较高。 比如， md5(table+ k1 + k2)
   */
   "key"                varchar2(254)                  null,
   /* 所扩展表最原始的可以值。json格式。 */
   keys                 varchar2(254)                  null,
   /* 扩展的属性名, 用来取得数据， 以备可能的查询使用。 */
   fieldName            varchar2(64)                   null,
   /* 扩展的属性的现实名称。用来向用户显示。 */
   disName              varchar2(64)                   null,
   /* 属性值 */
   value                varchar2(1024)                 null,
   created              Date                           null,
   modifiled            Date                           null,
   constraint PK_C_DIC primary key clustered (id)
);

其中要特别注意， key 属性用来存储的是一个根据表名、主键值生成的一个字符串，这样可以简化在字典表中的记录，但不易于读取，所以我们用keys属性来存储可读的主键值，采用json格式存储。

下面我们来看一个例子，扩展用户(c_user)的地址和角色资源(c_role_res)的创建者，

这样就完成了属性扩展工作了。那么我们该怎样获取扩展的属性呢？很简单，先计算 md5(table_name + k1 + k2), 的值，

比如用户表c_user就计算 md5(‘c_user’ + 1), 这样就的到一个值，然后通过


select fieldName, disName, value from C_Dic where

tableName='c_user' and key = '计算的md5值'

来获取给这条记录扩展的属性属性值。

至此。基本就完成了这个可扩展属性的设计工作。

作者：http://idocbox.com

java内存泄漏的若干情形

发表评论

用java编写的程序存在内存泄露吗？大家可能认为JVM(java虚拟机)有良好的垃圾回收机制(GC), 不想C/C++那样需要手动回收内存。然而事实是，JVM也是基于一些算法来进行的，在满足一定条件下才能回收内存。

所以，一旦一个内存不能使用需要回收，但却不满足JVM 垃圾回收算法的条件时，那块内存就无法被GC回收，这时就会产生内存泄露。

为了讲解java内存泄露的几种情形，我们需要简单的介绍一下JVM垃圾回收器的回收算法。所谓垃圾回收，就是查找那些分配的、但没有任何对象指向（引用）的内存。举个简单的例子，

public void f(){ String str = new String(); }

那么，当调用完函数f()后，函数内部对象str不会被任何别的对象引用，此时垃圾回收器就会回收str指向的空间。这就是最简单的情形。对于一个java程序，在运行时，先会由JVM的加载进来，内部个对象也在创建、运行过程中会相互引用，从而形成一个复杂的引用关系图。GC就会一直检测这张图中的个对象，一旦发现某个对象没有任何其它对象指向它，GC就会试着去回收它的内存空间。基于这个原理，jvm中常用的回收算法主要有：

1. 引用计数法
引用计数法是唯一没有使用根集的垃圾回收的法，该算法使用引用计数器来区分存活对象和不再使用的对象。一般来说，堆中的每个对象对应一个引用计数器。当每一次创建一个对象并赋给一个变量时，引用计数器置为1。当对象被赋给任意变量时，引用计数器每次加1当对象出了作用域后(该对象丢弃不再使用)，引用计数器减1，一旦引用计数器为0，对象就满足了垃圾收集的条件。
基于引用计数器的垃圾收集器运行较快，不会长时间中断程序执行，适宜地必须实时运行的程序。但引用计数器增加了程序执行的开销，因为每次对象赋给新的变量，计数器加1，而每次现有对象出了作用域生，计数器减1。

　　2. tracing算法
tracing算法是为了解决引用计数法的问题而提出，它使用了根集的概念。基于tracing算法的垃圾收集器从根集开始扫描，识别出哪些对象可达，哪些对象不可达，并用某种方式标记可达对象，例如对每个可达对象设置一个或多个位。在扫描识别过程中，基于tracing算法的垃圾收集也称为标记和清除(mark-and-sweep)垃圾收集器.

3. compacting算法
为了解决堆碎片问题，基于tracing的垃圾回收吸收了Compacting算法的思想，在清除的过程中，算法将所有的对象移到堆的一端，堆的另一端就变成了一个相邻的空闲内存区，收集器会对它移动的所有对象的所有引用进行更新，使得这些引用在新的位置能识别原来的对象。在基于Compacting算法的收集器的实现中，一般增加句柄和句柄表。

4. copying算法
该算法的提出是为了克服句柄的开销和解决堆碎片的垃圾回收。它开始时把堆分成一个对象面和多个空闲面，程序从对象面为对象分配空间，当对象满了，基于coping算法的垃圾收集就从根集中扫描活动对象，并将每个活动对象复制到空闲面(使得活动对象所占的内存之间没有空闲洞)，这样空闲面变成了对象面，原来的对象面变成了空闲面，程序会在新的对象面中分配内存。
一种典型的基于coping算法的垃圾回收是stop-and-copy算法，它将堆分成对象面和空闲区域面，在对象面与空闲区域面的切换过程中，程序暂停执行。

5. generation算法
stop-and-copy垃圾收集器的一个缺陷是收集器必须复制所有的活动对象，这增加了程序等待时间，这是coping算法低效的原因。在程序设计中有这样的规律：多数对象存在的时间比较短，少数的存在时间比较长。因此，generation算法将堆分成两个或多个，每个子堆作为对象的一代(generation)。由于多数对象存在的时间比较短，随着程序丢弃不使用的对象，垃圾收集器将从最年轻的子堆中收集这些对象。在分代式的垃圾收集器运行后，上次运行存活下来的对象移到下一最高代的子堆中，由于老一代的子堆不会经常被回收，因而节省了时间。

6. adaptive算法
在特定的情况下，一些垃圾收集算法会优于其它算法。基于Adaptive算法的垃圾收集器就是监控当前堆的使用情况，并将选择适当算法的垃圾收集器。

通过对以上各算法的对比，我们可以看出，这些算法的目的在于尽可能的高效的去回收所有的垃圾内存。为了发现内存泄露的情形，我们可以看到各算法中回收条件如下：

1. 引用计数法的回收条件是：对象的引用计数器为0。

2. tracing算法、compacting算法、copying算法、 generation算法、adaptive算法的回收条件是：对象不可达。

也就是说，一旦一个对象被引用，那么GC就无法回收，什么情况下会产生该回收而不能回收的现象（内存泄露）呢? 常见的有以下几种：

1. 对象的循环引用： A对象指向B对象， B对象又指向A对象，这时，gc将不能回收A和B。注：引用计数算法无法解决给情形下的内存泄露，但根据对象不可达原则可以回收。无论如何，应该尽可能避免循环引用。

2. 长生命期引用短生命期变量：比如将一个函数内部的对象返回，然后用一个class的static变量引用它，那么这个函数内部的变量将永远无法被回收，原因在于，class的static变量在加载到jvm中时就会被创建，导致那个函数内部变量一直处于被引用状态。

关于内存泄露，在《Bitter Java》这本书中有较详细的介绍。

参考文献：

1. http://www.blogjava.net/Jack2007/archive/2008/04/11/192288.html

2. http://www.ibm.com/developerworks/cn/java/l-JavaMemoryLeak/

作者：豆博草堂

缓存算法探究

发表评论

为什么要使用缓存？缓存的最大优点在于可以达到用空间换时间的效果，避免一些不必要的计算，从而提高应用程序的响应速度。

目前有很多缓存框架，比如ehcache, memcached, memcache， OSCache等等。然而，无论何种框架，基本上就是以<key, object>这种映射机制将对象记录起来，等下次需要对象object时，先计算它的key值，然后到缓存中根据key来取，取得后返回该对象，否则创建该对象，并在一定的条件下进行缓存。另外，由于绝大多数缓存都是将对象存储在内存中，而内存又相对有限，所以不可能缓存所有对象，需要有选择的缓存，有选择的淘汰一些对象。考虑到这些，一个缓存算法必须具备缓存和淘汰机制。基于这种思想，豆博草堂设计了如下缓存算法：

Map<KeyObject, Object> cacheMap = new HashMap<KeyObject, Object>(); Map<KeyObject, Integer> visiteCountMap = new HashMap<KeyObject, Integer>(); int cacheSize = 100; /** * retrivee object. */ Object retrieve(KeyObject key){ Object obj = null; if(cacheMap.containsKey(key)){ obj = cacheMap.get(key); } else { //find given key's object from other way. obj = service.findObject(key); if(null != obj){ cacheMap.put(key, obj); } } //increate count. if(visiteCountMap.containsKey(key)){ visiteCountMap.put(key, visiteCountMap.get(key) + 1); } else { visiteCountMap.put(key, new Integer(1)); } //eliminate some cached object while size >= 100. if(cacheMap.size() >= cacheSize){ eliminate(); } return obj; } /** * eliminate object that not visited usually. */ void eliminate(){ Set<KeyObject> keys = cacheMap.keySet(); if(null != keys){ for(KeyObject key : keys){ if(visiteCountMap.get(key).intValue < 5){ //eliminate the object. cacheMap.remove(key); } } } }

希望这个算法对你编写具备缓存机制的程序有帮助。

作者：豆博草堂