CheckPoint

checkpoint是一个内部事件，这个事件激活以后会触发资料库写进程(DBWR)将数据缓冲(DATABUFFER CACHE)中的髒数据块写出到数据档案中。

基本介绍

中文名：内部事件
外文名：CheckPoint
作用：保证资料库的一致性
突发事件：日誌切换

概念

checkpoint是一个内部事件，这个事件激活以后会触发资料库写进程(DBWR)将数据缓冲(DATABUFFER CACHE)中的髒数据块写出到数据档案中。

在资料库系统中，写日誌和写数据档案是资料库中IO消耗最大的两种操作，在这两种操作中写数据档案属于分散写，写日誌档案是顺序写，因此为了保证资料库的性能，通常资料库都是保证在提交(commit)完成之前要先保证日誌都被写入到日誌档案中，而髒数据块则保存在数据快取(buffer cache)中再不定期的分批写入到数据档案中。也就是说日誌写入和提交操作是同步的，而数据写入和提交操作是不同步的。这样就存在一个问题，当一个资料库崩溃的时候并不能保证快取里面的髒数据全部写入到数据档案中，这样在实例启动的时候就要使用日誌档案进行恢复操作，将资料库恢复到崩溃之前的状态，保证数据的一致性。检查点是这个过程中的重要机制，通过它来确定，恢复时哪些重做日誌应该被扫描并套用于恢复。

一般所说的checkpoint是一个资料库事件(event)，checkpoint事件由checkpoint进程(LGWR/CKPT进程)发出，当checkpoint事件发生时DBWR会将髒块写入到磁碟中，同时数据档案和控制档案的档案头也会被更新以记录checkpoint信息。

作用

checkpoint主要2个作用：

保证资料库的一致性，这是指将髒数据写入到硬碟，保证记忆体和硬碟上的数据是一样的;

缩短实例恢复的时间，实例恢复要把实例异常关闭前没有写出到硬碟的髒数据通过日誌进行恢复。如果髒块过多，实例恢复的时间也会很长，检查点的发生可以减少髒块的数量，从而提高实例恢复的时间。

通俗的说checkpoint就像word的自动保存一样。

检查点分类

完全检查点(Normal checkpoint)

增量检查点(Incremental checkpoint)

checkpoint相关概念术语

在说明checkpoint工作原理之前我们先了解一些相关的术语。

完全检查点工作过程

不同阶段

第一阶段，checkpoint进程开始一个checkpoint事件，并记录下checkpoint RBA，这个通常是当前的RBA。

第二阶段，checkpoint进程通知DBWn进程将所有checkpoint RBA之前的buffer cache里面的髒块写入磁碟。

确定髒块都被写入磁碟以后进入到第三阶段，checkpoint进程将checkpoint信息(SCN)写入/更新数据档案和控制档案中。

更新SCN的操作由CKPT进程完成，在Oracle 8.0之后CKPT进程默认是被启用的，如果CKPT进程没有启用的话那相应的操作将由LGWR进程完成。

发生时间

下面这些操作将会触发checkpoint事件：

日誌切换，通过ALTER SYSTEM SWITCH LOGFILE。

DBA发出checkpoint命令，通过ALTER SYSTEM checkpoint。

对数据档案进行热备时，针对该数据档案的checkpoint也会进行，ALTER TABLESPACE TS_NAME BEGIN BACKUP/END BACKUP。

当运行ALTER TABLESPACE/DATAFILE READ ONLY的时候。

SHUTDOWN命令发出时。

特别注意

日誌切换会导致checkpoint事件发生，但是checkpoint发生却不会导致日誌切换。

日誌切换触发的是normal checkpoint，而不是大家所说的增量checkpoint，只不过log switch checkpoint的优先权非常低，当一个log switch checkpoint发生的时候它并不会立即的通知DBWn进程去写数据档案，但是当有其它原因导致checkpoint或者是写入数据档案的RBA超过log switch checkpoint的checkpoint RBA的时候，这次的log switch checkpoint将会被标记成完成状态，同时更新控制档案和数据档案头。我们随后可以做个实验验证这个说法。

在Oracle中SCN相当于它的时钟，在现实生活中我们用时钟来记录和衡量我们的时间，而Oracle就是用SCN来记录和衡量整个Oracle系统的更改。

Oracle中checkpoint是在一个特定的“时间点”发生的，衡量这个“时间点”用的就是SCN，因此当一个checkpoint发生时SCN会被写入档案头中以记录这个checkpoint。

增量

增量checkpoint工作过程

因为每次完全的checkpoint都需要把buffer cache所有的髒块都写入到数据档案中，这样就是产生一个很大的IO消耗，频繁的完全checkpoint操作很对系统的性能有很大的影响，为此Oracle引入的增量checkpoint的概念，buffer cache中的髒块将会按照BCQ伫列的顺序持续不断的被写入到磁碟当中，同时CKPT进程将会每3秒中检查DBWn的写入进度并将相应的RBA信息记录到控制档案中。

有了增量checkpoint之后在进行实例恢复的时候就不需要再从崩溃前的那个完全checkpoint开始套用重做日誌了，只需要从控制档案中记录的RBA开始进行恢复操作，这样能节省恢复的时间。

发生增量checkpoint的先决条件

恢复需求设定 (FAST_START_IO_TARGET/FAST_START_MTTR_TARGET)

LOG_checkpoint_INTERVAL参数值

LOG_checkpoint_TIMEOUT参数值

最小的日誌档案大小

buffer cache中的髒块的数量

增量checkpoint的特点

增量checkpoint是一个持续活动的checkpoint。

没有checkpoint RBA，因为这个checkpoint是一直都在进行的，所以不存在normal checkpoint里面涉及的checkpoint RBA的概念。

checkpoint advanced in memory only

增量checkpoint所完成的RBA信息被记录在控制档案中。

增量checkpoint可以减少实例恢复时间。

增量checkpoint相关参数设定

log_checkpoint_interval

设定两次checkpoint之间重做日誌块(重做日誌块和系统数据块是一样的)数，当重做日誌块数量达到设定值的时候将触发checkpoint。

log_checkpoint_timeout

设定两次checkpoint之间的间隔时间，当逾时值达到时增量checkpoint将被触发。Oracle建议不用这个参数来控制，因为事务(transaction)大小不是按时间等量分布的。将此值设定成0时将禁用此项设定。

fast_start_io_target

因为log_checkpoint_interval主要看的时候重做日誌块的数量，并不能反应buffer cache中髒数据块的修改，因此Oracle又引入了这个参数来实现当髒数据块达到一定数量的时候触发checkpoint，不过此参数实际上控制的是恢复时所需IO的数量。

fast_start_mttr_target

此参数是在9i中引入用来代替前面的三个参数的，它定义了数据块崩溃后所需要的实例恢复的时间，Oracle在实际上内在的解释成两个参数:fast_start_io_target和log_checkpoint_interval.如果这两个参数没有显式的指定,计算值将生效.。

fast_start_mttr_target可以设定的最大值是3600，即一个小时。它的最小值没有设限，但是并不是说可以设定一个任意小的值，这个值会受最小dirty buffer(最小为1000)的限制，同时还会受初始化时间以及档案打开时间的限制。

在设定此参数的时候要综合考虑系统的IO，容量以及CPU等信息，要在系统性能和故障恢复时间之间做好平衡。

将此参数设定成0时将禁用 fast-start checkpointing，这样能见效系统负载但同时会增加系统的恢复时间。

如果fast_start_io_target or log_checkpoint_interval被指定，他们会自动覆盖由fast_start_mttr_target参数计算出来的值。

主要功能

Check Point 12610设备基于其软体刀片架构。这意味着用户可以选择其需要的特定功能的许可。其主要功能有：防火墙、IPsecVPN、高级网路和集群、身份识别、移动接入、入侵防御系统（IPS）、应用程式管理、URL过滤、反病毒程式、邮件安全。

点击展开全文