内存故障维修论文

2024-10-29

内存故障维修论文(精选4篇)

内存故障维修论文 篇1

0 引言

内存数据库不同于传统磁盘数据库,它将主版本放在内存中运行,提高了系统性能。但是,由于应用程序直接访问数据,数据库更易受到应用软件错误和系统崩溃等故障带来的伤害。内存数据库的恢复较之传统磁盘数据库要复杂得多,也更为关键,恢复部件一定要被恰当地设计、实现和维护。内存数据库恢复系统的设计方法,由于应用领域和设计思路的不同而千差万别,但它们追求的目标是相同的,都是保持数据库的一致性,使数据库能从故障中快速恢复,且恢复时占用尽量少的时空开销。恢复技术的研究已成为内存数据库研究领域的热点问题。本文从内存数据库的特性出发,对系统恢复模型、日志协议、检查点策略及恢复处理等方面进行了研究和探讨,给出了一种新的恢复机制。

1 系统恢复模型

目前,内存数据库的恢复方法存在诸多不足之处,例如成本过大,记录Undo日志方面I/O比较频繁,事务和检查点进程操作并发度低,从而造成系统效率不高。内存数据库的恢复一般采用基于日志的恢复或者影子页技术,它们各有优缺点。如何将上述两种恢复技术有效地结合在一起,设计一个高效且可靠的恢复子系统是内存数据库研究的突破点。新的内存数据库恢复机制无需额外硬件的支持,模型如图一所示[1]。

在该模型中,事务管理器负责事务的创建、消亡及调度管理,处理事务运行中的并发控制及死锁。数据库为每一事务分配一个事务私有缓冲区,包括数据缓冲区和日志缓冲区,存储事务操作的数据和产生的日志。日志管理器将内存缓冲区中的Redo日志写入硬盘的日志文件中,以便系统发生故障后恢复数据库。检查点管理器定期执行检查点操作,它根据日志管理器提供的信息,将上次检查点操作以来数据库主拷贝中的变更数据库片刷新到硬盘数据库备份中,并向外存的日志文件中写检查点记录。数据交换器,负责数据库主拷贝与硬盘备份数据库间的数据交换,同时兼做恢复时的重装器。每当系统故障后,它先调用重装器按一定策略将备份数据库中的相关数据片装入数据库主拷贝中,恢复处理器用日志管理器中的Redo日志和Undo日志,将数据库主拷贝恢复到最近的一致性状态。

2 日志管理器

日志是日志记录的一个序列,每个日志记录记载有关某个事务已改变的某些情况,它是使用最广泛的记录数据库修改的结构,记录了数据库中所有的更新活动。日志模块的设计思想是既要记录足够的信息以备恢复之用,同时又要求日志所需的存储空间尽量少,执行过程中I/O操作的次数少。

2.1 日志设计

当数据库中发起一个事务时,系统为每个事务线程分配私有日志。私有日志有两个日志链表:Redo日志链表用来保存记录的新值,保证在系统故障时可以恢复数据;Undo日志链表用来保存记录的旧值,确保未完成的事务在出现事务故障时可以被回滚,事务的执行都记录在各自的日志缓冲区中,可以提高不同事务之间操作的并发度[2]。为减少全局日志的数量,事务结束后删除Undo日志,只将已提交事务的Redo日志暂时连续写入内存的全局日志文件中,事务的私有缓冲区被释放,系统会在特定的时刻将内存中存放的全局日志提交给磁盘,用于事务故障时的恢复,从而提高检查点操作和恢复的效率。

2.2 事务提交处理

事务Ti开始执行时被加入活动事务表中,在该事务的私有日志缓冲区中,记录事务的Redo日志和Undo日志。当Ti完成执行后,进入预提交阶段,过程如下:①依据事务缓冲区的记录,对内存中要被事务修改的数据块加锁,对加锁的数据块进行更新操作;②在日志私有缓冲区中的Redo日志中,加入Ti的提交记录,然后将事务的私有Redo日志修改到系统的全局Redo日志里;③释放事务Ti所有的锁和资源。

当提交记录成功写入磁盘时,事务才真正被提交,该阶段采用组提交策略,将要提交的事务组成队列,合并后以一个扇区为单位写入磁盘,处理过程如下:(1)通知用户,事务Ti被提交,并传回返回值;(2)在活动事务表中删除Ti;(3)释放事务的私有Redo日志和Undo日志。

2.3 事务失败处理

如果事务执行失败,只需释放事务的私有缓冲区,而无需对数据库执行撤销操作,节省了内存空间且简化了夭折处理。

3 检查点策略

检查点设计的目标是尽量减少I/O操作的次数,减少用于恢复的日志的频率。本文设计的内存数据库采用模糊检查点模式,检查点进程和事务并发执行,减少检查点执行过程中与正常执行事务的冲突,提高检查点操作执行效率。为保证检查点操作的原子性,系统采用乒乓方法的检查点策略,该方法允许检查点执行过程中出现暂时不一致的情况,即允许在Undo日志写出前,相应的数据更新已经被写出,脏页表写出后,足够的Redo日志和Undo日志信息被写到磁盘上,保证能将检查点带到一致的状态。磁盘上包括两个检查点映像,检查点操作时对其中的一个映像进行操作,当这个检查点执行过程中出现失败,另一个检查点映像仍然处于一致状态并可以用于恢复。

采用时间戳来确定备份时哪些数据库段需要写入外存:时间戳TCP表示当前检查点操作的开始时间;再为每个在内存的数据库段设置时间戳TSEG指明其最后被修改的时间;给每一个事务私有缓冲区WAi设置一时间戳TWAi,用来表示对应事务预提交过程结束的时间。设△mem为在TCP时刻所有TSEG

4 故障处理

内存数据库的故障包括事务故障、系统故障和介质故障。本文的研究侧重于系统故障,指系统由于掉电和软件错误,需要重新启动的故障,此时内存数据库中有些更新还没有写入外存数据库,将外存数据库重装入内存和利用日志进行恢复,使数据库恢复到最近一致性状态是解决问题的关键。

4.1 重装算法

简单重装不能使数据库并发处理;顺序优先级重装忽视了数据访问频率。而只关心装入优先级且允许抢占;智能重装考虑了事务处理数据的访问频率,但增加了额外开销;而频率重装考虑了数据被存取的频率,降低了额外开销,却复杂了备份的过程。针对这些重装算法的不足,考虑重装过程中事务执行的优先级、预装入、数据的临时性和被访问的频率等因素,提出了一种针对内存数据库的数据优先级重装算法。它减少了无效的临时数据和事务终止次数,因此,高优先级的事务被立即执行从而能在截止期内完成。具体的重装算法如下[4]:

(1)装入系统信息到MMDB系统区。

(2)建立恢复缓冲区和脏页表,标示等待事务及其所需数据库片,根据磁盘数据库目录提供的信息,将这些数据库片按柱面组合在一起。

(3)根据如下的优先级策略,重装外存数据到MMDB主数据区,直到数据量达到重装阈值:(1)按照“等待”事务的优先级,由高到低装入数据;(2)将在恢复位图中最近一次检查点之后被修改的脏数据页,根据日志进行数据恢复,若非脏页则直接装入;(3)按存取频率装入其余数据。

(4)将日志中已提交事务的“后映像”复制到各事务私有缓冲区。

(5)当重装达到阈值,系统启动运行。

(6)依据如下优先级策略,重装其他外存数据到MMDB主数据区:(1)执行事务所需的数据库片;(2)以柱面为基础装入“等待”事务所需其余的数据库片;(3)按磁盘数据库存储顺序装入其他柱面数据。

4.2 恢复算法

系统重启过程中,如果发现脏页,需要利用磁盘上的日志和数据库备份,进行重装恢复,具体恢复过程所下[5]。

(1)将磁盘上当前数据库的镜像装入内存。

(2)找到最近一个完整检查点。

(3)将该检查点中以下内容读入内存:①检查点发生时的稳定全局日志尾指针;②检查点发生时的活动事务表;③检查点发生时所有活动事务的Undo日志。

(4)从读入的检查点记录的稳定日志尾指针开始,向后遍历日志直至日志尾,根据日志选择做以下操作:

①如果遇到Redo记录且有提交记录,那么执行这个Redo操作。

②如果遇到失败终止记录,且在读入的检查点发生时,该事务处于不活动状态,那么忽略此失败记录。否则,从检查点找到该事务的Undo日志,执行相应的Undo操作。

(5)对于在检查点处于活动状态,但在Redo日志中没有提交记录,而且其状态也没有被标记为“提交中”的事务,从检查点中找到相应的Undo日志并执行Undo操作。

5 结束语

本文在内存数据库的恢复技术方面,取得了一定的成果,给出了系统恢复模型及相关实现技术。但也存在很多不足,主要表现在部分模块缺少编程实现、缺乏与同类数据库的分析和对比,需要在以后的研究中,改进前面的成果,同时克服前面的问题。

参考文献

[1]易国洪.内存数据库中恢复技术研究[J].科技广场,2007,(03):106-107.

[2]钱能.基于日志恢复技术的内存数据库快速恢复模型的研究[J].现代计算机,2008,287(07):81-82.

[3]吴绍春,李国微等.内存数据库恢复及其实现机制[J].江汉石油学院学报,1998,20(02):103-104.

[4]李蔚,马江涛.嵌入式内存数据库的恢复及重装算法研究[J].微计算机信息,2007,23(04Z):92-93.

[5]黄琳,路京,林中.基于影子页面的MMDB的数据恢复方法[J].计算机工程与设计,2008,29(10):2471-2472.

内存故障维修论文 篇2

内存条常见故障及排除方法

内存条有问题,常引起电脑运行不稳定,比如:开机后主机一直报警;系统经常蓝屏、死机、重启等。常见的内存故障及排除方法如下:

1、内存氧化

内存氧化,就会与插槽接触不良,造成开机时主板检测不到内存而报警。一般是主板上内存插槽灰尘多,或是内存金手指氧化,影响内存与插槽接触。

解决办法:

拔下内存,用橡皮仔细擦拭金手指,然后小毛刷清理内存插槽中灰尘,有条件的话,再用吹风机吹一下(注:是专用的吹电脑的吹风机,不时理发店用的吹风机)。

2、内存兼容性。

如果电脑更换内存后,出现电脑运行不稳定,可以先在BIOS中,调整内存参数,如:内存延迟、内存频率等。如果调整后,故障仍旧,则可能内存与主板兼容性差,只有更换内存。如果新增加内存后,电脑出现问题,同样,先修改内存参数,如果不行,说明内存与主板兼容不好,或是新内存与原内存不兼容,需要换内存条。

3、内存条损坏。

如果电脑只有一根内存条,通过修改内存参数,故障仍旧,可能内存条损坏了,更换好的内存条即可。

内存故障维修论文 篇3

关键词:主板,内存,供电电路,故障检测

1 主板内存插槽种类及供电电压

随着主板技术的发展,主板内存插槽常见以下几种:SDRAM内存插槽、DDR_Ⅰ内存插槽、DDR_Ⅱ内存插槽和DDR_Ⅲ内存插槽。其中,SDRAM内存插槽现已少见,而DDR_Ⅰ内存插槽在一些十年左右的老主板中还能见到。DDR_Ⅱ内存插槽和DDR_Ⅲ内存插槽是现在主板中常见的。主板内存供电一般需要两个电压:一个是内存工作所需的主供电电压,一个是传输数据时所需的上拉供电电压。主板内存插槽不同,供电电压也不同,见表1所示。

2 主板内存供电形式

SDRAM内存插槽,常见的是由ATX电源直接供电,只有少数高档的主板才采用独立供电。用万用表测量ATX电源的第一脚与SDRAM内存插槽3.3V供电脚,它们之间是相通的。对于DDR内存,一般采用独立供电。下文以DDR_Ⅱ为例,介绍内存供电电路的供电机制及维修检测方法。

2.1内存主供电供电形式

内存主供电主要采用两种供电形式,一种是由稳压源、比较器芯片和场效应管组成的调压式供电电路,另一种是由电源管理芯片、高低场效应管和电感组成的开关电源式供电电路。

2.1.1调压式供电电路工作原理

调压式供电电路的电路图如图1。

调压式供电电路的工作原理如下:

1) 开机瞬间,ATX电源供电,TL431与比较器得到供电,其中,TL431的K(1脚)、R(3脚)相连,产生恒定的2.5V,经过R2、R3串联分压,得到IN+(1.8V),此时,场效应管Q1未导通,IN-=VCC_DDR=0,因IN+> IN-,所以OUT电压上升,当升至高电平时,Q1导通,其导通程度随OUT的上升而扩大,当导通到VCC_DDR=1.8V时,IN+= IN-,OUT电压不再变化。

2) 当内存工作时,因后级消耗电能,VCC_DDR下降,IN-下降,IN+> IN-,OUT电压继续上升直到IN+= IN-,OUT电压不再变化。

3) 当内存由繁忙变成闲置时,后级消耗减少,Q1仍保持繁忙时的导通程度,VCC_DDR上升,因而IN-上升,则IN+< IN-,OUT电压下降,直至IN+= IN-。当OUT电压降至低电平时,Q1截止,仅由电容C1供电,VCC_DDR快速下降,降至IN+> IN-,OUT电压重新上升,重复步骤(1) 。

总之,该电路由R2、R3确定VCC_DDR电压,由比较器根据负载工作状态控制场效应管Q1的导通程度来达到稳定的VCC_DDR内存电压。

在该电路的基础上,可通过R2、R3阻值上的变化,得到不同的VCC_DDR内存工作电压,从而为不同的内存提供主供电。如:当得到的VCC_DDR为2.5V时,可作为DDR_Ⅰ内存的主供电,当得到的VCC_DDR为1.8V时,可作为DDR_Ⅱ内存的主供电,当得到的VCC_DDR为1.5V时,可作为DDR_Ⅲ内存的主供电。

2.1.2开关电源式供电电路工作原理

开关电源式供电电路的电路图如图2。

开关电源式供电电路的工作原理如下:

1) 开机,ATX电源供电,电源管理芯片IC1得到供电,由BOOT激励内部振荡器工作产生振荡,并放大反相得到一对互为反相的方波给UG和LG。

2) UG=H(高电平),LG=L(低电平)时,场效应管Q1导通,Q2截止,3.3V/5V经Q1流入A点,一方面为电感L1充电,另一方面产生PH反馈。

3) UG= L(低电平),LG= H(高电平),Q1截止,Q2导通,电感L1自感产生反向电动势,其负极经Q2接地形成回路,放电为后级供电。

4) Q1、Q2轮流通断,产生一个稳定电压为内存供电,同时经R1、R2分压反馈到FB,与芯片内固有的基准电压作比较,误差大时,芯片对震荡器脉宽进行调节,修正误差,以得到稳定的VCC_DDR内存电压。

3 内存供电电路故障检测

SDRAM内存插槽、DDR_Ⅰ内存插槽、DDR_Ⅱ内存插槽和DDR_Ⅲ内存插槽的内存主供电是否正常,可通过万用表测量各插槽的测量脚进行判断。各插槽的测量脚见表2。

3.1调压式供电电路的故障检测点

调压式供电电路中,容易损坏的元器件是:场效应管、滤波电容、比较器芯片(LM358、LM393或LM324等)、稳压源TL431、分压电阻R2和R3、调整电阻R4等。

3.2开关电源式供电电路的故障检测点

开关电源式供电电路中,容易损坏的元器件有电源管理芯片、场效应管、滤波电容、限流电阻等。其中场效应管、滤波电容、限流电阻是否损坏判断方法参见上文。

电源管理芯片损坏后,其输出端无电压信号输出,将无法控制场效应管工作。判断电源管理芯片好坏的方法是:首先测量芯片的供电脚有无5V或12V电压,如有,测量芯片的输出脚有无电压信号,如果无,则可判断电源管理芯片损坏。

参考文献

[1]张军.主板维修技能实训[M].北京:科学出版社,2012.

[2]熊巧玲,张军.电脑硬件芯片级维修从入门到精通[M].北京:科学出版社,2010.

内存故障维修论文 篇4

1.内存质量欠佳导致Windows安装出错

故障现象:一台新装配的兼容机,配置为Pentium41.8A、i845G主板、杂牌HY256MBDDR266内存,希捷酷鱼5代60GB硬盘。硬盘分好区后安装Windows98,安装过程中复制系统文件时报错,按下取消后可以跳过错误继续安装,但稍后再度报错,Windows安装不能完成。由于故障发生在系统文件复制阶段,初步怀疑是安装光盘的问题,格式化硬盘并更换Windows98光盘进行重装,故障依旧。故障疑点转移到硬盘和内存身上,更换硬盘后故障仍然存在,排除掉硬盘,更换内存后故障消失,最终确认导致Windows安装出错的祸首为劣质内存。

故障分析:Windows安装过程需要从光盘复制文件到硬盘,而内存作为系统数据交换的中转站,在这个过程中起了极其重要的作用。此例就是内存质量不佳,不能稳定工作而导致系统文件复制出错。因为内存具有十分重要的地位,其质量不容忽视,使用劣质内存甚至无法完成操作系统的安装,更不要说,在使用时还会出现各种各样的疑难杂症,所以建议尽量选购优质的品牌内存。

2.注册表频频出错祸起内存

故障现象:一台电脑配置为PentiumⅢ550(超频到731MHz)、SiS630主板、杂牌HY192MB(128MB+64MB)SDRAM内存。使用一年多后系统变得不稳定,经常在开机进入Windows后出现注册表错误,需要恢复注册表。刚开始时以为是操作系统不稳定,格式化硬盘重装后问题也没有得到彻底解决,甚至变得更严重,有时甚至出现WindowsProtectionError,

由于CPU一直在超频状态下运行,初步怀疑故障源于CPU,CPU降频后注册表出错的频率明显降低,更加怀疑故障由CPU导致,特意更换了CPU,然而故障并没有消失,依然不时出现。为彻底排除故障,使用替换法进行测试,最终发现罪魁祸首是那条64MB的内存。

故障分析:该机长期在超频状态下运行,CPU和内存的时钟频率均为133MHz。那条64MB的内存采用的是HY-7K的芯片,做工也较差,长期在133MHz下运行终于不堪重荷,导致注册表频频出错。一些做工较差、参数较低的内存也许可以在一段时间内超频工作,但长期下去往往会出现问题,引起系统故障,这是用户应该主意的问题。

3.Remarku内存导致电脑无法开机

故障现象:一台电脑配置为PentiumⅢ800EB、VIA694X主板、HY128MBPC133内存。添加了一条128MB的杂牌HYPC133内存后显示器黑屏,电脑无法正常开机,拔下该内存后故障消失。经过检查,发现新内存条并无问题,在别的机子上可以正常使用,但只能工作在100MHz的外频下,根本无法在133MHz下使用。为使用该内存,后来不得不在BIOS的内存设置中设置了-33MHz的异步模式。

故障分析:该内存芯片上的编号标示为-75,应该为PC133的内存,但芯片上的字迹较为模糊,极有可能是从-7K或-7J的内存Remark而来,自然无法在133MHz下工作。据此,消费者在选购内存的时候要注意提防JS,防止买到Remark的内存。

4.内存插槽积尘导致内存无法正常工作

上一篇:艺术展馆下一篇:初中美术的创新性教学