冗余故障

2024-08-14

冗余故障（精选6篇）

冗余故障篇1

0 引言

西门子S7-400H冗余PLC系统主要采用热备硬冗余的方式实现“主/从PLC”系统故障时的无扰动切换,但实际应用中常出现冗余故障影响上位机通信的情况,同时故障模板的报警指示纷繁复杂,加大了故障排查难度。本文通过介绍一起典型的S7-400H冗余PLC系统冗余故障的现象及处理过程,探讨S7-400H冗余PLC系统冗余故障处理方案。

1 故障现象

某S7-400H冗余PLC系统报故障,“主/从PLC”系统硬件模板上多个指示灯报警闪烁,上位机上的反馈信号显示冗余PLC系统出现异常。S7-400H冗余PLC系统CPU各指示灯含义如下。

INTF:红色,内部故障,例如用户程序运行超时,用户程序错误。

EXTF:红色,外部故障,例如电源故障,I/O模块故障。

FRCE:黄色,至少有一个I/O被强制时点亮。

RUN:绿色,运行模式。

STOP:黄色,停止模式。

BUS1F:红色,MPI/Profibus-DP接口1的总线故障。

BUS2F:红色,MPI/Profibus-DP接口2的总线故障。

MSTR:黄色,CPU运行。此CPU为主CPU0。

REDF:红色,冗余错误。

RACK0:黄色,CPU在机架0中。

RACK1:黄色,CPU在机架1中。

IFM1F:红色,接口子模块1故障。

IFM2F:红色,接口子模块2故障。

“主/从PLC”系统的主要硬件模板指示灯情况如下。

(1)主(主控)CPU0:RUN绿灯常亮,REDF红灯常亮,MSTR和RACK0黄灯常亮,IFM1F和IFM2F红灯常亮;电源模板和CP443-1以太网模板指示正常,数据收发指示灯正常闪烁。

(2)从(热备)CPU1:CPU面板所有有效指示灯以2Hz频率闪亮;CP443-1以太网模板指示正常,RUN绿灯常亮,STOP灯没亮,数据发送指示灯没亮,接收数据指示灯间隔很长一段时间闪烁1次,反映出收发数据不正常。

(3) ET200M扩展机架的某些IM153-2总线接口模块报BF和SF故障并亮红灯。

针对以上情况,先以文本格式导出PLC故障“诊断记录”,然后对离线程序作在线比较,在确认程序完全匹配后对程序和画面作备份,并在确认风机未投运后尝试恢复。为了便于分析与表达,暂且约定RACK0机架上的CPU为“主CPU0”,RACK1机架上的CPU为“从CPU1”,与实际CPU模板硬件选择开关拨定方向一致。PLC冗余系统的网络拓扑结构简图如图1所示。

2 故障处理过程

2.1 常规重启“从CPU1”

重启故障表现明显的“从PLC”系统(位于RACK1机架),先将CPU1模块启停选择开关拨到STOP,然后再拨到RUN,热启CPU1,但未启动成功,RUN灯持续闪烁,其它指示灯快速闪烁。

2.2 常规冷、热启动“主/从CPU”

停用“从CPU1”,关闭“从PLC”系统电源,保持“主PLC”系统不变,冷启动“从PLC”系统,但“从CPU1”仍未启动成功,故障指示依旧,另外“从PLC”系统的CP443-1以太网模板STOP黄灯亮,再无法启动到RUN状态。

停用“主/从PLC”系统电源模板,启动“主PLC”系统,成功;启动“从PLC”系统,CPU1和“从CP443-1以太网模板”均启动失败。采用Step 7软件暖启动“从CP443-1以太网模板”和“从CPU1”,仍无效,提示“当前模式下不允许进行此项操作”。进行反向操作,启动RACK1上的CPU1,仍无法启动,CPU1的REDF、EXTF、BF故障指示灯均亮,初步判断RACK1上的“从PLC”系统有来自Profibus-DP总线上的外部故障。但是,由于CPU上所有指示灯均闪烁,因此又推断CPU1本身可能存在故障,于是先将故障处理的焦点放在“从CPU1”和“从CP443-1以太网模板”。

在导出的“故障诊断”文件中有多行如下类似记录:

Event 109 of 120:Event ID 16#73A3

DP:loss of redundancy at DP slave

Address of the affected DP slave:station number:16

DP-master system ID:2

Log.base address of the DP slave:Input address:8175

Log.base address of the DP master:8181

Requested OB:I/O redundancy error OB (OB70)

2.3 重新下装程序

S7-400H冗余PLC系统一般由两组冗余CPU通过光纤通信交换数据实现硬件热冗余功能。冗余原理是:主CPU故障后,备份CPU与主CPU的同步连接自动建立,备份CPU发出Link-up请求,主站在关闭删除、拷贝和建功能块功能后将所有数据发送给备份CPU;备份CPU执行自测后,向主站发出更新请求;主站在终止已组态连接的通信和禁止低级别的报警后,将动态数据拷贝给备份CPU;主站运行用户程序,在禁止所有报警和中断后向已Link-up的备份CPU发送上次更新后发生改变的动态数据;备份CPU接收主CPU的输入、输出、定时器、计数器和内存位信息,主CPU使能报警、中断和通信,主、备CPU进入冗余、同步操作过程。S7-400H冗余PLC系统冗余实现过程如图2所示。

重启CPU无效后,尝试通过重新下装程序到PLC来解决。清空存储器,重新下装备份程序,发现直接DOWN程序至“从PLC(CPU1)”找不到目标模板,采用改IP或屏蔽IP直接用MAC物理地址也未能找到(西门子PLC以太网通信有两条通道:一是采用ISO协议,通过MAC物理地址;二是采用TCP/IP协议,通过IP逻辑地址),但可直接DOWN程序到RACKO上的“主CPUO”。于是先启动“主PLC”系统,再利用两对冗余光纤以硬件冗余到热备CPU1的方式传送数据,但一直报REDF冗余故障和BF总线故障。为解决总线及CPU可能存在的故障,考虑通过检查和更换硬件模块来进一步排查。

2.4 更换CPU模板、检查DP总线接头和下装程序

鉴于CPU存储器没有完全清零会影响程序和组态的下装,在下装程序和组态前对冗余CPU中的存储器数据进行清零。S7-400 CPU的存储区划分为系统存储器、工作存储器和装载存储器。扩展装载存储器空间使用S7-400的MMC卡,扩展空间的地址与系统原有的空间地址在分配逻辑上是连续的。在清空CPU中所有存储空间数据的过程中,涉及到CPU的存储器复位及MMC卡数据清零。

2.4.1 CPU存储器复位

(1)设置模式选择器至STOP位置,直到STOP指示灯亮。

(2)设置模式选择器至MRES位置并保持,直到STOP指示灯熄灭1s亮1s,然后保持点亮状态。

(3)将模式选择器置于STOP位置,然后在3s内拨至MRES,再拨回STOP位置,STOP指示灯以2Hz的频率至少闪3s,执行存储器复位,然后持续点亮。

2.4.2 MMC卡数据清零

用MRES模式开关进行复位,不能删除MMC中的数据,只能删除工作存储器中的内容。下面介绍可以删除MMC中数据的方法,本次故障处理中采用第3种方法。

(1)使用Step 7中的“VIEW>ONLINE”菜单命令,在线打开Blocks,选中要删除的块,用Delete键删除。

(2)用“PLC>Download User Program to Memory card”下载一个空的程序。

(3)关闭CPU电源,取下后备电池,拔出MMC卡后等待两三分钟再插上MMC卡和后备电池。

2.4.3 正确的Step 7程序下装方法

(1)点击SIMATIC MANAGER→OPTION→SET PG/PC,选择相应的通信接口。

(2)在SIMATIC MANAGER→PLC下选择“Download”将用户程序装入CPUO。在同步连接建立后,CPU0中的用户程序通过同步光纤自动传送到热备CPU1。

(3)将模式选择器开关拨到RUN或RUN-P位置启动S7-400H。先启动CPU0,再启动CPU1。CPU0作为主CPU启动,CPU1作为热备CPU启动。在热备CPU建立同步连接并更新缓存区数据后,S7-400H转换到冗余工作方式并执行用户程序。

(4)程序下装完成。若程序改动较多无法下装(提示工作存储器空间不够等),则在下装前后可对CPU模板的存储器进行“编译压缩”后再操作(通过硬件组态中的CPU“模板信息”来编译压缩)。

2.4.4 存储器数据MRES清零、更换CPU及下装组态和程序

更换CPU前,先对原CPUO、CPU1进行存储器数据MRES清零操作。清零结束后,关闭CPU模板电源、电源模板电源,拔出CPUO、CPU1上的MMC卡,并取出两CPU的后备电池。

MRES清零结束后,更换CPU1模板。用版本号为V4.5.5的CPU固件替换原版本号为V4.5.3的CPU1固件后,在两CPU插槽不插入MMC卡的情况下,只下装硬件组态到“主/从PLC”系统,顺序为先RACK0后RACK1,CPU1和CPU0均下装成功。然后将硬件组态和程序一起按主从顺利下装,也成功完成。在下装程序和组态的过程中,需同时勾选上以太网模板的MAC和IP地址类型。单独下装程序和组态到RACK1上的CPU1,也顺利完成,彻底解决了程序不能下装到CPU1的问题。这说明程序清空不彻底可使上位机与CPU的以太网通信无法建立,造成硬件组态或程序下装失败。现在,CPU1指示灯已停止闪烁,表明系统已基本正常。

此时CPU的“BF总线故障”、“EXTF外部故障”和“REDF冗余故障”红灯常亮。其最主要问题是,在“主CPU0”已先成功启动运行后,“从CPU1”无法启动,其RUN绿灯闪烁几秒熄灭后,STOP黄灯点亮,通过上位机程序热启和直接手动拨动切换开关启动CPU1均未成功,只能保持“主CPU0”处于RUN运行状态,而“从CPU1”处于STOP停止状态。

2.4.5 检查扩展机架的总线DP接头

为了解决“从CPU1”无法启动成功的问题,根据“故障诊断记录”和以往的安装调试经验,检查了扩展机架A3和A4的DP接头是否线芯松脱,同时也不排除IM153-2接口模板有问题。拆开第2个扩展机架(DP Address Number:32)、第3个扩展机架(DP Address Number:16)的DP接头(注意是BF2总线上的DP接头,故障诊断记录中亦有提示),反复多次拔插压紧,BF总线故障、外部故障EXTF消除,还余下REDF冗余故障。

值得注意的是,一套S7-400H的冗余系统,其ET200M从站的有源底板型号必须一致,否则也会产生类似的总线故障和外部故障。

2.5 冗余故障REDF的处理

经过试验发现,只可能“主CPUO”启动成功并运行,而“从CPU1”无法启动到RUN状态。通过程序组态在线监控模板信息也发现,此时的“主/从CPU”一个是RUN状态,一个是STOP状态,两块CPU虽然是“主/从关系”,但当前模式显示的是SOLO MODE模式(即单机模式),而非Redundant冗余模式。在此模式下,在上位机上进行启泵操作试验,画面通信仍不正常,反馈信号时断时续。

最后,通过查询资料获知,在S7-400H冗余PLC系统中,“两块CPU”的硬件版本完全一致才能形成冗余关系。又换上最初用的CPU,重新清空程序后再下装程序,S7-400H冗余PLC系统恢复正常,REDF冗余故障消失。CPU0和CPU1及以太网模板均能正常启动运行。

3 故障原因总结

最初是ET200M从站接口模板IM153-2上的DP接头线芯松脱造成总线故障,主要发生在“从PLC”的系统总线BF2上,因此“从PLC”系统的CPU1报BF总线故障;又由于CPU找不到DP挂接的从站,因此CPU报EXTF外部故障。在恢复过程中,人为造成“两块CPU”版本不一致,冗余故障再次出现。前后两次故障的根本原因不同,但叠加在同一表象上,使得故障查找更加困难。

虽然CPU报EXTF和DP总线故障,但是CPU仍处于RUN状态,其原因是程序组态中加入了冗余相关的OB块,如OB70、OB72、OB73、OB80～OB86等。

S7-400H冗余PLC系统数据同步检测程序组态设置的时间为90min,即每90min检测1次主从CPU中的程序和配置是否一致,但是“从PLC”系统存在总线故障,因此PLC不断尝试启停RACK0和RACK1上的CPU来进行主/从切换。由于故障一直存在,因此“从PLC”系统的CPU1的RUN灯一直闪,STOP灯一直亮。故障持续时间达到某个限度后,“从CPU”系统会使所有指示灯均闪烁。虽然MMC存储卡损坏时也出现所有指示灯全闪,但经检验MMC卡并未损坏。

通过诊断记录也可看出S7-400H冗余PLC系统发生故障时自动切换的过程(“日期时间1”先发生):

4 排查S7-400H冗余PLC系统故障注意事项

排查S7-400H冗余PLC系统故障时,需要注意以下几点。

(1)S7-400H冗余PLC系统的冗余CPU的固件版本号必须一致,否者需通过降级和升级的方式来处理。

(2)紧固DP接头线芯时,螺钉紧固式优于卡压式。

(3)中心机架(RACK0和RACK1,是同一机架的主从部分)的CPU存储器最好都下载硬件组态。

(4)S7-400H的两块MMC卡(扩展CPU装载存储器容量)容量必须一致。

(5)S7-400H冗余PLC系统的ET200M分布式扩展机架中的有源底板型号应一致。

(6)故障处理应以“故障诊断记录”提示为参照,从易到难排查故障。

(7)新型S7-400 PLC的以太网模板可只填写MAC,利用网线就可以下装程序到CPU存储器。

(8)如果REDF冗余故障和EXTF外部故障无法消除,且无法启动CPU到RUN状态,那么CPU可能存在强制的I/O硬件点(“FRCE”黄灯亮)。通过S7软件取消CPU0和CPU1中的强制点后重启CPU即可消除故障。

(9)IFM1F或IFM2F红灯亮时,可尝试对调CPU0和CPU1的FM1或FM2来判断是否为同步子模块问题。但是IFM1F或IFM2F红灯亮不能代表FM子模块有故障,如本次故障。

(10)鉴于S7-400H冗余PLC系统维护经验的缺乏,建议加强点巡检,以便及时发现问题,同时,操作人员应及时通报设备故障及报警信息。

5 结束语

在西门子S7-300和S7-400的PLC系列中,有很多模块都带诊断功能,如果能充分利用这些诊断功能,那么将大幅提高故障诊断效率。如,通过西门子S7-400H PLC的FB125或FC125故障诊断功能制作报警程序,在上位机画面上显示具体的冗余系统故障点,以及通过系统功能SFC51读取冗余控制器状态灯实现画面显示和报警,都可方便维护、操作人员发现和排查故障。

冗余故障篇2

以深圳地铁一期工程为例:典型车站分为A、B两端, 在A端设置两套冗余的控制器 (PLC) , 一套作为整个车站的主控制器兼作与上位机的通讯接口, 接车站交换机, 另外一套负责A端的设备监控;在B端设置一套冗余的从控制器, 负责B端的设备监控;在车站的其它地方设置远程I/O设备。控制器及各远程I/O设备通过冗余的ControlNet现场总线相连。 (系统配置如图1)

2 冗余系统的设置和工作原理

ControlLogix冗余系统硬件结构由两个完全一样的控制器框架组成, 每个ControlLogix冗余系统框架中控制器模块、通信模块和SRM模块。两个框架尺寸完全相同, 模块一模一样, 插放位置也一模一样, 控制器中的程序也一模一样。两个控制器框架之间, 完全靠系统冗余模块SRM来完成同步和数据的交换。进入同步状态的主机控制器, 自动地传送备份数据到辅机控制器, 这些数据无须用户挑选和编程, 只要在主机控制器中被程序运行时刷新过的数据, 都会通过交叉装载传送到辅机控制器, 传送的数据量可以非常大。控制器通过与SRM的连接, 得知自己是主机控制器还是辅机控制器, 从而决定是传送数据还是接收数据。这些完全不需要用户的介入, 系统自动获取、自动判断、自动传送。两个控制器的同步运行和大量数据的复制, 使得输出得到无扰切换。

在成对的冗余框架中, 首先上电的框架成为主机框架, 后上电的框架作为辅机框架, 并建立与主机控制器的同步。当出现主机控制器所在框架掉电、拔插主机框架上的任何模块、控制器程序发生主要故障、断开CNBR模块上的ControlNet分接器或电缆、断开ENBT模块的EtherNet/IP电缆等情况, 或者收到来自主机控制器中用MSG发送的命令、来自Rslinx中SRM模块组态页面操作的命令都会发生冗余切换。

3 系统冗余故障显示及查找

冗余系统不能正常工作, 常常表现在辅机不能同步。辅机不能同步的原因有很多, 查找的办法也很多, 一般说来, 冗余框架中的CNBR模块都有清楚的提示, SRM模块的组态界面也存放了详尽的信息。冗余框架插放的CNBR模块的面板将显示系统的状态, 面板是字符式显示, 一般是缩写的大小字母, 它们所表达的意思见表1。

最重要一点的是, 所有成对的模块必须是相同的产品编号、系列号和版本号, 并且插放在相同槽内。如果辅机框架的CNBR的Keeper与成对冗余的主机框架CNBR的数字签名不匹配的话, 辅机框架是不能同步的。需要在RSNetworx组态软件中, 选择Keeper Status, 检查辅机是否为Valid Keeper。如果不是, 操作Update Keeper使之恢复正常。出现这种情况的原因可能是ControlNet网络组态时, 辅机CNBR模块是关闭的或者在别的网络中组态过。

根据提示检查硬件的情况, 是比较直观和容易的。但是实际使用过程中, 大多数故障不是硬件引起的, 而是由于参数设置不合理、通信和连接规划不好, 导致控制器出现主要或者次要故障。在深圳地铁一期工程的建设过程中, 由于承包商是首次使用ControlLogix系列产品, 在参数设置方面没有仔细研究和推敲。为了追求最短的响应时间, 将所有参数都设置为最小值。这样就存在控制器没有足够的时间去完成非预定性的通信、内存分配比例不合理、连续任务Watchdog时间太短、周期性任务执行时间大于周期时间、高优先权程序执行时间超过最低优先权程序周期时间、冗余框架中CNBR模块CPU运用效率远远超过75%等一系列隐性故障。

4 改进措施和处理方案

4.1 保证非预定性通信的执行时间

一般说来, 非预定性通信是除了控制器I/O组态和控制器之间的Produced/Consumed之外的所有的通信——编程设备的在线、HMI的访问、执行MSG指令、响应其他控制器的MSG、同步冗余系统的辅机框架、建立或监视I/O的连接 (热拔插模块) 、从控制器的串口通过背板访问其他设备等。所有的都是在任务逻辑程序执行以外的时间进行。如果控制器组态了一个连续任务, 由控制器中的System Overhead Time Slice设定值决定非预定性通信的时间;如果控制器没有设定连续任务, 则在所有周期性任务执行完毕的剩余时间内完成。

深圳地铁一期工程所有控制器内逻辑程序均为一个连续任务, 多个周期性任务的配置。所以, 应该适当增大System Overhead Time Slice设定值, 保证控制器有足够的时间完成非预定性通信的执行。具体方法是:通过Logix5000在线连接控制器, 在控制器的属性/高级属性中设置System Overhead Time Slice。 (图2)

4.2 合理设置周期性任务的时间参数

对于周期性任务, 必须确定最高优先权任务的执行时间是否远远小于它的周期时间, 所有任务执行时间的总和是否远远小于最低优先权任务的周期时间;Watchdog时间通常为本任务运行时间的10倍左右。周期时间、Watchdog时间可以通过Logix5000在线连接控制器, 在任务的属性/组态中修改 (图3) ;任务执行时间可以通过Logix5000在线连接控制器, 在任务的属性/监听中查看。 (图4)

4.3 降低冗余框架CNBR模块的CPU运用效率

冗余系统中的CNBR模块需要足够的时间去处理冗余的操作, 冗余同步操作将占用CNBR模块CPU运用效率的8个百分点左右, 如果超过75%, 可能会妨碍冗余切换后的辅机同步。深圳地铁一期工程冗余系统CNBR的CPU运用效率达90%以上, 部分甚至高达95%, 很容易出现冗余切换后CPU满负荷运行, 导致同步失败。所以必须想办法把CNBR模块的CPU运用效率降下来。

要降低CNBR模块的CPU运用效率, 可以从以下几个方面着手:增大ControlNet网络的NUT (网络刷新时间) 、增大I/O模块连接的RPI (请求数据包间隔) 、减少通过CNBR连接的数量、减少MSG的数量和增加CNBR模块来分流信息。由于深圳地铁一期工程的设备已经定型, 增加CNBR模块涉及到更换机架成本太高, 也没有可以减少的MSG指令和通过CNBR的连接, 所以只能从增大ControlNet网络的NUT和I/O模块的RPI两个方面入手。

深圳地铁一期工程冗余系统的NUT和RPI均设置为系统组态时的默认值, 分别为5ms和20ms。也就是说, 系统每5ms刷新网络一次, 每20ms更新一次I/O模块数据。由于系统的监控对象是风机、风阀、温湿度传感器、冷水流量传感器、水系统二通阀执行器等设备, 所有的设备均不会发生状态的高频变化, 也不用控制设备高频度开关, 所以系统默认的NUT和RPI远远超过实际应用的需要。这样就过多的耗用网络资源, 占用ControlNet预定性数据的带宽。而RPI值一般设为实际需要时间的50%即可, 即在一个周期内采样两次。在系统没有高频动作设备, 保证系统实时性的前提下, 经过多次测试将RPI由20ms改为80ms, 将NUT由5ms改为20ms (RPI=NUT*2n) , 成功的将冗余系统CNBR的CPU运用效率降到了75%以下。

RPI设定可以通过Logix5000在线连接控制器, 在I/O Configuration展开所有已经组态的模块, 右键点击适配器选择Properties/Connection修改Requested Paket Interval为80ms。 (图5)

NUT设定可以通过运行RSNetWorx for ControlNet, 在线upload网络配置、编辑使能后通过菜单Network /Properties/Network Paramerters中修改Network Update Time为20ms。 (图6)

参考文献

冗余故障篇3

从输电经济性出发，直流输电的电压等级与输电距离正相关[1]。500 kV常规直流输电工程的经济输电距离一般在700 km至1300 km。近年来，我国相继投运的云广、向上、锦苏、哈郑、溪浙等多条800 k V特高压直流输电工程[2,3,4]，其输电距离均在1300 km至2 500 km之间。当前，我国正在建设的西南大型水电基地、新疆大型煤电和风电基地，与东、中部负荷中心的距离有些已超过3 000 km。随着输电距离的进一步增加，研发更高电压等级的特高压直流输电技术势在必行[5]。

研究表明，输电距离大于2 500 km时，采用±1 100 kV特高压直流输电更为经济[6,7]。目前，疆电外送规划中的准东—成都、准东—皖南直流输电工程，均按±1 100 kV直流电压等级进行设计[8,9]。

2011年起，国家电网公司启动了±1 100 kV直流输电科研攻关，并组织相关设备厂家开展主设备研制工作[10,11]。在此基础上，南京南瑞继保电气有限公司立足自主研发的PCS-9550直流控制保护平台[12]，借鉴800 kV特高压直流控制保护系统的开发和工程应用经验[13]，研制了±1 100 kV特高压直流控制保护系统及全功能样机。与500 kV和800 k V直流相比，±1 100 kV直流输电容量更大，对控制保护系统可靠性和可用率要求极高，仅基于设备冗余、切换等基本原则的控制保护系统自监视设计不能完全满足±1 100 kV直流的高可靠性要求，对于某些关键设备的特殊故障(例如冗余设备故障)及其影响也应重视。探讨±1 100 kV直流控制保护系统自身特殊故障的监视与处理方法，进一步强化其可靠性设计，是系统研制过程中的一个重点研究课题。

本文概述了所研制的±1 100 kV直流控制保护系统架构，介绍了其系统自监视设计的特点，重点针对极控制装置、换流器控制装置等关键设备的冗余故障，进行了自监视处理方法的探讨，以提高系统的整体可靠性和可用率。

1 平台简介

PCS-9550直流控制保护平台的基本组成部分包含控制保护装置、IO单元、人机界面系统等。

控制保护装置由机箱和各种CPU、DSP处理器板卡组成，不同的控制保护装置可依功能需要灵活选择处理器板卡的种类和数量，多个处理器板卡通过机箱背板的HTM(High performance Time deterministic Multiplexed synchronous serial Bus)总线交换内部数据，构成高速并行处理系统，协同实现主机的控制保护功能。

控制保护装置通过多功能处理器板实现装置间的实时数据组网或点对点通信，如图1所示。多个控制保护装置之间的光纤实时数据交换网，称为控制LAN网。直流控制保护系统基于此平台实现分层分布式运算和整体的控制保护策略。另一方面，控制保护装置通过监视与其通信的其他装置的报文信息，可实时判断其他装置的工作状态是否正常，一旦发现装置故障，将根据预设的系统自监视策略，执行相应的故障处理措施，尽可能降低装置故障的影响范围和损失。

2 系统设计

±1 100 kV特高压直流的主回路设计仍沿用800 k V特高压直流的架构[14]，每极由两个12脉动换流器串联构成，每个换流器的额定直流分压为550 kV。与一次系统结构相适应，±1 100 kV直流控制保护系统采用分层设计，控制保护功能分散配置到不同层次的控制保护装置中[15]，以最大限度提高系统整体可用率[16]。其每个极的设计方案如图2所示。图中，PCP为极控制装置，PPR为极保护装置，CCP为换流器控制装置，CPR为换流器保护装置。

图2中，控制保护设备按极层、换流器层配置，双极层功能分别配置在两极的极层装置中实现，尽可能避免双极层设备故障对两个极同时造成扰动。控制装置采用双重化冗余配置；保护装置采用三取二的冗余方案，极层和换流器层分别配置独立的三取二装置进行保护动作出口的判断。

控制保护装置间实时通信的控制LAN网按极层、换流器层划分，双重化冗余设计。极层和换流器层控制LAN各自独立，PCP装置既连接极层控制LAN，又连接到本极的两个换流器控制LAN，承担极层与换流器层信号交换任务，并向CCP装置下发电流指令，根据电流指令进行闭环调节的功能在CCP装置中实现。同极两个12脉动换流器的控制装置间采用光纤以太网直连通信，以便换流器间的协调控制。

3 系统自监视设计

通过设备冗余和系统自监视与切换，常规直流控制保护系统均满足控制保护单一元件故障不影响输电系统运行的设计要求。而对于±1 100 kV特高压直流，其巨大的输送容量对控制保护系统的可靠性提出了更高的要求，有必要进一步研究针对某些特定冗余设备故障的监视和处理方法，充分利用特高压直流控制保护分层设计和功能分散配置的特点，通过自监视设计，判定冗余设备故障，缩小故障影响范围，尽可能维持系统全部或部分运行，以提高系统的整体可用率。

以下分别针对极控制装置和换流器控制装置这两种关键设备的冗余故障进行研究和探讨。

3.1 极层冗余控制装置故障

当极层冗余的PCP装置都故障时，本极换流器控制装置CCP接收到的电流指令被保持，CCP装置内的闭环调节功能可以继续运行，两个换流器层的控制LAN仍可独立运作。因此系统具备维持当前状态继续运行的能力。

另一方面，极层冗余的PCP装置都故障时，极保护装置PPR将失去与值班PCP的通信。常规的直流控制保护系统监视方法是，保护装置失去与值班控制装置的通信时，立即闭锁本套保护，退出运行；三套保护装置全部退出运行后，三取二装置中的无保护装置运行逻辑将停运相应的直流系统，从而这种系统自监视方案降低了系统的可用率。

±1 100 kV特高压直流控制保护样机的自监视设计中，对极层设备的监视采取了以下方案：极保护三取二装置和极保护装置双向通信，当某套极保护装置监视到两套冗余极控制装置故障时，发请求退出信号给极保护三取二装置，极保护三取二装置收到该信号，判断是否所有运行中的极保护装置同时发来该信号，若不是，则向请求退出的极保护装置发允许退出信号，极保护装置闭锁本套保护，退出运行；若是，则向请求退出的极保护装置发禁止退出信号，极保护装置继续运行。

极保护装置判断冗余极控制装置故障的逻辑如图3所示。

发生下列情况之一时，极保护装置判断冗余极控制装置故障或冗余通信故障发生，向两套极层三取二装置发出请求退出信号：

(1)极保护装置与两套冗余极控制装置的通信均故障；

(2)极保护装置监视到两套冗余极控制装置均不处于值班状态；

(3)极保护装置监视到值班极控制装置发生紧急故障，且延时后未产生极控系统切换，故障条件仍成立。

极保护装置发出请求退出信号后，等待极层三取二装置返回允许信号。当两套极层三取二装置中的任何一套向极保护装置返回允许退出信号，且该极保护装置中的请求退出信号仍为TRUE时，该套保护退出运行。

而对极保护装置自身的严重或紧急故障，比如本装置的处理器故障或测量故障等，不需要等待极层三取二装置返回的允许退出信号，极保护装置立即闭锁本套保护，退出运行。

图4是极层三取二装置判断是否允许极保护退出的逻辑图。

图4中输入的保护装置请求退出信号即为图3中极保护装置发出的请求退出信号。极层三取二装置计算运行中的极保护装置的数量和发来请求退出信号的极保护装置的数量，如果运行中的极保护装置的数量大于发来请求退出信号的极保护装置的数量，进一步检测极保护装置发来的请求退出信号的同时性。

极层三取二装置在判断允许极保护退出前设置延时，在延时窗口内，如果极层三取二装置收到了所有运行中的极保护装置发来的请求退出信号，则同时性条件成立；否则不成立，极层三取二装置向发来请求退出信号的极保护装置发送允许退出信号。

采用上述极层装置监视与处理方法，在±1 100 kV特高压直流冗余极控制装置故障时，不会因极控制装置冗余故障引起极保护装置全部退出运行，从而可避免导致极停运；特高压直流系统可以维持极控制装置故障前的状态继续运行。

3.2 换流器层冗余控制装置故障

当某一换流器冗余配置的两套CCP装置均故障不可用时，该换流器将丧失所有的控制和监视功能，包括正常的阀触发和通过电流的能力。此时如无后备的处理方法，本极串联的另一正常运行的换流器也将因为没有直流电流回路而被迫停运。针对这种情况，向上、锦苏等特高压直流工程中设置了后备跳闸继电器，通过继电器机械触点监视控制装置的状态，在两套冗余CCP装置均故障时由后备继电器启动跳闸、合旁通开关操作，退出本换流器。

从提高可靠性角度出发，±1 100 kV特高压直流控制保护样机设计中，对换流器层控制装置的监视采用了以下方案：

由本极的极控制装置PCP监视冗余CCP装置的故障状态；换流器旁通开关属于换流器区设备，由CCP装置控制分合，现增设PCP装置到本极换流器旁通开关的控制合指令的接线，如图5所示。

PCP装置与冗余CCP装置间通过控制LAN网实时通信，当PCP装置监视到冗余的CCP装置均故障时，向此换流器的旁通开关发控制合指令；同时向另一换流站发送本站退出换流器的信号，另一换流站收到该信号后，也退出对应的换流器。

PCP装置向换流器旁通开关发出控制合指令后，自动使用预先设置的检修状态值代替来自故障CCP装置的信号状态值，检修状态值按照该换流器处于隔离状态进行设定；自动设置换流器检修状态后可人为复归，退出检修状态。

±1 100 kV特高压直流控制保护系统的自监视功能，能准确识别CCP装置的冗余故障；由PCP装置通过控合旁通开关来退出故障换流器的方案，相比后备继电器的方案，可靠性更高。另外，通过PCP装置进行站间协调，也利于换流器的平稳退出，确保本极另一换流器继续正常运行。

4 仿真验证

±1 100 kV特高压直流控制保护系统开发完成后，与RTDS仿真器构成闭环仿真测试系统。为验证上节所述的系统自监视及处理方案，分别进行了冗余PCP装置故障试验和冗余CCP装置故障试验。试验工况为：极1功率控制，双换流器串联运行，功率指令1 000 MW，直流电压1 100 kV。

系统稳定运行后，关闭极1的两套PCP装置的电源，模拟冗余PCP装置故障。CCP装置监测到冗余PCP装置故障后，维持系统原状态运行；由于极保护装置和极层三取二装置采用了改进的监视逻辑，极保护装置未退出运行，没有导致直流停运，系统维持原状态继续运行。实验波形如图6所示，其中UDL为直流电压，IDNC为直流电流，ALPHA为触发角，在0.4 s时刻PCP＿FLT信号由0变1表示发生了冗余PCP装置故障。

恢复初始工况稳定运行后，通过关闭极1高压换流器的两套CCP装置的电源，模拟冗余CCP装置故障，试验波形如图7所示。极1 PCP装置监测到高压换流器冗余CCP装置故障(CCP1＿FLT信号由0变1)后，立即发出合高压换流器旁通开关命令(BPS1＿CL＿ORD信号由0变1)，约50 ms后，旁通开关闭合(BPS1＿CL＿IND信号由0变1)，直流电流重新建立，低压换流器继续运行。

5 结论

冗余故障篇4

互感器是电力系统中重要的变换设备,他能将一次系统的高电压、大电流转换成便于测量的低电压、小电流,送给测量仪表、保护设备及自动控制装置。互感器的准确、可靠运行对电力系统的监视、测量、保护与控制产生重要影响,并进一步影响电力系统运行的稳定性。目前电力系统的互感器普遍采用电磁感应式互感器,易发生二次侧断线、互感器过饱和等情况,会引起互感器二次侧数据的失真,影响对电力系统数据的采集及状态的判断,给电力系统的安全运行埋下隐患。

容错控制(Fault tolerant control,FTC)是一门高可靠性学科。所谓的容错是容忍故障的简称,它通过对系统的设计,使得当一个或部分元件发生故障后,系统仍然能按原定性能指标或是性能指标略有降低但在可以接受的范围内运行,从而保证系统的正常运行[1,2]。容错控制为提高复杂系统的可靠性开辟了一条新的途径。

本文在介绍容错控制基本思想的基础上,分析了电力系统中已有的用以提高可靠性的方法与容错控制之间的关系,提供了利用容错控制的思想对电力系统可靠性问题进行分析的思路;并利用容错控制中的解析冗余方法,对电力系统中互感器的故障检测及容错控制进行了研究,该方法的应用充分证明了采用容错控制思想对电力系统可靠性进行研究的可行性和有效性,从而为提高电力系统可靠性提供了一条新的思路。

1 容错控制及解析冗余简介

容错控制是一门应用型边缘交叉学科,它的理论基础涉及现代控制理论、计算机工程、信号处理、模式识别、人工智能以及相应的应用学科[3,4,5]。

容错控制的指导思想是一个系统一旦发生故障,而且这种故障会对系统的稳定性及性能有很大影响时,要求系统仍然是稳定的,并且满足要求的性能指标。

作为一个复杂的大系统,电力系统中已自觉或不自觉的应用到了容错控制的一些思想及方法。这些方法有些是从容错控制的角度出发来设计的,而更多的则是在实际中广泛应用,但未曾用容错控制的理论来描述的。如最为常见的保护系统,实际上就是对电力系统的一种容错控制:当某一部分元件发生故障后,将故障的部分切除,让系统仍然保持稳定,而不至于崩溃。另外,像电力系统中发电机的励磁控制系统、调速控制系统等都用到了容错控制技术[6,7,8,9,10,11,12,13,14]。

但是,到目前为止,电力系统中的容错控制,较多的还是采用硬件冗余的方法,该方法原理简单,但会增加系统投资,同时会使系统复杂性增加,而且,到了一定程度后,再靠采用硬件冗余来增加系统的可靠性将变得非常困难,因而需进一步改进以提高电力系统中容错控制的水平。解析冗余就是一种有效的方法。

冗余是通过对系统功能的重复配置来实现容错功能的。根据冗余部件的不同,可以分为硬件冗余和解析冗余两种。硬件冗余是通过简单的对硬件设置重复备用来实现的;解析冗余也称功能冗余,它是通过不同部件之间存在的功能关系建立函数关系式来构成附加的冗余[15]。与硬件冗余相比,解析冗余不需要额外增加设备,能充分利用相互之间的关联关系,最大限度的发挥已有设备的功能,因而在容错控制的研究中得到了较大的重视。

2 互感器解析冗余关系的建立

随着电力系统的发展,变电站综合自动化及广域保护等系统的广泛应用,使得电力系统中各部分的数据能够实现相互共享,这些数据之间往往存在着时间上的连贯性和空间上的相关性,为构成解析冗余提供了基础。本文将在变电站综合自动化系统的基础上,采用解析冗余的方法,对变电站中互感器故障的检测及容错进行研究,通过该方法的具体应用,来验证容错控制方法在电力系统中应用的可行性及优势。

2.1 综合自动化中信息的解析冗余分析

在变电站综合自动化系统中,各互感器所反映的电气量之间不是孤立的,而是相互制约、相互关联的。如从电压、电流的角度考虑,他们必然满足基尔霍夫电压和电流定理;从能量的角度考虑,他们必然遵守能量守恒定理。这样,根据相互之间的功能关系,某一互感器所反映的电气量就可由与之关联的其他互感器的量值唯一确定,我们称这个由其他关联互感器所确定的值为解析值,该互感器本身所测得的值为实测值。解析值与实测值之间构成一种功能关系上的解析冗余,合理的利用这种冗余关系,将有助于我们对互感器的运行状态进行判断,并进一步对发生故障的互感器的真实数据做出预测。

2.2 综合自动化中互感器解析冗余的表达

为建立互感器的解析冗余关系,需对变电站综合自动化系统中的数据进行挖掘,对各个互感器之间的关联关系进行分析及描述。

为便于从整体角度对互感器的关系进行分析,首先以变电站中的互感器为节点,馈线为边,建立变电站网络的拓扑结构(具体方法可参照文章第4节)。

为了描述各互感器反映的电气量之间的内在联系,我们采用网形结构矩阵对互感器组成的拓扑结构加以描述。

以电流互感器为例,考虑各互感器工作时潮流的方向,定义功率流出点为父节点、功率注入点为子节点。网形结构矩阵C为N×N的矩阵为

其中元素规定为:若节点i下有子节点j,则Cij=1,否则Cij=0。

网形结构矩阵反应了网络的实时拓扑结构,但由于考虑了潮流的方向,网形结构矩阵无法描述网络末端的互感器的连接关系。对于没有子节点的末端互感器i,采用末端节点关联矩阵E加以描述:

则G能够全面的反映变电所中各互感器之间的连接关系,包括比较特殊的末端互感器。通过它将各个互感器之间的关系表示出来,让各个互感器之间不再是相互孤立的。

根据综合自动化系统中所得的各互感器的实测值I=[i 1,i 2,i 3,,i N]T,利用关联矩阵便可得各互感器的解析值ˆI=G×I,解析值ˆI与互感器的实测值I之间构成解析冗余,可用于互感器故障的检测及容错。

3 基于解析冗余的互感器故障的检测及容错方法与步骤

通过构造关联矩阵得到互感器解析值后,可以看到,解析值由与之关联的其他互感器的状态确定,而与互感器本身无关,故可将解析值用于对互感器状态的判断。将互感器纵向的历史数据与横向的解析数据相结合,共同作用提高故障判断的准确性,最大限度的发挥现有数据的作用。

故障检测及容错控制具体的流程如图1所示。进行故障检测时,先利用已测得的纵向的历史数据,对互感器测量值的变化量ΔI进行判断,若某一互感器的测量值的ΔIi大于设定的阈值,再利用关联矩阵计算其横向的解析值ˆIi,并将解析值与实测量Ii进行比较,若所得残差大于阈值,可判断为该互感器故障,则可由解析值代替实测值,由于解析值利用了与故障互感器相关联的其他互感器的信息,与故障互感器无关,故而能较好地反映该互感器当前应该的正确值,提供给综合自动化系统后,可以保证综合自动化系统在部分互感器出现故障后仍能正常运行,实现对故障的容错。

4 举例

现以某牵引变电所为例,介绍上述方法实现的过程。该牵引变电所的主结线如图2所示,互感器在图中标出。据此得到互感器所组成的网络拓扑结构如图3所示(设T1工作,T2处于备用)。

图3 T1工作、T2备用时电流互感器拓扑图Fig.3 Topology of instrument transformers while T1 is working and T2 is in standby

针对该拓扑图,考虑功率的方向,并注意到节点之间变压器的变换作用,写出网形结构矩阵C。

从C中可以看到,节点①连接着子节点②③④,并且它们之间存在着变比为1:k的变压器,节点③连接着子节点⑤⑥,节点④连接着子节点⑦⑧,而由于节点②⑤⑥⑦⑧为末梢节点,没有子节点存在,故对应的行元素全为零。针对这些末梢节点构造末端节点关联矩阵E。

则关联矩阵G得

可见,关联矩阵G不但描述了各个互感器之间的相互联系,而且表示出了各个互感器之间的功率的方向。

现假设电流互感器CT4(节点③)出现故障。各互感器所反映的电气量分别用CT1、CT2…来表示,则信息向量

当CT4出现故障时,在某一时刻,必将得到ΔI3=I3(t+)1-I3(t)≥ε。此时计算解析向量

取其对应的元素ˆI3=CT10+CT11作为节点(3)的解析值。可见,该解析值是利用了互感器之间的相互连接关系,由工作状况相互独立的其他互感器的值计算得到,不受互感器自身状态的影响。

计算该互感器所对应的残差e3=I3-Iˆ3,故障时实测值I3失真,与解析值ˆI3之间存在较大差距,从而残差e3能将该故障反映出来。

确定该互感器故障后,可由解析值ˆI3=CT1 0+CT11来取代故障互感器的错误测量值送给综合自动化系统,保证系统的正常运行,从而实现对互感器故障的容错。

5 结论

电力系统自动化的实现,为数据共享提供了条件,数量众多的数据蕴含着丰富的系统信息,利用解析冗余挖掘信息相互之间的关联关系,对系统状态的监视预警、趋势预测、故障容错具有重要的意义。本文在变电站综合自动化系统的基础上,通过构造关联矩阵,得到互感器相互之间解析关系的表达式,利用互感器的解析值与实测值所形成的解析冗余,提出一种对变电站中互感器故障进行检测和实现容错控制的方法,其优点在于可充分利用互感器信息在时间上的纵向连贯性及空间上的横向相关性,充分利用现有设备,不需要额外增加投资;并且当检测到互感器故障后,仍能保证综合自动化系统正常的工作,不会出现拒动和误动,实现对互感器故障的容错控制。该方法的成功应用充分证明了采用容错控制的方法对电力系统进行研究的可行性和有效性。

冗余故障篇5

目前西气东输西一线东段场站采用是单回路电源、发电机加UPS电源供电方式。UPS作为一个负载场站通讯、SCADA系统设备的电源设备, 对安全生产有至关重要的作用。如何保障UPS完好率或者说如何保证UPS在出现状况时可以准确的判断故障, 在最短的时间内恢复生产, 提高员工UPS故障时的应急能力, 是每个西气东输电气管理人员要考虑的问题。作为一个电气管理人员我对我多年的工作进行了一个总结, 希望对运行有益。

2 UPS工作原理

UPS电源系统由整流、储能、变换和开关控制4部分组成。其系统的稳压功能通常是由整流器完成的, 整流器件采用可控硅或高频开关整流器, 本身具有可根据外电的变化控制输出幅度的功能, 从而当外电发生变化时 (该变化应满足系统要求) , 输出幅度基本不变的整流电压。净化功能由储能电池来完成, 由于整流器对瞬时脉冲干扰不能消除, 整流后的电压仍存在干扰脉冲。储能电池除可存储直流直能的功能外, 对整流器来说就象接了一只大容器电容器, 其等效电容量的大小, 与储能电池容量大小成正比。由于电容两端的电压是不能突变的, 即利用了电容器对脉冲的平滑特性消除了脉冲干扰, 起到了净化功能。频率的稳定则由变换器来完成, 频率稳定度取决于变换器的振荡频率的稳定程度。为方便UPS电源系统的日常操作与维护, 设计了系统工作开关, 主机自检故障后的自动旁路开关, 检修旁路开关等开关控制。在电网电压工作正常时, 给负载供电, 而且, 同时给储能电池充电;当突发停电时, UPS电源开始工作, 由储能电池工给负载所需电源, 维持正常的生产;当由于生产需要, 负载严重过载时, 由电网电压经旁路回路直接给负载供电。

3 并联冗余UPS

并联冗余是将多于两台同型号、同功率的UPS, 通过并机柜、并机模块或并机板, 把输出端并接而成。目的是为了共同分担负载功率, 其基本原理是:正常情况下, 两台UPS均由逆变器输出, 平分负载和电流, 当一台UPS故障时, 由剩下的一台UPS承担全部负载。三机并联也是常用的一种方式, 西一线就是采用的这种并联冗余方式通过并机板并联进行运行的。这种方式虽然解决了单台UPS不能满足容量要求问题, 带来了增容方便科现场并联升级等优点, 而且索克曼UPS由于采用了先进的DSP技术, 使每台机器都有独立的控制系统, 并机运行的每台UPS输出滤形, 电压都非常一致, 并机调试时只需要设置相同的参数即可完成并机运行, 解决了并机环流和并机柜系统的瓶颈故障, 然而由于采取的输出并联方式, 在接口板发生输出短路时, 将不可避免的带来了并联短路, 导致系统无法输出, 诸如这些紧急情况的应急处理就显得尤为重要。

4 UPS故障应急处理

西气东输运行中UPS故障一般分为三种:蓄电池故障、市电输入故障和电路板故障。

4.1 蓄电池故障

这类故障一般在运行和维护中较易发现, 它总体来说有集中表现形式:

4.1.1 在放电过程中出现不能放电而停机现象, 一般停机前伴随这A06 (电池故障) 报警;

4.1.2 浮充时测试蓄电池电压时, 表现为电压明显高于其它蓄电池;

4.1.3 在放电过程中对电池电压测试时, 会出现电压明显低于其它电池电压。

这类故障很好判断, 根据测试的结果进行更换故障蓄电池就可以。这里要明确的是有些时候没有合适的蓄电池更换, 这就要求我们进行应急的处理, 只要同厂家同批次生产容量略大的电池也可以进行应急更换, 因为同厂家, 同批次蓄电池在容量相差不大的情况下内阻几乎是相等的, 对蓄电池本身和其它蓄电池基本没有影响。

4.2 市电输入故障

一般是缺相, 电压或频率不稳定, 这里一般伴随着A01 (相序错) 报警。这种情况一般是在外电改造后, 或者市电进行故障维修过刚送电时会出现, 这时候UPS告警且无法放电。这时候就需要我们暂时关闭UPS输入开关, 让UPS处于放电状态, 然后对市电相序进行调整, 调整完毕后即可恢复正常。

4.3 电路板故障

4.3.1 并机板故障

这类故障一般表现是UPS频繁转旁路, 并伴随逆变器故障、风扇故障报警, 这种故障处理不好是很危险的, 因为并机两台UPS出现输出不同步或相冲突很可能会引起短路电流对负载进行冲击。

这类故障的紧急处理办法是解除并机单机带载, 这时就要看实际的负载情况了, 如果两台机器的负载率都低于35%话是可以长期单机帯载的, 如果高于40%就需要及时的联系厂家进行处理了。

解除并机的方法:a.打开机器顶盖板, 在DE主控板6819上找到S1, 按一下, 机器内部可听到接触器声响。b.依次断开电池开关F1, 输入开关Q1;c.再并联板6844找到XJ5, 使用短接端子使其短接;d.如果需要脱出的机器是右机 (2号机) , 需要把它相邻左机并联板6844上的XJ2短接;左机不必进行操作;e.断开故障机上与并联板6844相连的两根线, XC3I, XC4I。f.将故障机的输出开关Q2拨到0位置, 脱离工作完成。

4.3.2 DE板出现故障

这类故障一般是在机器放电的时候会出现, 不能放电或间隙性出现A05综合故障报警, 这就是DE板故障, 机器的放电频率不稳定, 使两台机器不能正常并机而导致的。这类故障的紧急处理也是解并机用单机带载, 按以上解步骤进行。

4.3.3 接口滤波板故障

这类故障一般是表现在一台机器突然停机, 并伴随另一台机器报警A05:00000040报警, 这类故障很好判断由于有输出端有大电流冲击烧坏电路板, 烧坏的电路板是可以看到的。这时候往往一种情况是另一台机器是正常运行输出的, 这种情况是不需要应急处理的, 等专业工程师来即可;另一种情况是另一台机器不能正常输出这时候就需要我们进行应急处理, 往往处理不好就会出现全站重要设备全部停电的状况。

其应急处理步骤如下:a.断开UPS负载输出开关;b.切断故障机电源输入;c.确认故障机已隔离后, 断开未故障机的Q1和F1开关;d.接通未故障的输入电源 (一般两台机器的市电输入是同时跳断的) , 然后合上未故障机的Q1和F1开关等待面板初始化;e.确认无报警后, 投用未故障机的输出开关, 给负载进行供电。 (这里要注意的是, 在并联系统中的所有UPS主机之间都通过控制线连接在一起, 当其中一台UPS发生故障时, 系统将该机退出系统, 整个系统不受到影响。如果此时输出开关动作, 那么系统检测信号就会误认为有人员进行干涉, 系统会受到影响, 大的可能会导致负载当机。故建议当UPS系统中一台出现故障时, 禁止用动作输出开关Q2) 。

结束语

目前西气东输西一线场站UPS已经运行十多年, 其故障率越来越高, 对UPS运行中故障的应急处理要求越来越高, 才能保障输气生产的安全, 本文收录的故障类型不尽完善, 希望能给各位读者有所裨益。

参考文献

[1]刘军.UPS冗余方式的选择[J].电气开关, 2006, 6.[1]刘军.UPS冗余方式的选择[J].电气开关, 2006, 6.

冗余故障篇6

随着信息数字技术的高速发展, 数字闭环控制技术在系统中得到了广泛应用, 由于产品可靠性的提高, 闭环控制回路中采用三冗余位移传感器作为反馈元件;采集电路也采用三冗余设计方案, 即三冗余位移信号中的每路信号均由三个采集电路同时采集, 作为闭环控制的输入信号。

为保证数字闭环控制系统在一度故障下的产品性能, 要求在三冗余采集电路中的一路电源出现断电故障时, 其它两路的测量精度满足不大于20m V的要求;在三冗余采集电路参数设计时, 若采用传统的一个采集电路测量一路位移信号的电路参数, 已无法满足一路电源断电故障下的测量精度要求。因此, 提出对高可靠三冗余位移采集电路在一路电源断电故障下的测量精度进行研究。

2 三冗余位移采集电路设计简介

为了提高产品可靠性, 用于伺服控制的位移传感器与采集电路均采用三冗余设计, 其接口如图1所示。三冗余位移传感器的每一路位移信号均由三个采集电路的A/D采集通道同时采集, 位移信号经过RC滤波电路、电压跟随器进入A/D芯片, 采用的运算放大器为LM124。

3 一路电源断电故障下测量精度分析

在运算放大器LM124正常供电情况下的输入阻抗理论上为无穷大, 所以在一路电源断电时, 不考虑供电正常的两路运放的影响, 仅对一路断电下的运算放大器与传感器的接口阻抗参数进行分析。

3.1 理论计算

在图1中±15V1和±9V1断电的情况下, 即传感器1、采集电路1不供电, 传感器2、采集电路2、传感器3和采集电路3正常供电, 对采集电路2和采集电路3的测量精度进行分析、计算。设运放2-1输入端对正电源+15V1的阻抗为R+, 输入端对负电源-15V1的阻抗为R-, R为运放2-1输入端的滤波电阻。

(1) 传感器2滑动端位于0~-9V2之间时的阻抗计算。

当断开一路电源±15V1和±9V1时, 传感器2的滑动端位于0~-9V2之间, 设由地、经+15V1电源和运放2-1流到-9V2电源的电流为I+;设由传感器2的地流到-9V2的电流为I断;电流方向如图2所示。

断开一路电源1时, 传感器2滑动端的电压为U断;正常供电情况下, 传感器2滑动端的电压为U;则正常供电与断电情况下, 传感器滑动端的电压偏差为ΔU:

由式 (1) 可知, 要使断开一路电源1时与正常供电时, 减小传感器2滑动端的电压偏差ΔU, 则应减小传感器2电阻R1与R2的并联阻值或减小I+的电流值。

因传感器2的电阻固定, 无法减小, 因此只能通过减小I+来减小ΔU。I+的计算公式如下:

由式 (2) 可知, 可通过增大 (R++R) 来减小I+;因R+由运算放大器的特性决定而无法增加, 因此, 只能通过增大运放的输入阻抗R来减小电流I+。

(2) 传感器2滑动端位于0~+9V2之间时的阻抗计算。

当断开一路电源±15V1和±9V1时, 当传感器2的滑动端位于图2中0~+9V2之间时, 经测试, 在一路电源1断电情况下, 运放2-1输入端对地的阻抗R-约为∞, 所以对传感器测试电压无影响。

3.2 仿真分析

根据图1所示三冗位移信号采集电路的原理图, 建立Pspice仿真模型, 电阻R=3.48kΩ, 运算放大器为LM124。使传感器2的滑动端分别处于0~-9V2和0~+9V2之间, 进行三路采集电路正常供电和一路断电情况下运算放大器输入端的电流和电压测试, 测试结果见表1所示。

当采集电路1的电源1断电时, 调整传感器输出位置, 当传感器2的滑动端在0~-9V之间、R1=1.325kΩ时, 传感器2滑动端处的电压偏差达到了-0.13V。由表1可知, 当一路运放断电、且其输入端电压为负值时, 该运放输入端的电流增大、导致流过传感器2负边的电流增大, 从而使测量偏差变大, 影响了测量精度。

3.3 试验验证

将运算放大器LM124输入端的电阻R的阻值设置为200kΩ, 在三冗余采集电路的一路电源断电的情况下, 其它两路正常供电的采集电路测试精度不大于20m V, 满足系统使用要求。

4 结论

为了满足高可靠性的要求, 设计的三冗余位移传感器信号采集电路, 在一路电源断电故障下, 针对采集电路测量精度不满足系统使用要求的问题, 对影响测量精度的电路参数进行了理论计算、仿真分析和试验验证, 确定了合理的电路参数, 保证了三冗余位移采集电路在一路电源断电故障下的测量精度和可靠性。

摘要：本文对高可靠三冗余位移采集电路在一路电源断电故障下的测量精度进行了研究, 通过理论计算、仿真分析和试验验证的方式, 得到了合理的电路设计参数, 保证了电路测量精度, 从而提高了伺服控制精度。

关键词：一路断电故障,三冗余,采集电路,测量精度

参考文献

[1]张红燕, 樊东红, 谢祥徐.基于嵌入式Linux的数据采集系统的设计[J].中国科技信息, 2007 (18) .

【冗余故障】推荐阅读：

组织冗余05-27

冗余改造06-04

冗余路由08-21