DCS下载故障分析(精选8篇)
DCS下载故障分析 篇1
0 引言
重庆能源集团松藻电力公司2×150MW循环流化床机组,DCS控制系统为美国FOXBORO公司的I/A’S系统,51F主机,控制器CP60FT。作为整个DCS系统的核心,其控制器(即控制处理站CP)本身质量非常可靠,但作为一个系统,长时间运行,难免会出现一些故障,其原因是多方面的,如果不彻底处理,会引起机组不稳定运行,严重时,可能会引起机组停机。
1 DCS控制系统
整个系统分为3个节点,1#机组为一个节点,2#机组为一个节点,公用系统为一个节点,3个节点之间通过2个冗余的8口PASSIVERSTAR连接起来,为总线结构。其中1、2#机组节点总线上各挂有1台工程师站、5台操作员站、8对控制处理站;公用系统节点总线上挂有1台工程师站、1对控制处理站。
2 公用控制处理站(CP0001)下线
2.1 故障经过
2008年8月15日8:30,公用系统CP0001双控制处理站同时下线,包括公用电气、循环水泵、燃油泵等失去控制,严重危及两台机组的安全运行。DCS维护人员迅速赶到现场,分别对公用冗余控制处理站复位,控制处理站上线,系统恢复正常。15日16:25,副CP0001重新下线,复位上线后也会继续下线,不能正常工作。
2.2 故障处理
查系统报警发现,CP0001下的远程控制柜燃油泵房各I0卡件,无规律出现B路通信故障,并能在几分钟内自动恢复。对该I0卡件的现场总线组件FCM10E进行更换,故障仍未消除。后再检查光纤回路,发现有掉包现象,重新熔接光纤,更换光电转换器后,于16日17:20故障消除。
2.3 原因分析
报故障信息的设备,如控制器、IO卡件、现场总线组件FCM10E,经检查,均没有故障。故障信息有两点:CP下线;IO卡件报B路通信故障。根本的原因是:远程控制柜间,循环水泵房到燃油泵房光纤回路故障,包括光纤尾纤、光电转换器,通信回路不正常,所以各IO卡件不规律出现通信故障。因光电转换器及尾纤,均无严重的硬伤,所以各故障点能自动恢复正常。而控制器在招收数据时,因通信故障,不断地进行诊断和数据招收,引起控制器工作不正常而下线,严重时引起两个冗余控制器下线。光纤尾纤重新熔接并对故障光电转换器更换后,故障消除。
3 2#机组控制处理站(CP2006)下线
3.1 故障经过
2010年3月11日6:47,2#机组DCS锅炉汽水操作员站出现短时死机,电动门及给水泵B显示不正常,汽机TA1报警,给水泵B、凝泵B温度异常,06:53汽机操作员站出现了不能操作的情况。经检查发现2#机组DCS系统CP2006双控制处理站下线,分别复位控制处理站后,控制处理站上线,但该控制处理站下3对现场总线组件FCM10E及下属FBM卡件仍离线。将FCM分别重启后部分卡件工作恢复正常,但该控制处理站下IDAS通信卡件仍不能通信,对其程序下装、手动上线后恢复。3月11日19:27,CP2006 B路报警,复位后,现场总线组件FCM268300不能上线,另2对FCM下卡件从系统报警上看,工作正常,但采集的各个数据都与现场实际数据不一致,不能正常反映现场实际状况,也处于非正常工作情况,3月12日04:30恢复正常。
3.2 故障处理
编写应急处理预案,并将该控制器下所控制的各电机、执行器等设备置就地后,对CP2006双控制器同时进行复位15s以上,清空控制器的程序后,重新从工程师站下装程序,系统恢复正常。
3.3 原因分析
故障的直接原因是控制器内程序紊乱,从而影响到所管理的各卡件的正常工作。第一次复位后控制器通过冗余板直接调用另一块控制器程序,而另一块控制器程序实际上也不是正常状态,所以系统未能直接恢复正常。后一次是同时对双控制器复位,且复位15s以上,程序完全清空,从工程师站下装,所以恢复正常。
机组停机检修期间,对接地线、控制器、FCM10E返厂检测,均未发现异常。故障原因主要是用来测量壁温的通信卡,接收远程智能终端的RS-485通信信号时,容易丢包,在控制器内产生垃圾文件,经日积月累,垃圾文件产生较多,从而引起控制器故障。
4 2#机组控制处理站(CP2007)下线
4.1 故障经过
2012年6月8日0:48开始,CP2007的副控制器经常下线,然后又自动上线,如图1所示;后换位至CP2001的位置,问题现象一致,如图2所示。
4.2 故障原因及处理
同一块控制器,在不同位置所报故障相同,说明控制器本身故障,更换控制器后正常。
5 解决措施
(1)新机组组建DCS系统时,重要设备控制特别是模拟量控制设备的卡件,与含有远程通信、其他系统通信的卡件尽量避免同在一块控制器,含有远程通信、其他系统通信的卡件可以与数据采集卡等分配在同一控制器,这样,控制器出故障时,不会引起严重的后果。
(2)当系统某一段回路各卡件出现无规律通信报警时,重点进行该回路前端光纤设备检查,特别是光电转换器。如无法有效检测,可逐一更换检查,及时把故障消除。不及时处理极可能引起控制器下线,从而造成更严重的后果。
(3)定期对控制器程序清空:先UPLOAD,并做好备份,再对冗余双控制器同时复位15s以上,控制器程序清空后,再下装。
(4)控制器复位处理措施。控制器复位操作前,需编写好应急处理预案,有备用设备的切换到另一控制器下的备用设备运行;无法切换的设备置“就地”,解除DCS对其进行控制;在重要设备位置,派专人进行现场监护,紧急时就进行“就地”操作。
DCS下载故障分析 篇2
DCS系统在热电厂锅炉应用中故障研究与分析
摘要:本文在简要介绍了锅炉控制系统和神经网络后,对基于BP神经网络的故障分析法进行了详细的分析、阐述,并在此进出上建立数据模型.仿真表明,诊断系统的`诊断准确率达到满意的结果.作 者:梁岐 薛海燕 王勤和 作者单位:内蒙古国电能源投资有限公司乌斯太热电厂,内蒙古,750336 期 刊:中国科技博览 Journal:ZHONGGUO BAOZHUANG KEJI BOLAN 年,卷(期):, “”(5) 分类号:X928.3 关键词:集散控制系统 锅炉 变压器 神经网络DCS下载故障分析 篇3
【摘要】随着现代控制技术的逐步发展,火力发电厂DCS系统控制也在不断更新,一些旧DCS系统由于硬件不断老化,需要进行软硬件升级改造。本文介绍了邹县发电厂某机组在DCS升级改造中出现的一些问题,并进行了探讨,希望为其他控制系统改造提供一些参考。
【关键词】控制系统;升级改造;通信故障
ABSTRACT: With the development of modern control technology, DCS control system of power plant are constantly updated. Due to the aging of equipment in old DCS, it is necessary that the upgrades of hardware and software. Some problems about DCS upgrades of Zouxian plant were discussed, and solutions were put forwared. It provide a reference for similar units.
KEY WORD: control system;upgrades;communication failure
1、引言
華电国际邹县电厂某机组锅炉为自然循环单炉膛仓储式燃煤锅炉,采用倒U型布置、切向燃烧、固态排渣、平衡通风、燃料为烟煤。汽轮机组为335MW亚临界、中间再热、四缸、四排汽、冲动凝汽式机组。DCS控制系统为FOXBORO公司生产的I/A'S,硬件型号为CP40B,软件版本为6.3,工作站采用SUN公司的ULTRA 5系列。工程师站共有3台,同时做为历史站,其中AW5101为管理首站,AW5102站装有与MIS网通信的接口程序,AW5103站为DEH系统管理站,另设5台操作员站WP,整个网络管理15对DPU,测点总数约6500点,整个系统网络由DPU间通信的Nodebus网和与I/O柜通信的FIEDBUS网组成。整个DCS系统包含DAS、CCS、FSSS、SCS、MEH、DEH、BPC、ECS及与其他系统的接口(MIS系统、与脱硫系统、供热系统等)。控制系统投产于2002年,运行一直安全稳定。
随着时间不断推移,DCS系统关键部件CP和工作站等都已无法购买备品,系统升级迫在眉睫。整个系统升级分两阶段进行,首先在2010年搭建了基于光纤通信的MESH网络,并增加一台P92管理工程师站,此工程师站采用XP系统,仅管理MESH网和做为历史站备用功能。第二阶段在2011年,升级了1对CP,将其中一对CP由CP40B升级为FCP270,同时将此CP下I/O卡件由FBM100系列升级为FBM200系列,这两次改造分别用时一周左右时间,但系统改造完成后,先后出现了系统时间跳变和通信反应缓慢的现象,类似只对部分硬件进行升级改造的电厂山东省内有5家,其中出现故障的现象在滕州、菏泽电厂等也出现过,可以说这种故障具有一定的代表性。
2、升级过程介绍
原控制系统为同轴电缆传输的Nodebus网和双绞线传输的FIEDBUS网组成,其中工作站基于UNIX平台,控制内容包含了除ETS、TSI外的所有热控控制,系统网络图见图1:
第一次升级在2010年6月份,利用停机时间,增加了MESH网络和基于XP系统的P92工作站,MESH网络通过2块ATS卡与原系统进行通信,改造后为系统升级打下了基础,系统网络图见图2:
第一次改造后,P92工作站做为MESH网的管理站,同时做为3台工程师站中历史数据站的备用站,运行一段时间后,运行人员反应调用历史数据时,系统反应时间变慢,通过分析为P92站由于历史数据过多,占用了网络资源,导致系统通信慢,便将P92工作站停用。
第二次升级在2011年9月份,利用机组小修时间,将15对CP中的其中1对更换为FCP270型号,通过MESH网与原网络进行通信,同时P92站做为新CP的管理站,系统网络图见图3:
第二次改造用时1周左右时间,将原I/O柜内卡件全部更换为新型卡件,并对原CP文件转换为新CP文件,改造过程比较顺利,系统未出现异常。
3、升级改造后出现的异常现象
第二次改造结束1个月后,在1个多月的时间内系统出现了时间跳变、画面曲线跑直线、系统反应慢、新CP测点不刷新、Nodebus离线等一系列问题,表1为DCS系统所引发的故障列表:
4、原因分析
通过查阅工作站事件先后的故障记录文件。分析为以上事件是由于网络负荷过高,造成网络阻塞,使DCS通信变慢。经过检查、分析,造成网络阻塞原因主要有以下四方面:
1)工作站由于长时间的工作,老化现象严重,技术性能落后,老的节点总线系统通讯速率较低,只有10Mbps;
2)DCS由于老系统和新系统混用,历史库配置不够优化;
3)AW5102通信负荷率由于安装了PI系统接口和全工况监视接口导致整个网络通信负荷过高,通过停运AW5102站上的PI的接口程序发现网络的负荷率大幅度降低,网络流量平均值从800多个数据包降低到450多个数据包;
4)工作站与网络连接用的DNBT卡存在老化现象,致使工作站在某些时间、某些工况时与系统通信过程中出现占用大量网络资源的现象。
以上几个方面因素叠加,是引发一系列故障现象的主要原因。
5、处理方案
5.1临时处理方案:
鉴于机组已经进入冬季供热阶段,不便对系统进行大的改造和更新,在此情况下,采用以下临时处理手段,降低网络负荷,避免类似故障再现。
1)重点监视工作站AW5102的负荷状况,并且查看/opt路径的空间情况;在负荷上升到一定阶段时,可以考虑人工重启AW5102,以便释放其内存和硬盘空间,降低网络负荷。
2)对现有历史数据系统进行优化:目前机组有AW5101、AW5102、AW5103和P92四台工作站同时在进行历史数据记录和存储工作。为了降低网络负担,历史数据记录工作将分Nodebus和Mesh网络两部分,分别记录在51系列工作站和P92工作站上。经过优化后,网络通讯较为流畅。
3)增加巡视内容,检查系统信息(信息文件存放在/opt/fox/sysmgm/sysmon/smon_log文件中)和AW5102的负荷情况,密切监视系统故障信息,一旦发现有同类故障隐患,可人工启动AW5102;
4)定期(每月一次)清理系统垃圾文件(垃圾文件为所有目录下的core文件)。
5)对于其他工作站,出现类似故障时也可能会导致网络堵塞,在巡检时同样注意上述事项。
6)运行人员及时关闭不用的应用程序(如DM画面,不再需要查看的历史趋势等),减轻机器和网络负荷。
5.2彻底解决隐患方案:
利用机组检修机会,对新旧不同版本搭配的硬件和软件进行全面升级改造。
1)由于机组采用的51D工作站已经服役多年,严重老化,技术落后。在條件允许的情况下,采用目前福克斯波罗公司主流的P92平台工作站逐步更换现有的51D工作站。在已经搭建好Mesh平台的情况下,升级到P92平台是非常便捷的。
2)对DNBT卡逐步进行更换,以判断是哪一块DNBT卡存在老化现象。由于网络阻塞现象不是一直存在,查找老化的DNBT卡非常困难,经过逐步更换,发现WP5101站DNBT卡工作不稳定,更换此站DNBT卡后网络上线正常。
3)更换P92工作站,对系统软件进行离线重装,离线试验48小时后未发现问题,将92工作站在线运行。
经过以上方案处理,现DCS系统正常运行一年半,未出现反应慢、死机、数据跑直线等异常情况,说明问题已经解决。
6、结束语
DCS控制系统是机组控制的核心部件,在搭建和对系统进行改造时,需要严格按照《DLT 659-2006火力发电厂分散控制系统验收测试规程》要求,对系统进行各项试验,检查网络系统通信负荷率符合如下要求:操作员站CPU负荷率不大于40%,过程控制站CPU负荷率不大于60%,通讯负荷率的配置不能保证在负荷运行时不出现瓶颈现象,数据通讯总线的负荷率在繁忙工况下不超过30%,对于以太网则不超过20%。
加强DCS系统维护工程师培训,采用规范的方法来进行日常的检查和维护:对系统软件根据要求进行每季度1次备份,严格执行《DCS系统防病毒管理规定》,不使用U盘、移动硬盘等手段进行软件备份;做好系统应用软件管理,各种系统软件及版本号标识清晰,严格根据要求进行系统安装;不得随意安装未经DCS厂家授权的第三方软件。
DCS控制技术发展日新月异,现在形势要求我们需要不断对控制系统进行升级或改造才能满足现场设备需求,但由于维护人员对新技术掌握需要一定时间,新技术应用也需要经过时间来验证,所以设备升级改造会对控制带来或多或少的影响,只有我们不断学习,领会其中的精髓,才能将新技术的优势完全体现出来。
参考文献
[1]上海福克斯波罗有限公司《I/A Series系统及应用》
[2]《I/A Series控制系统检修规程》
[3]《DLT 659-2006火力发电厂分散控制系统验收测试规程》
收稿日期:2013年8月5日
作者简介
DCS下载故障分析 篇4
DCS系统全称为分散控制系统,又叫集散控制系统,英文distributed control system。由于采用“管理集中,控制分散”的设计方法,它避免了集中控制系统因中心计算机故障导致整个过程控制系统瘫痪的现象,将危险分散,系统各个部分的故障不影响其他部分的正常工作,因而具有更高的安全可靠性,可分布较大地域,能进行大型生产过程的实时控制,模拟量数据处理功能和运算功能,能胜任大型和控制状况复杂的过程控制系统,而且还可以实现在线优化、实时调度、统计管理等功能。在这种情况下,如果DCS系统出现异常,将使系统失控,出现不可预知的事故,给企业带来巨大的损失。
二、XDPS-400分散控制系统概述
XDPS是新华分散处理系统(Xin Hua Distributed Processing System)的缩写,代表了新华的产品系列。XDPS可以构成各种独立的控制装置、分散控制系统(DCS)、监控和数据采集系统(SCADA),完成工业生产过程实时数据采集、过程控制、顺序控制、高级控制、报警检测、监视、操作,对数据进行记录、统计、显示、打印等处理。
三、XDPS-400分散控制系统的特点
XDPS-400系列的最大特点是系统的开放性,硬件、软件与通讯都采用了国际标准或主流工业产品,构成开放的工业控制系统。
硬件:
硬件跟随计算机发展潮流。人机接口(MMI)采用标准工业PC机,分布处理单元DPU采用标准工业PC总线结构。
软件:
Windows3.x、95、NT系统软件,以及基于Windows NT的实时多任务操作系统RMX-X。方便直观地符合IEC-1131-3的DPU图形组态软件、图形显示、报表、控制、记录统计的生成工具软件。
通讯:
采用成熟的计算机网络通讯技术,构成高速的冗余实时数据网,符合IEEE802.3标准,通讯速率10Mbps/100Mbps。
显示:
高分辨率显示,分辨率1280×1024或1600×1200。窗口显示及三维空间的显示画面。
一体化:
通过以太网(Ethernet)与其它信息网络联接,从工业生产过程控制、测量、生产管理信息一体化。
汉化:
全汉化显示、支持中英文显示界面。
网络:
实时数据网(A网、B网)冗余总线式网络,传递实时数据,支持1~250个网络节点。信息数据网(C网)实现数据库文件与打印共享,传递系统非实时性文件信息。
容量:
分布实时数据库,对网上各节点透明,全局数据容量达64,000点模拟量,64,000点开关量。
实时性:
1秒内可更新所有全局点,1秒内调出任何图形显示,最快50ms的控制周期。
灵活:
除可接新华公司的I/O模块外,通过标准的通讯协议(如DNP3.0、Modbus、SC1801等),还可接其它常用的I/O系统、各种PLC、厂级MIS和其它控制系统。
发展:
硬件与软件跟随国际工业主流产品同步发展。
功能:
集过程控制、顺序控制、数据监视和记录于一体。
可靠性:
系统经可靠性设计,采用冗余技术,容错技术,双路电源供电,保证系统MTBF≥150,000小时。
备件:
标准化与系列化,备件种类大大减少。
维护:
通道级的自诊断程序,CRT自动报警与显示,可实现快速带电更换,MTTR<5Min。
接地:
系统要求独立接地,接地电阻≤2.5~4Ω
四、DCS系统常见故障分类
(一)DCS系统硬件故障。
这类故障是指过程控制层的故障。一是DCS系统中的模块,特别是I/O模块损坏造成的故障;二是DCS接地不牢靠,导致卡件损坏。这类故障一般比较明显且影响也是局部的,比如:参数显示没有变化,排除现场仪表故障可能后仍不能操作执行机构和电动门等。它们主要是由于使用不当或使用时间较长,模块内元件老化所致。如果模块周围的环境灰尘超标、温度高、湿度大将会大大缩短模块的使用寿命,因此鉴于DCS系统对温度、湿度、清洁度的严格要求。在安装前,操作室尤其是过程控制室的土建、安装、电气、装修工程必须完工,如在夏季,空调要及时启用。另外,尤其在管道夹层上过程控制室,其盘柜的电缆孔洞一定要封堵好,否则,一旦管道漏汽窜入盘柜,极有可能造成重大故障。
(二)DCS系统软件故障。
这一类故障是软件本身的错误引起的。一般出现在DCS系统投运调试阶段,因为应用软件程序复杂,工作量大,所以应用软件错误难以避免,这就要求在DCS调试试运阶段组态人员和运行人员应十分认真,及时发现并配合DCS系统调试人员解决问题,此类故障在DCS系统正常运行后很少见。第二类故障就是在系统正常运行时需增加控制点,在线修改程序导致系统出错或者死机,这就要求DCS编程组态人员对系统非常熟悉,预先做好控制方案,再进行实施,实施前必须做好程序备份,避免错误发生时,可及时挽救不必要的损失。
(三)人为故障。
失误原因多种多样,有维护人员操作错误、专业水平欠佳、监护不到位、没有进行事故预想、管理有漏洞等原因。在实际运行操作中,有时会出现DCS系统某功能不能使用,但实际上DCS系统并没问题,而是操作人员操作不熟练或操作人员错误操作引起的。因此DCS系统供货厂家应及时向运行人员提供DCS操作手册,初次使用DCS系统的操作工要经过培训后才能上岗操作。
(四)仪表人员工艺流程不熟造成的故障。
此种现象在各厂中普遍存在,操作员对仪表人员依赖性过大,而仪表人员平时不能进入控制室的规定实际上也制约了仪表人员对DCS的深入了解,另外由于仪表人员长时间不接触DCS系统造成缺陷出现时不能及时准确地处理。笔者遇到过这样一种情况,一个串级均匀控制(形式上和普通串级控制一样)被操作员当作普通串级控制来设置PID参数,结果可想而知,怎么也控制不好。如果操作员能与仪表技术人员密切配合,相信仪表技术人员能分清串级均匀控制和普通串级控制的区别,从而给予操作员在参数调整方向上的指导。因此,现在仪表人员平时不能进入控制室的规定利弊兼有,如果能让部分仪表人员参与操作员的日常工作,将会对操作员和仪表人员的综合业务素质的增长大有好处。
五、DCS系统故障防范措施
(一)DCS系统运行与管理。
DCS系统的运行管理是指计算机系统日常点检,各种软件管理,备件管理,文件归档管理等;加强软件管理,组态的修改必须按有关规定执行,同时必须及时备份修改前后的所有组态信息,存档备查;当DCS装置发生故障,需用备件更换时,使用前必须对备件进行功能测试,以防患于未然。DCS系统检修管理是DCS系统检修时必须要有合理的检修工艺和程序,应重视DCS系统检修项目和周期,检修项目依据DCS系统设备特点,随工艺设备大修至少进行以下项目的检修:软件的备份,核实控制模件标志和地址;清扫电源、模件及防尘滤网,检查及紧固控制柜接线,接地系统检查,冷却风扇检修,电源测试;重要测量和保护信号线路绝缘检查;控制室温度、湿度及含尘量检修前测试;对UPS供电设备进行清扫,对操作站进行清扫,通讯进行检查等。
(二)DCS系统抗干扰措施。
在中央控制室四周墙壁粉刷之前,先钉上一层钢丝网,再与电气保护PE接地系统相连。可以有效地防止高压输电线距离产生的强电磁场干扰。或者高压输电线改为埋地沟敷设,也可以解决高压工频强电磁场对DCS干扰的危害。中控室建筑整体结构上是钢筋混凝上梁柱顶面浇筑及砖砌墙。对DCS也具有良好的抗干扰作用。地面是水磨石上加500mm高立柱架空的抗静电活动地板。防静电接地与PE系统相连。另外,各机柜的型钢基础底座也与PE相连。采用上述措施从总体环境上对DCS的抗干扰性能起了重要的作用。
(三)DCS系统防病毒措施。
首先确保DCS系统前期设计阶段,尽量形成局部独立的控制网络,如果有MIS系统的接入要求,可在接入公司局域网的DCS系统上安装企业版杀毒软件和防火墙软件客户端,确保DCS系统的信息安全,同时禁止插拔USB等移动存储设备,防止病毒通过其他媒体介质侵入。
参考文献
[1].栾元迪等.PLC、DCS及FCS在中小型冶金生产过程控制系统中的应用[J].自动化博览,2002
[2].赵燕平.火电厂分散控制系统检修运行维护手册[M].北京:中国电力出版社,2003
[3].王常力.分布式控制系统的现状与发展[J].电气时代,2004
DCS下载故障分析 篇5
DCS控制系统投产于2006年, 运行已近8年, 该系统为智深公司第一套采用可视化编程组态的系统, 设计上不够完善, 在实际使用过程中也暴露了很多的问题。2009年9月21日17时22分, #10机组汽包水位自动控制信号突然给到最大值, 导致给水泵勺管执行机构开满, 引起汽包水位高停炉, 经检查为控制逻辑中PID调节模块积分饱和引起;2010年1月5日15时51分01秒, #10机组MFT动作, 机组停运, 经检查为#1、#61DPU双机自动切换时出现抢权现象, 导致信号误发, 机组停运;#10、11机组中多次出现DPU脱网, 画面部分测点无法显示等现象, 自检软件对设备脱网无法正常监测;因环境原因, #10、#11机组DCS系统硬件积灰、积粉现象较为严重, 引发DPU故障, 2010年至2011年, #10机组DPU5、DPU6相继出现故障并进行更换。另外#10、#11机组DCS系统DPU控制器为早期产品DPUⅡ型控制器, 目前北京国电智深公司已进行硬件升级, DPUⅡ型控制器不再生产, ACT4型卡件已不生产, 现存备件已使用完, 无备件更换, 系统升级迫在眉睫。
2014年, 大唐保定热电厂#10、#11机组相继进行A级检修, 利用检修机会对#10、#11机组及主机组公用DCS系统进行了升级。为保证整个DCS系统升级后的完整性和兼容性, 升级前把单元机组和公用系统网络分开, 分步对#10机组、公用系统、#11机组进行升级, 待全部升级完成后, 恢复原有网络结构状态, 维持原有监视功能和操作习惯。
1 升级过程介绍
#10机组、公用系统、#11机组DCS网络为三网并联结构, #10、#11机组可通过权限切换对公用系统进行操作, #10、#11机组不能互相操作, 其网络示意图见图1。
1) 第一步升级在2014年5月, 利用#10机组停机, 解除#10机组与公用系统的交换机并联, 首先对#10机组DCS进行全面升级。
因公用系统组态文件工程目录在#10机组工程师站, 而公用系统正在运行, 为了保障在进行#10机组升级过程中及升级完成后不影响公用系统及#11机组系统的运行及安全, 升级前在公用系统新增工程师站/历史站和操作员站, 将公用系统组态文件工程目录拷贝至新增公用系统工程师站, 保证公用系统能正常组态以及历史记录和运行操作、维护。
把新增公用系统工程师/历史站以及操作员站的网线接到公用系统网络交换机上, 同时IP地址设置为公用系统的网络地址, 备份#10机组及公用系统工程师站、历史站以及各操作员站组态软件及工程目录;解除#10机组与公用系统的交换机并联, 使#10机组与公用系统完全处在不同网络下, 相互之间没有连接或网络关系;#10机组独立处于一个网络, 公用系统与#11机组处在一个网络, 且不在同一个域, #11机组可以监视操作公用系统;网络示意图见图2。
对#10机组进行全面升级, 包括DPU软件升级和操作系统软件升级, 且不对公用系统或#11机组产生任何影响。
2) 第二步升级在#10机DCS升级完成后进行, 对公用DCS系统进行升级。因公用DCS系统正在运行, 需要对公用系统DPU内DO输出点进行检查, 如DO点状态为1, 则利用短路线将DO继电器出口短接, 然后拔掉所有DO卡件至继电器板的电缆插头, 防止升级过程中造成DO指令误发。尤其是#10、#11循环水系统均处于公用DCS系统内, 升级出现问题可能造成#11机组停运。升级时由运行人员就地监视, 一旦出现问题进行就地抢合。
断开公用DCS系统网络和#11机组网络的接口, 使公用DCS网络完全独立。利用新增的临时公用系统工程站对公用系统DPU软件进行升级, 将#41、#101DPU控制器更换为DPUⅢ。软件升级完成后, 检查DO输出指令状态与升级前是否一致, 确认无误后恢复DO卡件至继电器板的电缆插头连接, 断开DO点状态为1的短路线。此时仅新增的临时工程师站和操作员站可对公用系统进行监视操作。网络示意图见图3。
3) 前两步升级完成后, 进行#10机组与公用系统DCS网络连接的工作, 检查#10机组和公用系统DPU运行正常, 各MMI站操作监视功能正确, 具备网络并联条件。断开公用系统新增的临时工控机网络接口。连接#10机组与公用系统DCS网络接口, 恢复#10机组与公用系统并联状态, 独立出#11机组DCS网络。网络示意图见图4。
上述工作完成后, 仅#10机组可对公用系统进行监视操作, #11机组循环水系统设备须在#10机组监视操作, 待#11机组停运检修时, 对#11机组进行升级。
4) 第三步升级在2014年8月#11机组A级检修期间进行, 对#11机组DCS系统进行升级。升级完成后#11机组DCS网络接入#10、公用DCS网络, 恢复三网并联结构。
2 升级改造后出现的异常现象及分析处理
1) #10机组和公用DCS系统完成升级后发现#10机组#12DPU控制器D6卡件显示参数不变化, 无法正常显示就地设备状态。D6卡件为通讯专用COM卡, 就地设有直流系统传输装置, 装置将批量参数打包按照相关协议以通讯方式送至COM卡, COM卡经过转换解码提取数据供DPU读取, 做显示或报警处理, 主要有直流系统电压、电流、对地电阻等相关参数。
通过查询历史趋势, 自#10机组DCS系统软件版本从1.0升级至1.31版本后, COM卡显示数据就不再变化, 模拟量输入信号趋势为一条直线, 数字量输入也保持为升级前状态, 但卡件电源和通讯指示灯、DCS自检均未见异常;检查COM卡配置文件, 发现COM2端口参数设置为“9600 N815W2”, 端口中的参数“W”与I/O硬件说明不符 (说明中只能为M或S, 即主站或从站) 通过与机组其他COM卡进行比较确认, #12DPU控制器所用COM卡为专门订制卡件, 硬件经过特殊处理。
咨询DCS系统和直流系统厂家技术人员后得知, 原直流系统传输协议为许继协议, 非标准modbus通讯协议, DCS系统升级至1.31版本后, COM卡不再兼容除modbus以外的非标准协议, 需将许继通讯协议经转换装置转换为标准modbus协议后进行通讯。增加协议转换装置, 将#12DPU控制器COM卡通讯电缆接至协议转换装置, 转换为标准modbus协议, 输出信号送至COM卡。将原#12DPU控制器专门订制COM卡更换为通用COM卡, 重新设置通讯参数, 填写任务列表并做好文件备份, 参数显示正常。
#11机组DCS系统软件升级后也存在同样的问题, 按照上述方法一并解决。
2) DCS系统整体升级完成后进行网络连接过程中, 将公用DCS系统交换机A网网线连接到总交换机A网端口时, 发现#10机组部分测点与公用DCS系统测点均显示离线状态, 203、204操作员站无法操作设备。将网线拔出后, 重启203、204操作员站操作显示均恢复正常。再次插入公用DCS交换机网线, 又出现同样故障。为避免故障扩大, 暂时未恢复网络, 保持三网独立的结构。
经过对#10、#11、公用DCS网络结构的分析, 认为A网总交换机存在故障。#11机组A网并入总交换机A网时, 因实时数据量较大且交换机端口故障, 造成通信阻塞。更换A网总交换机, 未出现异常。A网运行正常后, 将#11机组B网并入总交换机B网, 并网过程中无异常, 进一步证明了A网总交换机端口故障。
A网总交换机为2008年更换, 在此次升级过程中出现了故障, 是由于设备使用周期较长老化造成。由于机组DCS设备已经服役多年, 在条件允许的情况下, 应逐步更换DPU和人机接口设备, 保证DCS系统性能满足要求。
3 结束语
DCS控制系统是机组控制的核心部件, 在对系统进行升级改造时, 应严格按照《DLT659-2006火力发电厂分散控制系统验收测试规程》要求, 对系统进行各项试验, 检查网络系统通信负荷率符合如下要求:所有控制站的中央处理单元恶劣工况下的负荷率均不得超过60%。操作员站、服务站的中央处理单元恶劣工况下的负荷率不得超过40%。数据通信总线的负荷率, 以太网应不大于20%, 其他网络应不大于40%。
加强DCS系统维护工程师培训, 采用规范的方法进行日常检查和维护:对系统软件按时进行备份, 严格执行《DCS系统防病毒管理规定》;做好系统应用软件管理, 严格根据要求进行系统安装, 不得随意安装未经DCS厂家授权的第三方软件;做好DPU控制器、卡件的备件管理, 发生故障时及时进行更换。
DCS控制技术发展日新月异, 现在形势要求我们需要不断对控制系统进行升级或盖章才能满足现场设备需求, 但由于维护人员对新技术掌握需要一定时间, 新技术应用也需要经过时间来验证, 设备升级改造会对DCS控制系统带来或多或少的影响, 只有不断学习, 掌握新技术, 才能将新技术的优势完全体现出来。
摘要:随着现代控制技术的逐步发展, 火力发电厂DCS系统控制也在不断更新, 一些旧DCS系统由于硬件老化, 需要进行软硬件升级改造。本文介绍了大唐保定热电厂#10、#11机组DCS升级改造工作及过程中出现的问题和处理方法, 希望为其他DCS控制系统改造提供参考。
DCS下载故障分析 篇6
1 DCS数据通讯系统
科远股份NT6000分散控制系统 (DCS) 采用高起点的设计标准, 集过程控制和企业管理信息技术为一体, 融合了当今最先进的计算机与通讯技术, 由监控软件 (GraphyX) 、控制网络 (E-NET) 、分散处理单元 (DPU) 、I/O网络 (E-BUS) 和IO模件等部分组成, 具有可靠性、开放性、可扩展性、兼容性和即插即用等特性。NT6000系统还带有报警软件 (AlarmX) 、报表软件 (ReportX) 、趋势图 (TrendX) 、网络服务软件 (Ftpserver) 、组态软件 (ControlX) 、实时数据OPC、仿真软件等多种软件功能于一身, 形成了强大的软硬件体系。如图1所示:DCS上层有工程师站、操作站、历史站, 它们可以通过接口机访问Internet, 与它们相关的组态称之为上位机组态 (界面组态) 。同时, 下层有控制器 (DPU) 、IO卡件等, 对DPU的组态称之为下位机组态 (I O组态、设备组态、逻辑组态等) 。科远公司的DPU采用冗余结构, eNet (冗余) 网络实现工控机与D P U之间的通讯, 每个DPU有不同的IP, 并且各有两个网段, 可实现备用。不同的DPU之间通过交换机相连, 交换机也可以连接多台工控机。每对DPU可带3个机柜, 每个机柜最多4个分支, 每个分支最多8块卡件, 每块卡件有4~16个点, 所以每对DPU最多可带1500多个点。卡件之间不做冗余。DPU与IO卡件之间通过eBus (冗余) 相连。
2 DCS数据通讯故障分析与处理
2.1 地址标志故障
就地组件和总线接口的地址标识出现错误后整个通讯网络会乱作一团。例如程序下载更新失误使地址标志出现紊乱情况, 数据无法寻址产生垃圾堵塞造成停机事故。另外, 人为的错误地址标识改动也会出现数据的丢包等情况, 造成严重后果。
解决措施:组件的修改工作前必须提前停运系统, 及时刷新组态数据, 进行网络发布更新。严格控制人为修改规范, 需做到修改的负责到位, 任何修改必须得到批准和监督, 在确保无误的情况下实行。
2.2 现场总线故障
现场总线的材料一般为双绞线, 其所连设备是工控过程一线设备, 即与工业产生最紧密、最直接联系, 处在生产过程的现场, 所以称现场总线。既然处在工业生产现场, 很显然其工作环境较差, 因而受到各种负面因素的干扰较大, 包括各种生产过程中的直接或间接接触, 有形无形接触, 例如机械碰撞、电磁场干扰、人为检修等等, 加之总线本身接触不良等问题, 故障率较高。
解决措施:采用双路冗余设置, 添加一对通讯线到接口, 使系统整体更为可靠、传输数据更为稳定。现场总线与设备的连接处往往是最薄弱环节, 对此一定要确保连接可靠, 在拆装作业时, 要确保总线的正常稳态运作, 总线分支安装可靠且不可机械触碰。
2.3 节点总线故障
节点总线的材料通常是同轴电缆, 中断任何一处, 总线上所有设备的通信全部断开, 数据丢失, 操作停止, 设备停机, 造成很严重的产生事故, 甚至会带来很大的经济损失。频繁的同轴电缆插拔造成接触松动, 导致接触不良信号传输中断。接触电阻过大也会影响数据通信, 造成信号传输巨大误差。
解决措施:采用双路冗余设置, 不过电缆连接位于模件后部, 确保同轴电缆无机械触碰干扰。严禁多次插拔现象, 除非进行检修等必要情况。严格控制接触电阻值, 及时更新。同时制定相应的安全措施与检修规范。
3 结语
DCS数据通讯系统具有高实时性、稳定性、可靠性、确定性、负荷稳定性等优点在工业控制特别是大型电厂自控领域应用广泛。本文就DCS数据通讯常见故障包括地址标识故障、现场总线故障、节点总线故障进行深入分析, 并给出相应的解决措施, 对DCS数据通讯系统的设置有很好的指导意义。
参考文献
[1]熊国庆.DCS系统通讯故障的检查[J].中国仪器仪表, 2002 (Z1) :47-48.
[2]王永新.贵溪电厂DCS数据通讯故障的分析与研究[J].自动化技术与应用, 2008, 27 (11) :118-120.
DCS下载故障分析 篇7
1 Pt100温度传感器原理与接线方式①
Pt100是一种用白金做成的稳定性和线性良好的铂丝热电阻温度传感器。Pt100是把温度变化转换为电阻值变化的一次元件,电阻信号通过引线传递到温度变送器,再将电阻值转换成温度值,从而实现在DCS系统或其他一次仪表上的温度测量与显示。
Pt100和温度变送器之间有3种接线方式:二线制、三线制、四线制。
二线制Pt100的阻值Rt为:
由于连接导线的电阻RL1、RL2无法测得,因而两个阻值被计入到Pt100的电阻值中,使测量结果产生附加误差。如果100℃时Pt100的热电阻率为0.379Ω/℃,这时若导线的电阻值为2Ω,则引起的测量误差为5.3℃。
三线制是实际应用中最常见的一种接线方式。三线制要求三根导线的材料、线径、长度一致且工作温度相同,三根导线的电阻值也要求相同,即RL1=RL2=RL3。三线制Pt100的阻值Rt'为:
由此可得,三线制接线方式与二线制相比,可通过增加一根导线来补偿连接导线电阻引起的测量误差。
四线制是Pt100测温的理想接线方式,但由于其接线成本较高,中国石油玉门油田分公司炼化总厂没有采用。
综上所述,二线制测量结果包含了线电阻;三线制和四线制测量结果不包含线电阻,两者的区别在于三线制对线路电阻采用的是补偿法。在实际应用中,应取用相同线材和相同长度的导线,并注意减小接触电阻,否则三线制同样会受到线路电阻和接触电阻的影响。
2 影响Pt100测量结果的因素
笔者从实际维护工作中总结出的造成Pt100测量误差的影响因素主要有以下5个方面:
a.在DCS过程控制现场中,中国石油玉门油田分公司炼化总厂通过在各Pt100其中的一根引线上直接并接第3根引线,完成两线制到三线制的改造,没有严格按照三线制的标准接法接线;
b.接线端子被氧化腐蚀或油污污染,导致接触不良进而引起接触电阻太大;
c.引线太细或太长造成引线电阻太大;
d.分度号不匹配;
e.温度变送器出现故障,导致数据转换误差过大。
3 Pt100故障的快速分析和处理
笔者以中国石油玉门油田分公司炼化总厂酸性水装置瓦斯站1#压缩机油箱温度检测回路TT_103/TT_104误差过大且相互干扰故障处理案例来详细分析Pt100故障的分析与处理方法。
现场运行发现,酸性水装置瓦斯站1#压缩机油箱温度检测回路TT_104的现场实际温度为20℃,而瓦斯站压缩机DCS画面中TT_104显示52℃,误差32℃。针对这一现象,对TT_104回路做了以下检测和排查。
首先,检查DCS机柜间1#压缩机油箱温度检测回路TT_104各个端子的接线状况。从DCS画面调出TT_104的点信息,确定回路TT_104在DCS硬件系统接线中的位置(10站-39设备-第2通道);从设备接线位置确定TT_104至温度变送器的接线位置。温度变送器MTL5074的接线原理如图1所示。温度变送器MTL5074输入端子1、3、4是热电阻三线制接线,输出端子11、12输出4~20m A信号,端子13、14为温度变送器MTL5074供电(24V(DC))。温度变送器MTL5074的检查过程:先拆开端子11、12连线,在上面逐次发送4、12、20m A信号,观察DCS瓦斯站压缩机画面中TT_104显示是否吻合量程的0%、50%、100%,进而确定温度变送器MTL5074输出端到DCS的线路有无问题。
其次,判断温度变送器MTL5074的好坏。从图1中可以看出,TT_104回路的温度传感器Pt100是三线制接线形式。其测试方法为:使用100Ω的电阻来模拟Pt100在0℃时的阻值,将它接入传感器输入端,看是否显示000,即可确定温度变送器MTL5074的好坏。
然后,判断Pt100的好坏。Pt100三线制热电阻在0℃时对应100Ω,每上升(下降)1℃其阻值上升(下降)0.385Ω。用万用表测量阻值后对照Pt100温度传感器分度表查找该电阻值下的温度,并与现场实测温度对比即可判断Pt100的好坏。
最后,查找外围信号电缆。通过对DCS过程控制现场设备上Pt100的检查,发现Pt100是由两根引线的元件改接成三线制的,即第3根线是后续才接上的电缆;打开外围信号电缆穿管盖头,发现其中有段信号电缆接头已经充满油污且腐蚀严重,同时还发现这段电缆与回路TT_103的第3根信号电缆接混了。更换信号电缆,改正TT_103、TT_104线缆错误,恢复全部接线后,DCS瓦斯站压缩机画面1#压缩机温度测量回路TT_103、TT_104数值显示与现场完全吻合,准确无误,故障处理完毕。
需要注意的是,DCS过程控制现场处理故障安全防范措施。现场作业前首先必须办理作业许可证;大机组作业要检查是否具有联锁保护功能,如酸性水装置瓦斯站1#压缩机油箱温度检测回路TT_103/TT_104直接参与机组联锁保护,因此作业前一定要告知生产装置并且申请办理联锁解除票;在瓦斯站压缩机房排查故障要使用防爆工具;故障修复后要恢复所有电气防爆密封。
4 结束语
DCS下载故障分析 篇8
1 DCS控制系统概述
为了对DCS控制系统进行分析,我们这里先引用某火电厂机组的DCS控制系统来进行系统的概述说明。该电厂一期机组的DCS控制系统总共分为三大系统版块,分别是#3机组DCS系统、#4机组DCS系统以及公用DCS系统。而整个DCS控制系统覆盖了一些常规的系统,包括ECS系统、SCS系统、MCS系统、FSSS系统和DAS系统等。对于一些具有较强专业性的系统和设备,例如ETS系统、MEH系统、DEH系统、TSI系统、小机TSI系统以及火检控制柜等,这些则是由主机的制造厂商进行配备,并且通过可靠的通讯接口和DCS控制系统进行连接。
火电厂分别对每台机组设置了五台POC(操作员工作站)、一台EWS(工程师工作站)、一台HIST(历史工作站)、一台DAS(数据采集与处理系统,并将操作员工作站、工程师工作站、历史工作站以及数据采集与处理系统接入以太网,而且历史工作站也可以实现在线监控的功能。对于SCS系统、MCS系统、MEH系统、FSSS系统以及ECS系统,都按顺序依次挂在DCS的控制级网上,以作为DCS控制系统的网络站点,而公用DCS系统则是利用网络耦合器和两台机组的DCS网络进行连接。DCS控制系统的控制级通讯网络采用的是双冗余环状管线网络,即是外网为顺时针,而内网为逆时针。这种网络的优势在于当某个站点出现故障的时候,也不会影响其他各个站点的数据传输,而对于一些极端的故障情况,例如局部两条通讯线路都出现故障的情况下,其他各个站点依然可以正常进行数据的传输,而且还具有故障及时报警和消除故障之后可以自行恢复网络等优势。
2 火电厂DCS控制系统故障应急处理
对于火电厂DCS控制系统故障的应急处理原则是当系统出现异常的时候,应该马上通知检修维护人员到现场进行处理,并向各级的领导进行汇报。系统出现故障时,机组运行人员应该保持冷静沉着,根据情况判断系统故障的类型以及范围,并认真查看机组监控的影响程度之后在进行相应的处理,在机组暂时运行情况稳定,但是无法控制的时候,应该先保持其稳定,并马上通知检修人员来进行故障的处理,而处理短时间内如果故障仍无法解决,则应该马上停止机组的运行。而如果机组运行情况不稳定,而且也没有办法控制的时候,应该马上停止机组的运行,再联系检修人员进行故障处理。
在进行应急处理的时候,应该注意保证工作人员和检修人员的人身安全,并保持畅通的通讯。如果系统是因为电源问题引发的故障,机组运行人员不能随便恢复系统电源,以防止事故扩大化,而应该交由专业检修人员进行系统内部电源的操作。
2.1 对操作员站故障的应急处理
(1)当某个或者几个操作员站的显示器出现黑屏的时候,如果其他的操作员站正常,则可以正常监控机组运行,并通知检修人员进行故障处理。如果操作员站都无法进行机组的正常监控和安全操作,则可以紧急利用工程师操作站进行机组的监控,并通知检修人员进行操作员站的故障处理,而在故障恢复期间尽量避免机组的重大操作。
(2)当电厂所有的操作员站都出现故障的时候,如果电源正常的话,可以尝试逐台热启,以观察其可不可以恢复正常,同时通知检修人员来进行处理。而如果是因为电源原因而导致所有操作员站都出现故障,则可以紧急使用工程师室内操作员站来进行机组的监控,而如果工程师室内操作员站和集控室等所有的操作员站都出现故障,而且在短时间里不能解决的话,则要马上停止机组的运行。
2.2 对通讯网络故障的应急处理
在DCS系统通讯网络出现故障的时候,如果数据无法刷新,即是死机情况,则应该马上向上级汇报,并按照全部操作员站出现死机的情况来处理;对于SCS系统通讯网络发生的故障,则要马上通知系统检修人员进行处理,并进行故障的回报,同时,机组运行人员还要加强对机组的监控,并维持机组的稳定运行,如果不能维持的时候,则要马上停止机组的运行,对于MCS通讯网络出现故障的应急处理和SCS系统的基本相同;而对于FSSS系统的网络故障,应该马上停止机组运行,并进行故障汇报,如果手动MFT按钮不能解决故障,则要停止燃油系统的运行并停止给煤,同时安排人员进行检查。
3 火电厂DCS控制系统故障预防措施
火电厂机组运行人员要充分掌握并熟悉DCS控制系统的结构和各设备的功能,并熟悉系统电源回路的设计方式以及运行方式。定期对系统的网络和设备状况进行检查,如果发现问题的话要及时汇报,并且同时检修人员进行处理。对于系统的维护检修人员来说,要加强DCS控制系统的监控和检查力度,如果发现网络、CPU以及电源等存在故障的时候要及时通知机组运行人员,并采取相应的故障解决对策。同时还要做DCS控制系统软件以及一些应用软件的规范管理,并建立软件更新升级和修改的审批授权和责任人制度,在对软件进行更新、修改或者升级之前,应该做好软件的备份,对于没有经过测试和确认的软件不能在DCS系统中使用,并避免在系统中使用光盘和软盘等不确定的一些介质,以避免系统被病毒感染。同时,还要严格遵守相应的管理规定,并建立系统病毒方法措施,禁止个人便携式电脑和DCS网络进行连接。另外,系统检修维护人员应该注意加强和机组运行人员的沟通,并防止非机组运行人员干预机组的安全运行。
4 结语
当前,我国火电厂DCS控制系统日渐趋于成熟,而且不断向智能化和自动化发展,系统的可靠性和安全性也在不断的提高,这些都是非常积极的。但是,就一般情况来说,任何系统都会存在着一些不可避免的故障,而从客观上来讲,事故和故障之间并不存在必然的关系,但却有着紧密的联系。因此,对于火电厂DCS控制系统的故障必须要采取相应的防范措施,要事先预防故障,尽早发现故障并及时处理故障,这样才可以有效地解决火电厂DCS控制系统的故障,并避免故障的扩大化和事故化。而这就要求火电厂的工作和检修维护人员要加强对DCS控制系统理论的学习,并要努力掌握系统的一些工作原理,以及系统相关设备的一些特性等。另一方面,火电厂的管理人员还应该制定相应的故障应急预案,并进行元的演练,为日后出现系统故障时可以及时正确的做出处理判断。在本文里,我们对火电厂DCS控制系统常见故障的应急处理以及相应的预防措施进行了介绍,而实际工作中还需要相应的工作人员努力去发现并总结经验,只有这样才能更好的处理好电厂DCS控制系统的故障,从而保证火电厂安全可靠的运行。
参考文献
[1]王炳华.《防止电力生产重大事故的二十五项重点要求》辅导教材[M].北京:中国电力出版社,2001.
[2]肖大雏.国产600MW超临界火力发电机组控制设备及系统[M].北京:中国电力出版社,2006.
[3]孙长生,朱北恒,尹峰,等.火电厂热控系统可靠性配置与事故预控[M].北京:中国电力出版社,2010.
[4]孙长生,朱北恒,王建强,等.提高电厂热控系统可靠性技术研究[J].中国电力,2009.