实用算法

2024-07-26

实用算法（通用5篇）

实用算法篇1

1 广播电视信号的传输环节及其被非法插播可能性分析

1.1信号传输拓扑示意图

广播电视信号制作好以后, 通过各种媒介传输到覆盖设备的前端, 进行编码调制后送达最终受众的终端。覆盖方式主要包含无线覆盖 (发射机房) 、有线覆盖 (有线电视网络) 、互联网覆盖 (网络数字媒体) 、卫星覆盖等, 示意图如下:

一般来说作为覆盖设备的机房, 其信号源都需要有来自不同路由的主、备路, 如图中所示。主、备路由有各种不同的组合, 如双光纤 (路由不同) , 或一路光纤、一路微波, 也有些机房还会使用接收自卫星的信号作为备用信号源, 如图中的“发射机房”。

1.2 非法信号入侵的途径

如图1所示, 以“发射机房”为例。由于传输路途可能很遥远, 实际上每一种传输路径都有可能被插播。光纤可能被窃听, 获取传输格式, 然后切断插入非法信号;微波传输, 在靠近的地点使用大功率非法信号波束照射接收天线, 可能压制合法信号;卫星接收的信号源, 当卫星被非法信号攻击时, 也可能被非法插播。

虽然实现上述插播方式有一定难度, 遭遇到的可能性不高, 但安全播出的要求很高, 还是需要对一切可能的安全播出隐患做出防范对策。

2 防非法插播的技术策略和关键算法

2.1 技术策略分析选择

如果直接对信号源的内容意义进行分析, 判断其内容是否符合政策和宣传要求, 那么按现有的计算机软件软件技术而言, 不仅难度非常高, 而且准确率和实时性也很难满足要求。但是考虑到实际上信号源有多路的情况下, 我们可以用更简单的办法来判断是否有哪路信号路径被插播。那就是把同一节目的来自不同路由的信号源拿来进行内容比对, 如果所有路由的信号内容全部相同, 那么说明信号是安全的;否则, 说明其中必有一路信号被非法插播, 这时就要马上输出报警信息, 等待人工对信号内容进行识别判断。如果信号源路由超过2路, 也可以先把内容与众不同的那一路排除出去, 从内容相同的信号源中选一路输出去播出, 然后再报警请求人工监听的最后裁决。

使用内容比对的方法, 我们不需要对信号内容的意义做出判断, 只需要对不同信号源的内容是否一致做出判断即可, 这样对技术上的要求就降低到了可行的程度。

2.2 音频信号内容比对的依据

可用的技术手段, 无非是用于音频信号处理的电路硬件和对采样数据进行分析的软件。关键在于对信号源内容是否一致的特征提取。如果对某路音频信号源的信号波形用示波器进行观察, 可以发现每当播音员讲话或播放音乐时, 示波器上都会出现相应的波包, 而当出现节目间隙、语言语句之间的间隙、音乐之间的间隙的时候, 示波器上的波形就近乎一条直线 (幅度近乎零) 。如图2～图5所示:

我们可以把语音节目的内容, 看成是由各种不同时间长度和幅度变化规律的波包, 以及各种不同时间长度的间隙组成的信息系列。这种系列与节目内容一一对应, 相同的节目内容必有完全相同的系列, 而不同的系列则意味着不同的节目内容。图2展示了两路内容相同、没有时延差的语言信号的信息系列, 图3是内容不同的信息系列。

因此, 我们就把对内容的判断转化成对音频信息系列的比对判断, 如果信息系列完全相同则内容相同, 否则内容不同。从图2～图5可以看出来, 只要比对的信号中有一路是纯语言类, 内容相同与否其特征非常明显;音乐 (或带音乐背景) 类信号之间, 以及与准白噪声之间的波包特征差别较小甚至难于分辨。

2.3 具体电路和关键算法

来自不同路由的音频信号可能存在时间延迟, 即不同步的问题。因此在进行信号比对之前必须先把两路信号的时间点“拉”齐, 一般是把先到达的信号延时然后与后到达的信号对齐在同一时间点。假设最大可能的信号时间延迟为5秒, 用于信号比对的时长为3秒, 下面讨论不同处理算法的资源开销。

2.3.1 直接对音频信号高速采样的比对方案

直接的音频信号采样, 为了不漏掉任何一个信号上升下降细节, 采样率最好是最高信号频率分量的十倍以上。调频立体声的音频信号最高频率达15 KHz, 采样率需要达到150 KB/S。因为比对前不知道两路信号哪一路的延时更多, 所以实际需要截取的信号时长是比对时长与最大信号延时时长之和, 即8秒。每一路信号8 s时长的采样数据个数为8*150K=1200K。为了得到信号比对的结果, 需要对每一路信号的采样数据逐个后移, 取其后3 s的数据与另一路信号的前3 s数据进行逐个比对, 因此最大的比对次数为2*5*150K*3*150K=6.75*1011次, 而每次比对都需要取数、运算、比较判断、统计存储等操作, 最少也需要10个指令周期, 就算都是单时钟周期指令, 总共也需要6.75*1012个时钟周期, 这一切需要在3秒内完成, 所以每秒需要最少2.25*1012个时钟, 即时钟频率要达到2250GHz。这还只是进行两路信号的比对运算量, 如果要求更多路信号的比对, 运算量还要大得多。这样的运算速度对于单核的芯片是很难完成的, 需要多核的高速芯片并行计算才可能实现。因此这种方案成本太高, 现实可行性差。

2.3.2 先对信号进行包络检波, 再低速采样的比对方案

如果先对音频信号进行幅度变化的包络检波——简单的预处理, 那么虽然我们失去了波形的瞬间 (毫秒级) 幅度变化细节, 但是还是可以保留语句、音乐等间隙和幅度变化的整体趋势等最重要的特征信息, 而这些信息对内容比对来说就已经足够了, 这样做的结果就是可以极大降低比对所需要的运算速度。下面以图6的预处理电路参数为例说明:

上图中的检波电路可以消除检波二极管死区电压的影响, 即使只有几十毫伏的音频信号也能得到正常的包络输出。包络跟踪的R1C1=47 ms, 因此采样周期可以取5 ms, 即采样速率200 B/S。对于时长3 s、最大可能延时量5 s的两路音频数据进行完整比对所需要的最大比对次数为2*5*200*3*200=1.2*106次, 需要的总时钟周期数为1.2*107, 如果运算时间最长为3 s, 则时钟频率要求为最小4MHz。这样的运算速度要求还不到上一方案的百万分之一, 使用价格便宜的51系列单片机就可以实现了。当然, 使用运算速度更快的芯片或DSP可以获得更快的反应速度, 实时性更令人满意。

2.3.3 采样数据的比对处理和判断基准

在两路音频信号之间进行采样数据比对, 还要考虑信号本身的幅度问题。内容相同的信号幅度不一定相同, 但对采样数据进行比对时, 其比例应该是相同的, 这一比例值可以取一段时间长度 (例如8 s) 中两路信号最大采样值之比为“比例参考值”。

对于语言类信号, 使用图6的信号预处理电路, 如果对一段时间长度3秒的采样数据进行逐一比对, 大量的实验表明:1) 如果内容相同, 则采样数据值之比与“比例参考值”误差10%以内的比对结果 (简称“比例一致性”) 个数, 可以占总比对个数的80%以上。这个结论在反复的实验中至少有99%的准确性。2) 如果内容不同, 则“比例一致性”个数, 占总比对个数的50%以下。这个结论在反复的实验中至少有95%的准确性。3) 如果把“比例一致性”的个数是否占总比对个数65%以上, 作为语言类节目内容是否相同的判断基准, 则准确率可达99%以上。4) 对报警实时性放宽要求, 可以极大降低误报率。每增加一次 (3秒) 比对内容不一致的累积才报警, 误报率可以降低100倍。

以上算法的准确性主要受信号的信噪比影响。信噪比20 dB以下的时候, 当信号幅度小的瞬间噪声电平的影响比率增大很多, 影响了其判断的准确度。为了修正这种影响, 可以适当调整“比例一致性”的标准, 例如当采样值为最大值的十分之一以下时, 改用与“比例参考值”误差30%以内作为“比例一致性”的参考标准。

2.3.4 音乐节目信号之间内容比对的优化方法

从图4看到, 音乐节目或含有音乐背景的节目, 其波包的特征比较不明显, 以上述算法去判断准确率是比较低的。因为音乐信号由各种不同的乐器组合而成, 不同乐器其频谱是不同的, 所以可以按频谱对总信号进行分频率段滤波筛选, 分别进行检波采样, 然后再用上述算法判断, 这样做以后准确率依然可以很高。例如可以把300 Hz以下的为一段 (分出鼓类乐器) , 500 Hz～2 000Hz为一段 (中音乐器) , 3 000 Hz以上为一段 (高音乐器) 。分得越细准确度越高, 但是计算量越大, 要求的芯片处理速度越高。

2.3.5 准白噪声信号的识别

某些情况下, 当节目信号丢失时, 信道完全由噪声占据, 表现为幅度连续的宽频谱的“沙沙”声, 这里称之为“准白噪声”。“准白噪声”与音乐信号在总波形的波包特征上差别不大, 很难直接识别出来。但是, 如果按频谱对总信号进行分段筛选, 分段后的波包特征, 音乐信号与准白噪声信号之间的差别还是很明显的。准白噪声信号无论是总信号波包还是分频段的信号波包, 都显示出很“木”的特征, 即起伏很小而且一直不变, 信息含量很低;而音乐信号在分频段之后, 其波包显得很活跃, 并时刻在随着内容的不同而变化着。根据这些特征可以对某路信号是噪声还是音乐节目作出准确的判断。

3 实用系统的组成与应用

现代化覆盖设备的信号源, 已经有很多是数字音频信号, 这种情况可以从其音频分配器的分配口取出后进行数/模转换, 然后再进行内容比对处理, 判断结果作为报警触发信号或自动切换的依据。如图7所示:

图中, 语言类节目只需要用到“总包络检波”的采样数据。“频率段n”是用带通滤波器实现的, 用于音乐类节目的比对和噪声信号的识别。

该比对系统不仅可以应用于中波和调频广播, 也可以对电视节目的伴音进行比对, 通过对伴音内容一致性的识别来判断电视节目是否被插播, 因为节目的语言被插播其后果远超图像被插播。

笔者叙述的算法属于“模糊算法”范畴, 这种智能性算法的准确度取决于对象特征提取的准确度和精细度。文中的模糊规则基准如“比例一致性”误差范围, “比例一致性”个数的占比等等, 是在大量实际试验中得出来的, 该算法在实际测试中完全达到了预期的准确度, 是可以进行产品化的实用算法。

实用算法篇2

1 光伏电池等效电路及其输出特性方程

理想情况下, 光伏电池在等效电路中可以看作一个恒流源。等效电路中并联一个二极管模拟暗电流的产生, 用一个串联电阻来模拟电池板的损耗, 一个并联电阻来模拟短路电流的产生[2,3]。等效电路如图1, 输出特性方程[2,3]如式 (1) 所示。

图 1 光伏电池等效电路

式中:IL为输出电流 (A) ;q为电荷 (C) ;Io为二极管反向饱和电流 (A) ;K为玻尔兹曼常数, 1.381 0-23J/K;A为二极管品质因数 (介于1 和2 之间) ;Ud为为二极管两端的电压;Rsh为并联电阻 (Ω) ;Rs为串联电阻 (Ω) ;Iph为光生电流 (A) ;UL为输出电压 (V) 。

2 光伏电池工程用数学

2.1 光伏电池工程用数学表达式

光伏电池的生产厂家只会为用户提供标况下 (光强S=1 000 W/m2, 电池温度T=25 ℃) 短路电流Isc, 开路电压Uoc, 峰值电流Im, 峰值电压Um四个电池板测量参数。

由于Rs相对于串联电阻Rs的数值非常大, 忽略式 (1) 中的最后一项和ILRs项[4]。当负载短路的时候, 有短路电流Isc=Iph。基于以上两点, 可以把式 (1) 变为:

为了更加方便地建立数学模型, 在这里构造2 个参数[6]X1, X2。式 (2) 可以转化为:

在最大功率点有UL=Um, 实际情况中有exp (UmX2Uoc) >> 1 , 所以得到:

由式 (4) 可以解得:

令:

式中:Tref=25 ℃;Sref=1 000 W/m2;a, b都是补偿系数, a=0.005 6, b=0.2;T, S, D, d V为中间变量[5,6]。

2.2 光伏电池模型搭建及输出特性仿真

本文所用光伏电池测量参数为:最大功率Pm=120 W, 峰值电压Um=34.5 V, 峰值电流Im=3.48 A, 短路电流Isc=4.09 A, 开路电压Uoc=43.2 V。结合式 (11) 在Matlab/Simulink中搭建模型如图2。

在不同光照和温度下仿真光伏电池的输出特性曲线如图3~图6。仿真结果表明搭建的实用模型可以很好的模拟光伏电池的实际输出特性。通过观察P-V曲线, 发现光伏电池存在唯一的最大功率点。

3 改进电导增量MPPT算法建模仿真

电导增量法是常用的最大功率点跟踪算法, 。采用电导增量法进行最大功率跟踪时并无原理性误差, 是一个比较理想的MPPT跟踪方法[9]。电导增量法中设定的固定步长较大时, 算法跟踪速率较快, 但是有比较大的稳态震荡。设定较小的步长时, 算法跟踪速率较慢, 有比较小的稳态震荡。为了能兼顾跟踪速率快和较小的稳态震荡, 采用变步长的电导增量法。令步长d=A|dp/du|, 当dp/du>0 时, U=U + d;当dp/du<0 时, 有U=U-d[7,8]。根据经验设定参数A=0.000 1。在Matlab环境下搭建梯度电导增量算法模型见图7, 搭建基于boost电路[9,10]的MPPT仿真模型见图8。

仿真参数设定Max step size:0.000 01;slover:ode23;Relative tolerance:1e-4;powergui模块:Simulation type=Discrete , Sample time=50e-6 ;C1=500e-6c ;C2=1 000e-6c;R=40 Ω;L=50e-6 H;IGBT和二极管D取默认参数;仿真时间为0~0.6 s, 阶跃模块实现在0.3 s由S=1 000 W/m2跳变为S=800 W/m2, 光伏电池输出电压及负载功率仿真波形见图9 和图10。结合图9 和图10, 外界环境变化时, 光伏电池输出电压分别稳定在34.5 V和32.5 V附近, 负载功率接近光伏电池的最大功率120 W和96 W。

4 结语

本文在Matlab环境下搭建了光伏电池实用仿真模型, 仿真结果与理论分析相吻合。建立基于改进的电导增量法MPPT仿真模型, 结果表明新算法可以较好地实现最大功率跟踪。

图 10 光伏系统负载功率图

参考文献

[1]于晓燕, 崔爱红.我国太阳能利用的现状、问题与对策[J].科技信息, 2011 (3) :52-53.

[2]王立乔, 孙孝峰.分布式发电系统中的光伏发电技术[M].北京:机械工业出版社, 2010.

[3]赵颖.独立运行光伏发电系统的研究[D].大连:大连理工大学, 2009.

[4]胡德安, 韩新峰, 彭莉萍, 等.基于Matlab/Simulink的光伏模糊最大功率点跟踪控制的研究[J].工业控制计算机, 2013, 26 (5) :39-43.

[5]汤强, 薛太林.基于Matlab/simulink的光伏组件建模仿真[J].通信电源技术, 2011, 28 (1) :38-39.

[6]茆美琴, 余世杰, 苏建徽.带有MPPT功能的光伏阵列Matlab通用仿真模型[J].系统仿真学报, 2005, 17 (5) :1248-1251.

[7]MEI Qiang, SHAN Ming-wei, LIU Li-ying, et al.A novel im-proved variable step size incremental resistance MPPT methodfor PV systems[J].IEEE Transactions on Industrial Electronics, 2011, 58 (6) :2427-2434.

[8]黄舒予, 牟龙华, 石林.自适应变步长MPPT算法[J].电力系统及其自动化学报, 2011, 23 (5) :26-30.

[9]张翔, 王时胜, 余运俊, 等.基于电导增量法MPPT仿真研究[J].科技广场, 2013 (7) :60-64.

实用算法篇3

1 基于支路功率为变量的前推回代法

文献[7]对如图1所示的辐射状配电系统,配电潮流前推回代算法的第m步迭代过程如下。

节点i的前推计算公式为:

式中:(rki,xki)为支路ki的阻抗;PDi为节点i的负荷功率;Ci为与节点i相连的子节点集合;[(PL(m+1)ki),(QL(m+1)ki)]为馈线支路ki上的功率损耗。

回代节点i电压时, 节点k作为节点i的父节点其电压已经在本次迭代中算出,节点i的回代公式为:

式中:为节点k复电压的共轭。

迭代终止判据为: 判断相邻2次迭代电压差的模分量的最大值是否小于给定的收敛指标ε,即:

2 新型合环潮流计算

2.1 利用叠加原理分解合环配电网络

由于前推回代法只适用于辐射型网络, 因此对于合环后的环网,利用叠加原理对前推回代法进行改进在合环点处将环网打开, 对合环开关两侧负荷功率进行修正,如图2所示。

图2(a)中a、b为待闭合合环开关的两侧节点,合环前所带负荷分别为SLa、SLb;图2(b)为合环后示意图,合环开关闭合后由a、b两侧节点电压差所产生的环网功率Sc,相应的电流为Ic。若合环前Ua> Ub,为模拟合环时的状态在节点a添加一个电流源,方向为流出,在节点b添加一电流源,方向为流入,大小均为Ic。图2(c)为合环后等值网络 ,将环网功率Sc分别转移到负荷点a、b上,即a节点负荷为SLa+ Sc,b节点负荷为SLb Sc。若合环前Ua < Ub,则电流源的符号相反。

应用戴维南定律将图2(b)中原辐射型网络等效为一个理想电压源OC和一个串联内阻Zab, 如图3所示。其中电压源OC的值为合环前a和b节点的电压差a-b。a、b可在合环前通过前推回代法进行潮流计算得到。Zab为戴维南等效阻抗。当网络中所有电源电势都为零时,所加的单位电流只流经环路上支路。所以Zab 即为从母线Ⅰ到母线Ⅱ合环线路中所有支路阻抗和。合环后稳态环流Ic为:

配电网合环涉及上级电网, 所以需对上级电网进行等值,Zeq为上级电网等值阻抗, 这样可以求得环网功率Sc,难点是Zab的求取。

2.2 迭代法求上级电网等值阻抗

针对从不同变电所引出2条出线的环网, 配电网合环网络与上级电网之间存在边界节点的特点, 文中利用迭代法求取上级电网等值阻抗Zeq。根据母线Ⅰ、Ⅱ参数,选取电压值高的一侧为平衡母线,可计算出母线Ⅱ处的电压幅值为:

式中:P1为流过母线Ⅰ的有功功率;Q1为无功功率。z = r + jx为根据实际上级电网的特点,设定的虚拟线路单位长度的阻抗;l为虚拟线路长度。设计误差函数Uer则为:

当Uer的绝对值小于指定误差极限时,认为迭代已经收敛; 当Uer> 0时, 则在下一次迭代对l增加步长Δl;当Uer< 0时 ,则在下一次迭代时对l减小步长 Δl。当迭代过程中,Uer的值来回震荡时, 可以根据变步长系数pr将步长Δl缩小,即Δl = Δlpr,继续进行迭代,便可求出l的值,进而可以求出Zeq。

2.3 配电网合环潮流计算步骤

配电网合环潮流计算分两阶段迭代, 第一阶段迭代按式(1—7)计算纯辐射型网络潮流和U觶a、U觶b值,第二阶段迭代以环路功率为变量叠加修正, 按式(11—14修正合环开关两侧节点负荷功率,第m+1次迭代过程如下:

初始化S(0)La,S(0)Lb分别为合环开关两侧节点负荷,为合环稳态电流的共扼值,式(15)为迭代终止判据,即在m+1次迭代时,合环开关两侧节点的电压差小于给定的收敛指标ε'。计算配电网合环潮流的步骤如下。

阶段一:

(1) 读入网络参数,建立节点链接表。

(2) 按式(9)、(10)通过迭代法求得上级电网的等值阻抗Zeq。通过拓扑分析从合环点向上搜索,将合环支路的阻抗与上级电网的等值阻抗Zeq相加而得合环环路的总阻抗。

(3) 按式(1—7)通过前推回代计算纯辐射网络潮流。按式(11)计算断开合环点处开口电压。

(4) 按式(12)求得合环稳态环流。

阶段二:

(1) 按式 (13)、(14)修正合环开关两侧节点负荷功率。

(2) 检查迭代终止判据式 (15),若不满足则转到阶段一中(3)、(4)。

3 算例分析

选取淮安盱眙10 k V配网系统的3个典型的馈线联络开关合环算例进行了计算。在PC机上用VB6.进行了该算法的程序编制。算例中两阶段的收敛判据ε、ε' 都为10-5。算例结果(见表1和表2)表明,准确率较高,满足工程要求。

从表1可以, 看出文中算法计算出的合环馈线电流值与测量值比较接近,但是仍然存在一定的误差,主要有以下几个方面:

k V·A

(1) 由于无法获取上级电网模型, 因此无法准确获得上级电网的阻抗,采用迭代法虽简化了上级电网,但求得的等值阻抗对合环潮流计算存在一定的误差。

(2) 数据采集与监视控制系统遥测量、遥信量的准确程度影响计算精度。

(3) 功率因数无法获得。由于实际运行时,网测的数据有些是电流值,不是P、Q值,需要用电流值和功率因数推倒出P、Q值,而功率因数也非实测值,所以功率因数的准确与否对合环计算的误差有一定影响该方法取功率因数为0.9。

从表2中可以看出,随着迭代次数的增加,合环开关两侧功率修正量的值逐渐减小。在第二阶段迭代到5次左右功率修正量的值几乎接近零。可见文中提出的算法具有很好的收敛性,从而提高了计算速度。

4 结束语

根据实际配网中的特性, 提出的以支路功率为变量的基于叠加原理和前推回代法的两阶段算法, 较好解决了配电网合环潮流计算难度大、误差大的难题,提高了合环潮流计算的准确性,在实际合环操作中,对调度员能否合环操作起到了指导作用, 提高了合环操作的可靠性、安全性,具有一定的理论和工程实用价值。

参考文献

[1]强兴华.地区电网合环操作的潮流近似计算[J].江苏电机工程,2002,21(5):34-35.

[2]车仁飞,李仁俊.一种少环配电网三相潮流计算新方法[J].中国电机工程学报,2003,23(1):74-79.

[3]陈根军,王磊,唐国庆.一种求解环状配电网潮流的有效算法—两阶段法[J].电力系统及其自动化学报,2001,13(5):5-9.

[4]李家睿.复杂配电网网络等效及合解环潮流计算研究[D].上海:上海交通大学硕士论文集,2012.

[5]WILLIS H L.配电系统规划参考手册[M].范明天,等译.北京:中国电力出版社,2013:122-126.

[6]季晓明,成乐详.基于突变理论的配电网规划方案综合评估[J].江苏电机工程,2014,33(5):51-54.

一种实用的金融票据框线去除算法篇4

1 传统的表格框线去除算法简介

1.1 二值图像上的表格框线去除

字线交叠分为三种情况(图1):粘连,相交,重合[1]。粘连时直接抹去框线,不会影响字符的识别。而对相交和重合的情况,则必须做进一步的图像分析。

现有的框线去除算法分成两类:第一类先抹去框线,再根据框线附近字符笔画的局部特性将缺损笔画补齐。如YU B[2]等利用被框线截断的笔画的两个残留游程进行线性内插将断裂部分补齐。刘长松[3]等则通过框线检测时得到的有向单连通链信息,对笔画与框线的相交角度进行分析,在去除框线后再对字符笔画进行相应修整。

第二类算法,对字线交叠处的局部区域做分析,只抹去属于框线的像素,保留属于笔画的像素。如CHUNG Y[4]将交叠区域分成三类:需恢复部分,不恢复部分和无法判断部分。对于需恢复部分做字符修整,不恢复部分作为字符笔画保留,而对无法判断部分,由识别核心判断是否应该去除。文献[5]的算法则是在不提取表格框线的前提下,采用图像分块和连通域分析,实现字线分离。

1.2 灰度图像上的表格框线去除

WANG YANG[6]用像素的邻域灰度均值和方差作为一对参数来描述其邻域特性,邻域特性相似的像素点聚类成一连通域。利用两个相交连通域交汇点处的相关参数对的特征差别来进行字线分离。YE X[7]提出一种基于数学形态学的表格框线去除算法,先提取并去除表格框线,再对字符作形态学修复。张艳[8]等人则采用一种连通链结构描述叠加后的框线区域,然后对交叠进行判断和标记,根据标记保留字符笔划去除框线干扰。

以上框线去除算法,都有其局限性。尤其是对字符笔画与表格框线重合的情况,不能取得满意的去线效果。

2 彩色票据图像表格框线去除

2.1 彩色增透方法的局限性

彩色增透原理:设图像上某像素的红、绿、蓝分量值分别为r、g、b,以红色增透为例。当r>g且r>b时,令p=3×r-g-b,若p>255,则令r=g=b=255;否则令r=g=b=p。

对印刷质量较好且无颜色失真的票据图像,采用彩色增透能有效地去除表格框线,完整的保留待识别字符。但由于印刷不规范及扫描后压缩,常造成彩色票据图像颜色失真。对这样的图像,彩色增透技术就无法有效的去除表格框线,或在去除框线时会导致与框线重叠的字符残缺断裂(图2b),这会导致字符切分与识别错误。

2.2 彩色票据的特点及框线去除整体思路

经分析,彩色票据图像有如下几个特点:

1)票据上打印字符和手写字符为灰黑色,在票据上不同的区域,打印字符的灰度有时会不一致。手写字符与打印字符的灰度区别往往较明显。2)往往有字符打印在框线上(字线交叠),也存在少量打印字符与印章重叠(图2a)。3)在同一条表格线的不同像素行上,颜色的深浅也有不同,但同一像素行颜色的一致性较好。

据此,提出彩色票据表格框线去除算法的整体思路:

1)检测出票据图像上的表格框线。2)寻找票据上的待识别字符区域,包括打印字符和手写字符。3)找出有哪些待识别字符区域与检测出的表格框线相交,并求出字线交叠区域。4)对每个字线交叠区域,结合彩色信息和灰度信息来去除表格框线,完整地保留字符。

本方法的关键:一是正确找出每个待识别字符区域及字线交叠区域,二是在字线交叠区域中去除框线时根据什么原则来保留同时属于框线和笔画的像素。

2.3 表格框线检测

表格框线的检测,采用的是基于“有向单连通链”的自底向上的表格框线检测算法[3]。为避免字线交叠对框线检测的干扰,可先滤除填写域的灰黑色字符。例如票据印刷部分为红色,则只保留偏红色的像素,就能滤去填写域字符。然后在其二值图像上再检测表格框线时,就能排除因字线交叠导致的表格框线漏检,准确而完整地检测出所有表格框线。

2.4 待识别字符区域的搜寻

先对票据图像滤色再二值化,然后通过进行连通域分析来寻找待识别字符区域。具体过程分如下三步:

2.4.1 对整个票据图像进行滤色

设图像上某像素点的红、绿、蓝三颜色分量值分别为r、g、b。若同时满足条件:

或同时满足条件:3×-->1;3

其中:(220≤T1≤255)

则保持该像素三颜色分量值不变,否则将该像素置成白色。滤色处理可能导致字符残缺断裂(图3),为避免此种情况影响到提取完整的字符连通域,将在后面的字符连通域合并时再采取补救措施。

2.4.2 对整个票据图像进行二值化

因字符在票据上占一定比例(大于1%小于20%),我们在这里采取一种取字符平均灰度和背景平均灰度两者平均值作阀值的快速二值化方法。

将滤色后的票据图像灰度化后,去掉25%灰度值最大的像素。对剩下的像素,取1%灰度值最小的像素的灰度平均值作为字符平均灰度,再取25%灰度值最大的像素的灰度平均值作为背景平均灰度,最后取字符平均灰度和背景平均灰度两者的平均值作为二值化阀值。

2.4.3 提取字符连通域并合并邻近的连通域

我们只需得到每个字符连通域的外接矩形(包围盒),因此采用一种改进的种子点生长算法。设(x,y)为字符连通域C上的任意一点,定义连通域C的“外接矩形”为以下四个边界坐标构成的矩形:

对一个种子点,先记录一个长、宽均为零的初始外接矩形,该外接矩形的四条边均通过种子点。由种子点开始向上、下、左、右四个方向生长,若新生长的点超过原来记录的外接矩形的范围,则修正外接矩形的四条边的位置,以保证所有生长出来的点仍然在外接矩形内。当一个字符连通域生长完成后,就得到了它的外接矩形。

得到所有的字符连通域外接矩形后,再将邻近的字符连通域合并到一起。考虑到2.4.1中滤色造成的字符断裂,而票据中的表格框线的宽度一般不超过8个像素,我们将得到的每个字符连通域的外接矩形向四周各扩充4至5个像素,然后合并相交的外接矩形。这样,就将断裂或上下、左右相邻较近的字符连通域合并到了同一个区域里,从而得到若干个相对独立的待识别字符区域,每个区域包含一个或多个字符(图4)。

2.5 表格框线去除

对上面搜寻到的每个待识别字符区域,依次判别该区域是否与检测出的表格框线相交,若相交,求出相应的字线交叠区域(图5)。

字线交叠区域中,每一个像素均位于表格框线上。因此,只需判断哪些像素没有位于字符笔画上,将其滤除,即可去除表格框线,而完整地保留下笔画。下面以红色水平框线为例,采用一种简便快速的基于色差的平均值统计方法来去除表格框线。

对于一个字线交叠区域,考虑到表格线上同一像素行颜色一致性较好的特点,我们以像素行为单位来进行处理。先统计出该行内所有像素的红色分量的平均值Aver Red及灰度平均值Aver Gray,然后再依次检查每个像素,设像素的红色分量值为r,灰度值为p,若有:p<Aver Gray并且r+T2<Aver Re d(T2为经验阀值),则认为该象素位于红色表格框线与字符笔画的交叠处,将该象素的红色分量值置为绿色分量与蓝色分量的平均值。对不满足上述条件的像素,则将其置为白色。这样,在去除表格框线的同时,就能将字符与表格框线相重叠的象素全部保留下来。

2.6 去除印章干扰

若一个待识别字符区域中还存在着红色印章,则统计其中所有红色像素的红色分量平均值Aver Red及灰度平均值AverGray。对每个红色像素,若其红色分量值小于Aver Red且灰度值小于Aver Gray,则保留该像素,否则将其置成白色。这样,就得到了去除表格框线和印章后的票据图像(图6b)。

3 实验结果分析

选择了400张待识别字符与表格框线重叠的彩色银行票据作测试样本,其中162张有待识字符和印章重叠。下面列出了用几种不同的方法对这些票据图像去除框线后再进行识别的结果。其中二值图像上的去线算法采用的是文献[3]中的算法。因目前的识别核心仍是基于二值图像的,因此送入识别核心的图像,为去线后再二值化或二值化后再去线的图像。若一张票据的所有待识别字符区域都识别成功,称为整张识别通过。

从表1可以看出,对存在字线交叠和字印交叠的票据,不去线直接二值化后进行识别,则整张识别通过率极低。彩色增透去线再二值化后进行识别,也无法达到实用要求,且其整张识别通过率比二值图像上去线后再识别的还低,这是因为彩色增透对颜色失真的票据图像无法取得好的效果。用本方法去线后并二值化,再进行识别时,整张识别通过率有明显提高。

4 结束语

本文提出了一种基于色差的彩色票据图像表格框线去除算法,根据检测到的表格框线和搜索到的待识别字符区域找出所有字线交叠区域,然后对找到的每个字线交叠区域依次进行去线处理。通过在局部区域上利用彩色和灰度信息对图像进行分析,本方法能有效地去除表格框线的干扰,是一种更能满足实用需求的方法。

摘要：字线交叠严重干扰对字符的切分与识别。基于二值图像的表格框线去除算法,只能在一定程度上排除表格框线对字符识别的干扰。随着计算机运算速度和存储容量的迅速提高,表格识别系统的扫描输入图像开始采用灰度图像和彩色图像。该文提出了一种基于彩色图像的表格框线去除算法,由于利用了图像中的彩色和灰度信息,能更好地排除表格框线对字符识别的干扰。该方法目前已成功地应用于银行票据识别系统中。

关键词：字符识别,金融票据,框线去除,色差

参考文献

[1]Satoshi N,Yabuki M,Asakawa A,et al.Global interpolationin the segmentation of handwritten characters overlapping aborder[J].IEICE transactions on Information and Systems,1995,78(7):909-916.

[2]Yu B,Jain A K.A generic system for form dropout[J].IEEETransactions on Pattern Analysis and Machine Intelligence,1996,18(11):1127-1134.

[3]刘长松,潘世言,郑冶枫,等.一种表格框线检测和字线分离算法[J].电子与信息学报,2002,24(9):1190-1196.

[4]Chung Y,Lee K,Paik J,et al.Extraction and Restoration ofDigits Touching or Overlapping Lines[J].Journal of MolecularBiology,1996,3(4):541-552.

[5]刘为,平西建,郭戈.基于字线分离的表格识别预处理算法[J].计算机工程与设计.2008,(19):5066-5068.

[6]Wang Y,Bhattacharya P.On parameter-dependent connectedcomponents of gray images[J].Pattern Recognition,1996,29(8):1359-1368.

[7]Ye X,Cheriet M,Suen C Y,et al.Extraction Of BankcheckItems By Mathematical Morphology[J].Document Analysis&Recognition,2004,2(2-3):53-66.

实用算法篇5

电力系统发输电设备检修计划是电力系统规划与运行的重要组成部分,设备的检修停运会对系统的可靠性和经济性产生重要影响[1]。随着电网的不断扩大和电力市场化的发展,制定合理的发输电设备检修计划已成为一个急需解决的问题[2]。

传统的发输电检修计划将机组和线路检修分开制定。其中发电机组检修计划优化模型以可靠性[3,4]或经济性[5,6]为目标函数,发电机组检修计划的约束条件通常包括检修时间约束、检修资源约束,燃料以及排放等约束[7]。传统的输电检修以可靠性为目标[8],随着电力市场的发展,对输电检修的经济性越来越关注[9]。

随着电力市场的发展,协调制定电力系统发输电设备联合检修计划成为了近期的研究热点[2,7,10,11]。然而对于较大的电力系统其输电线路数量很大,因此,有必要筛选出需要和机组联合检修的线路。检修计划的经济性受到了更多的关注,文献[2,10]将负荷分层处理,分别使用线性化最优潮流求解发电运行子问题。然而负荷分层数的取舍必须谨慎考虑计算时间和精度的平衡。此外对于水火混合电力系统,由于存在水电可发电量耦合约束,将极大增加最优潮流计算难度。为此,本文采用最大负荷和电量需求相结合的负荷模型,无需对负荷进行分层处理,只需保持电力电量分别平衡。近年来,《节能发电调度办法(试行)》在我国部分省份试点。然而现有研究没有充分考虑发输电检修和节能调度的关系,对充分利用可再生能源重视不够。四川电网作为全国电网系统中节能调度的五个试点单位之一,具有水电比重大的特点。水电的利用原则是以水定电,其检修要求在枯水期进行,尽量不安排丰水期检修,以达到不弃水或尽量少弃水的目的。此外,由于水电发电受来水量的影响,如何综合考虑水库的水位消落,梯级水电的协调检修,实现最大限度地利用水能资源成为当前急需解决的课题。

电力系统检修计划为一大规模混合整数规划问题。已有许多方法用于求解检修计划问题,这些方法可以分为启发式优化方法和数学优化方法[1]。由于现代智能优化算法在组合最优化问题中全局寻优能力的突出表现,其也被引入到检修计划问题的求解中[12~14]。

本文以四川电网发输电设备联合检修计划作为研究对象。以节能调度要求为背景,结合实际系统的特点,建立了实用化的发输电联合检修计划模型。模型的目标函数为检修费用、发电能耗以及购电费用之和最小。约束条件除考虑了常规的检修约束、可靠性约束外,还着重考虑了大量实际运行约束条件。例如水电可发电量约束,水库调节能力约束,梯级水电约束,关键线路传输稳定限额、机群最小开机约束等实用约束条件。针对该模型采用遗传算法进行求解。将原优化问题分解为离散变量的检修子问题和连续变量的发电运行子问题。对离散的检修变量结合问题的特点设计编码方式和遗传算子。并采用了一种快速的启发式方法求解运行子问题。通过个体适合度的评估对两个子问题进行协调。

1 数学模型

1.1 目标函数

本文以检修费用和运行成本以及购电费用作为目标。检修费用采用“时间窗”的计算方法[10]。目标函数可以表示如下:

式中:Cit表示机组i第t时段的检修费用;Ckt表示线路i第t时段的检修费用;xit表示机组i第t时段的检修状态:xit=0表示检修,xit=1表示未检修;Ait表示机组i第t时段的开停机状态:Ait=1表示开机,Ait=0表示关机;Wit表示机组i的第t时段的发电量,Ci(Wit)表示能耗函数;N表示全部机组总数,T表示时段总数;CBt表示t时段的购电价格;WBt表示t时段的购电量。

1.2 约束条件

从式(1)可知目标函数可分为检修费用和运行成本。约束条件亦可分为检修约束和运行约束两类。

1.2.1 检修约束

式(2)表示检修时间约束,即机组或线路最好在时段[ei,li]内开始检修,yi表示检修起始时段,di表示检修持续时段数;式(3)表示检修资源约束,rij表示机组(或线路)i检修需要的j种资源的数量,αjt表示t时段可获得的j种资源总量;式(4)表示机组和线路不允许检修时段约束;式(5)表示电厂p内同时检修机组的最大台数限制bp;式(6)表示传输路径约束,指r传输路径的多条联络线族中最多能同时检修的线路数br约束;式(7)表示冷备用约束,PDt表示电网t时段的负荷最大值,μ为备用率,通常取7%~10%;式(8)表示机群最小开机台数约束,结合长期运行经验以及先期系统稳定分析的结论,在个别地区存在电压稳定支撑的要求,这些电厂需要长期投入运行一定数量Uc的机组。

1.2.2 发电运行约束

式(9)表示电力平衡约束;式(10)表示电量平衡约束,WMonth表示月负荷电量需求;式(11)表示机组容量约束,Pimin和Pimax分别表示机组的最小和最大技术出力。应该指出水电机组由于受季节性的来水量影响,其每个时段的最大出力和可发电量将不同,该类数据由水文预测给出。式(12)表示区域断面流量约束,反映了分区之间功率交换的限制。式(12)表示旋转备用约束,Pr表示系统的旋转备用容量要求。式(14)表示水电发电出力和流量的关系,η为常系数。式(15)表示水库储水量和流量的关系,tQ和tQ分别表示流入和流出的流量。

2 算法

本文在遗传算法框架内,将主问题分解为检修子问题和运行子问题。检修费用和检修约束构成检修子问题,运行成本和运行约束构成运行子问题。对检修状态变量进行编码,运行子问题求解适应度值。

2.1 遗传算法的编码方式

个体编码采用了如表1的元胞数组形式,数组每一行的列数由该行的检修次数决定,一次检修对应一组起始月和起始时段。

表中Ui表示机组的序号,Li表示线路的序号;若检修次数mi小于2则yi2无定义。本文定义5天为一个时段,一个月分为6个时段,确定了检修起始月和时段就能确定检修的具体日期。

2.2 遗传算法的算子

初始化:采用随机初始化的方法。遗传算法对于初始种群较为敏感,好的初始种群能缩短寻优过程,为此在初始化时考虑了约束条件式2)、4),在检修时间约束内随机产生起始检修时间点。

交叉:采用改进的随机单点交叉,交叉率为0.4。由于机组检修应该配合电厂并网输电线路检修,这样能有效地减少机组停机时间。单点交叉容易破坏机组和相关并网输电线路的检修配合关系,需要对此做出改进。改进的随机单点交叉形式上表现为三点交叉,只是后两交叉点不是随机产生。第二交叉点取机组Un和线路L1之间,而第三交叉点依据机组和线路的关联关系确定。

首先需要将机组和线路的关键关系在编码时就按顺序排列,即位置靠前的机组则关联线路也应靠前排列。假设随机交叉点产生于U2和U3之间,依据机组和线路的关联关系有U1、U2关联L1而U3关联L2,那么第三交叉点可确定在L1和L2之间。三点交叉的示例参见表2。

变异:采用均匀变异,变异率为0.02。

适应度函数:每个编码个体代表一个检修方案。对编码个体进行解码,得到全年每个时段的机组及线路检修方案。基于该检修方案使用启发式方法快速求解运行子问题。

在每个时段上将检修设备退出,然后制定机组发电计划。该系统是一个水火混合电力系统,需要进行水火电协调。首先,依据水文预测的相关数据可以得到该时段各水电机组的可发最大出力和电量。其中要考虑水库的调节能力问题,对有调节能力的水库其机组检修时要不弃水或尽量少弃水,其总发电量不变或少量减少。还要考虑梯级水电检修配合问题,实际系统中存在多个一个大型调节水库带下游几个径流水电站的情况,它们配合检修才能充分利用水资源。依据负荷预测的系统最大负荷和电量需求可以求得火电的最大出力和电量需求。特别要注意的是,此处求得的火电的最大出力和电量,往往存在着电力与电量不匹配的问题,超出了火电机组实际运行时的调节能力。比如说,电力过多而电量过少,即是说,火电机组的发电利用小时数过低,这在电力系统实际运行时是难以实施的。本文中采用的每天发电利用小时数范围为[15.12,22.8]。为此,需要进行电力电量平衡校核。如果火电发电利用小时数低于下限值,则减少水电发电量,增加火电发电量;如果火电发电利用小时数高于上限值,则减少水电出力,增加火电出力。此外,还有可能存在检修后系统发电容量不够的问题,则需要从外网购买并支付较高的电费。通过以上调整最终使得电力电量达到平衡,同时也确定了水、火电机组的发电出力和电量以及外购电量。

下面的工作就是要确定具体的机组组合。依据国家发改委颁布的《节能发电调度办法(试行)》确定的机组排序原则,采用优先顺序表法可以快速地制定机组组合,并校核区域联络线容量限制。确定每台机组的发电出力和发电量。

最后将所有时段的检修费用与发电能耗以及购电费用之和取其倒数作为该个体的适应度值。

3 算例分析

本文以四川电网为例进行数值分析。该系统包括119台机组,其中无调节能力的水电机组56台,有调节能力的水电机组17台,供热发电机组3台,燃气发电机组9台、燃煤发电机组34台。该系统具有水电比重较大的特点,因此水电受季节影响的特点在该系统表现尤为明显。本文依托四川省电力系统的特点,结合长期运行的经验,对大系统进行区域划分,确定出和发电机组有关联关系的输电联络线以及区域断面联络线,将其作为需要和发电设备协调检修的对象以及运行过载问题监测点。而其他的输电线路的检修对发电机组的运行影响极小或根本不影响,因此无需和发电机组联合检修。确定出需要联合协调安排检修的输电线路26条。该电力系统由四个区域通过联络线连接成一个大的发输电网络。其他数据包括四个区域各自逐月的负荷最大电力和电量需求,各机组容量、分区、分类(按七大类划分)及检修任务数据,各线路检修任务数据,区域之间的联络线传输容量,电厂并网线检修时电厂降额容量。该降额容量不等同于线路的热稳定极限,而是通过电压稳定计算得到的容量限制。

仿真计算得出发输电设备的检修计划优化结果如表3。

实际运行采用的专家经验人工编制的计划参见文献[15]。将算例计划与专家经验人工编制计划对比,算例的运行成本为1 345.0万吨标准煤,而专家经验的运行成本为1 354.0万吨标准煤,二者都没有产生购电费用。数据表明本文提出的检修计划协调优化方法比人工编制检修计划节能高达0.66%,这得益于对系统中大量水电的充分利用。并且算例计划能满足全部约束条件,为可行解,而专家经验计划有部分约束条件不满足,其中包括部分检修资源约束和电厂约束,表明本文所提方法更能确保检修计划的可行性。

4 结论

本文建立了电力系统发输电设备联合检修计划问题的实用化模型,提出的约束条件使得模型更贴近实际问题。采用遗传算法和启发式方法相结合对模型进行了求解,结合问题特点的遗传算子提高了算法的效率。仿真算例表明本文所提出的检修计划问题的模型和算法的可行性和有效性。

摘要：建立的发输电检修计划模型,以节能调度为原则,目标函数为检修费用、发电能耗费用以及购电费用之和最小。特别考虑了水火电协调、水电发电量约束、水库调节能力、梯级水电约束、关键线路传输稳定限额、机群最小开机等实用约束条件。在遗传算法框架内,将原优化问题分解为离散变量的检修子问题和连续变量的发电运行子问题。对检修子问题,结合问题的特点设计编码方式和遗传算子。并采用了一种快速的启发式方法求解运行子问题。通过个体适合度的评估对两个子问题进行协调。实际系统算例表明所提出的模型和算法的可行性。

【实用算法】推荐阅读：

实用要求07-19

实用文本06-27

实用建议06-27

实用功能06-28

实用07-22

实用分类08-03

实用智能08-06

实用教材08-09

实用语法08-09

实用数学08-10

>> 查看更多相关文档