可扩展公式化

2024-08-06

可扩展公式化（精选4篇）

可扩展公式化篇1

目前, 已经存在许多人脸识别方法, 如主成分分析 ( principal component analysis, PCA) ［1，2］、独立成分分析 ( independent component analysis, ICA) ［3］及线性判别分析 ( linear discriminant analysis, LDA) ［4，5］都可以成功的完成人脸识别, 这些算法都通过估计低维子空间以达到降维的目的, 实践证明, 这种思想对人脸识别确实很有效, 已成为计算机视觉的一个重要工具［6］。

针对人脸识别问题, 基于线性判别分析, 文献[7]提出了一种称为概率线性判别分析的 ( probabi-listic linear discriminant analysis, PLDA) 的技术, 此后, 这种概率技术在人脸识别和说话者识别中得到了广泛的应用, 并在这两个领域中都获得了良好的效果［8］。尽管PLDA在多种领域和多种任务中性能卓越, 将其应用到大的数据集中仍存在一种主要限制因素。针对训练模型, 其后的计算工作包含了矩阵求逆, 它的大小随着每类采样数量呈平方增长, 针对该问题, 文献[9]提出了一种变分近似法, 然而, 这种近似法的质量受限于可疑假设的有效性, 当计算似然时, 同样会出现相似的问题。对此, 文献[10]提出通过采用更低的似然边界来进一步逼近, 并指出可以通过变量的变换来使协方差矩阵对角化。为了有效地完成这个工作, 需要执行变量替换的矩阵以能够离线计算, 然而, 一旦似然计算出来就需要加载和使用该矩阵, 大大地增加了计算开销。

基于上述分析, 针对概率线性判别分析方法在训练阶段矩阵大小随着标志类采样数量呈平方增长的问题, 提出了一种基于概率线性判别分析的可扩展似然公式化方法, 其避免了文献[10]提出方法中对近似的需求, 从而大大地降低了计算开销。相对于以前的工作, 这一贡献提供了三项显著的优势: 第一, 提供了一种可扩展的方法来进行后来的推导, 因此, 采用可扩展的方法来执行训练, 且不包含任何近似; 第二, 详细阐述了一种确切并可扩展的方法来计算样本的联合概率, 这从未有人提出过; 第三, 减少客户端 ( 存储模型的信息) 的注册来计算单个低维特征向量, 而不是保持多个高维特征向量。实验结果验证了所提方法的高效性及可扩展性。

1 问题提出

PLDA模型主要完成两个任务: 一、训练模型, 通过最大期望算法 ( expectation maximization, EM) ［11］实现; 二、使用训练过的模型进行识别, 核心是计算拥有相同潜在特征变量hi的观测集[xi，1, xi，2, …, xi，Ji]的似然。下面给出两个任务的更多细节。

1. 1 训练PLDA模型

为了训练PLDA模型, 使用了最大期望算法 ( EM) , 一旦潜在变量被估算出来, 就对每个样本基进行M步骤, 正是与E步骤一致的潜在变量使得PLDA的可扩展性变得困难, 在E步骤中, 需要计算出潜在变量的一阶和二阶矩阵, 方程如下

从上式可知, E步骤中的问题是如何有效的处理因为每次EM迭代过程中都需要重新计算它。实际上该矩阵的大小为 ( DF+JiDG, DF+ JiDG) , 既要对其进行计算, 又要对其进行存储。文献[10]将PLDA应用在说话者识别中时, 提出运用变分近似法来解决这个问题, 然而, 这种近似依赖于因式分解, 它假设后来的变量是相互独立的, 关于这个方法的质量并没有阐明, 训练处PLDA模型后, 就可以用来执行多种任务而仅仅依赖似然计算。

1. 2 PLDA的似然

如文献[8]所述, 可以用似然解决一些问题, 包括识别、鉴定和注册。想要计算具有相同潜在特征变量的样本集的似然, 可以通过概率方法完成, 这需要整合出所有的潜在变量。因此, 将样本的潜在特征变量hi联合起来, 假设它们有相同的特征并且假设每个观测xi，j拥有独立的会话变量wi，j, 然后集成所有的hi和所有的个体wi，js, 当Ji= 2 时, 就等于式 ( 3) 。

为了简化, 取出了对 Θ 的引用。

上面的问题如下给出

因此, 可以计算出对数似然

这其中有三项计算复杂度较大, 第一项是取决于样本数量Ji的简单常数因子; 第二项需要计算矩阵的行列式, 大小随着样本数量Ji呈平方增长;需要计算同样大矩阵的逆, 需要的计算量同样很大, 下式对该平方项进行的优化

式 (6) 中, 第一项很容易计算, 因为是对角型矩阵, 然而, 第二项需要计算较大逆阵的平方根, 尽管这个计算可以通过离线执行, 但该矩阵的大小随着样本数呈平方增长, 从而限制了PLDA模型的可扩展性。

2 提出的解决方案

如图1 所示为所提解决方案的整个流程图, 主要通过将PLDA模型对角化进行可扩展训练、可扩展似然计算, 从而将整个逆矩阵替换成计算量较小的低维矢量或标量。

针对训练步骤, 给定类i的样本xi，js有相同的项Fhi, 但是有独立的混杂因素Gwi，js, 因此, 类i中的总和应当可以直观地估算潜在变量hi, 然后将每个样本Gwi，j与独立的潜在变量wi，j相联系。其中, xi，js是独立的高斯样本, 如果假设它们任意正交混合, 它们的独立性仍保持。

下面详细给出通过简单变换变量来使得PLDA模型对角化过程, 通过结合简单线性代数运算, 可针对训练和似然计算得出可扩展方程。

2. 1 改变变量

令为任意的Ji× Ji正交矩阵, 第一行其余行任意, 只要是正交的。例如, 令的其余行

行有j个相同的正项, 紧接着一个负项, 它们的和为零, 且它们是单位长度。

然后, 张量带有xi，j空间中 ( 同样称为克罗内克积) 的标志矩阵, 乘以就产生了新变量 ( 下面, 圆形符号。°用来通过这样的变量改变以转换变量) 特别的, 的上部分相当于xi，js的归一化总和, 这对估算特征因素hi非常有用, 这种转换同样可以运用到变量上, 得出以及下面的PLDA模型

这个例子保持了新变量的独立性, 因为混合矩阵是正交的。

相似的, 变量的变化可以应用到wi，j中, 通过借助特征矩阵在wi，j空间中扩张来完成。假设经过这种变。量变化, hi并没有更新, 这种变换就得到如下的

这就直接表明PLDA模型可以记住前面推导出的变量重写

的逆为

比原始的矩阵更稀疏, 且是块对角矩阵, 这就验证了之前变量变换的选择

下面, 将展示这种方法确实能够辅助训练和似然计算中的矩阵运算, 如行列式计算和矩阵的逆, 这种基于块的方法能够有效地执行, 显著降低了这种概率方法的复杂度。

最终, 提出方案的变量服从如下高斯分布:

2. 2 可扩展训练

目标是训练PLDA模型, 使得关于训练样本数量它是可扩展的, 为了训练PLDA模型, 使用了EM算法。然而, 这个算法的E步骤有一个瓶颈［12］。用原来的PLDA方程, 就需要计算它的大小随样本数量Ji的平方增长。相反, 这种提出的对角化的方法使得E步骤方法可扩展。采用贝叶斯法则［13］, 转换后的PLDA模型的潜在变量的概率分布可写成

是块对角阵。左上角的块为

其余的Ji- 2 个块为

对称矩阵g定义为

(1) 估算潜在变量的一阶矩。由式 (15) 中高斯分布的均值给出, 即为, 是块对角阵, 能够有效地求逆。然后, hi不受变量变换的影响, 其对应于上面的子向量。而且, 一阶矩可以直接从第一行得到

这里为了提高可读性, 定义了如下的对称矩阵

此外, 当恢复变量的变换后, wi，js可能如下表达:

( 2) 估算潜在变量的二阶矩。用可扩展的方式计算潜在变量二阶矩的期望值更加困难, 这个二阶矩可以表示成均值平方与方差的总和。均值已经表示在式 ( 19) 和式 ( 22) 中。此外, 改变恢复变量后, 得出方差如下

然而, 潜在变量的方差仅在每个样本基上使用, 因此, 可以将问题简化为计算 ( 使用式 ( 5) 中定义的变量yi，j) , 由矩阵P－ 1的一些块组成。

此外, 每个样本基上潜在变量的方差为

式 ( 24) 中,

2. 3 可扩展似然

所提方法的似然可通过将潜在变量整合得到

可以划分成三项 ( 如式 ( 5) 一样) , 其中后两项很难估算, 因为它们需要分别计算如下大矩阵的行列式和逆

然而, 借助提出的方法, 是一个块对角阵, 左上角的块为其余部分等于因此, 可以进行一些简化来提升该方法的效率。

首先, 式 ( 5) 中似然的第二项包含了这个大矩阵的行列式的计算, 其可以通过如下的分解有效地计算出来

利用式 ( 16) 、式 ( 17) 给出的的块分解得到

然后, 似然的第三项可以通过块执行矩阵求逆, 针对每个块, 将这种方法与Woodbury矩阵特征结合得到

如果似然的计算包含与样本数量Ji相同的次数, 那么上面的表达式可以通过文献[8]中提出的技巧进行进一步优化。矩

阵FJi和g的平方根可以预处理, 然后用来在后面两项变大之前分别计算它们的一半。注意到变量的替换并不影响PLDA模型, 因此, 上面的方程同样能够合理地计算式 ( 5) 给出的似然。

最终, 上面的等式可以存储模型的信息, 从而降至单个低维特征向量 ( 例如, ) 和标量 ( 与似然计算中包含的其他项相关) , 这就进一步强调了提出方法的有效性和可扩展性。

3 实验

实验主要通过人脸识别阐明了为训练PLDA提供可扩展方程的有效性及高效性, 使用了LFW［14］和Milti - PIE［15］两大人脸数据库。

首先, 阐明这种可扩展的方法能够提供与已发表在LFW上的方法相似的性能; 然后给出证据说明每个标志拥有更多的训练数据能够获得更好的PL-DA模型, 同时强调了文中的可扩展方法与其它非可扩展方法的区别。对Multi-PIE人脸数据进行实验, 每个标志 ( 类) 采用不同数量的训练样本获得一些模型。这仅对Multi-PIE是可行的, 因为它的每个特征包含许多图像。

在人脸认证中测试了可扩展系统。在这个方案中, 某人被定为特征i, 并给出信号 ( 人脸或语音) 作为系统的探头xp。系统已经根据已知他们的样本xi，1注册了他们的特征。所以, 系统这样计算: ①如果“他们是客户i”, 相当于结合潜在变量xi，1和xp, 即Pr ( xi，1, xp) 。或者②如果“他们不是客户i”, 相当于含有独立的潜在变量, 即Pr ( xi，1) Pr ( xp) 。这些联合分布已由式 ( 3) 给出, 集合贝叶斯法则形成对数似然概率

然后对这个结果运用一个阈值判断探头图像是否为认定的特征。所有的实验都使用了可扩展的似然计算方法。

针对所有的实验, 使用了下面的初始化步骤: 分别基于训练数据的类之间和类内奇异值分解结果的散布, 初始化子空间F和G; 通过特征值使每个基向量归一化。初始化方差 Σ 为训练数据的方差, 总是执行200 轮EM训练, 因为初步的工作表明这是一个合理的数值。

3. 1 LFW实验

所提方法采用与文献[8]提出的SIFT-PLDA[8]和文献[6]提出的SIFT-LDML［6］相同的SIFT特征算法, 针对LFW数据库给出了实验结果, 在三个不同尺度下提取出了9 个脸部特征, 并将其与SIFT-PLDA和SIFT-LDML两种方法的识别率进行了对比。使用这些特征是因为它们可以公开获得, 且针对LFW数据库性能较优。此外, SIFT描述符是为了迎合人脸识别领域的性能而阐述的。级联关键的描述符后, 使用PCA降低这些特征向量的维度, 保持最高200 维。针对View1 和View2 的每一褶, 这是独立完成的, SIFT-PLDA方法使用SIFT特征得出最优的PLDA, 超参数设置为DF= DG= 48, 所提方法使用相同的超参数, 其余参数设置均参考各自所在文献, 具体实验

结果如表1 所示。

从表1 可以看出, 提出模型的性能与文献[8]提出的SIFT-PLDA模型相媲美。将性能上的小区别归结于初始化PLDA模型时的潜在不同以及EM迭代次数的差别。结合理论等式及实验结果可知, 提出的PLDA模型实现方法与文献[8]提出的SIFT-PLDA等价, 同样可在一些人脸识别任务中性能卓越。

3. 2 Multi-PIE实验

这部分针对Multi-PIE人脸库进行了实验, 以强调提出模型的可扩展性, 采用Multi-PIE数据库是因为该数据库含有337 个特征 ( 类) , 每个特征包含高达76 个图像可供训练, 图2 给出了一些示例图像, 以绿色边界框裁剪出脸部图像。

所提方法初始化时裁剪并调整图像使图像为64 × 80 像素大小, 并标识出眼部的位置, 同时使用了一种标准的图像归一化算法。接着获得与文献[13]中相似的LBP特征, 通过在脸部放置一个10 × 10的窗口, 使用半径为2 和8 的等距点获得一个均匀的矩形图。将这些矩形图级联起来形成单特征向量, 使用PCA将维度降至500 维, 然后使用这些特征作为PLDA系统的输入。

实验给出了所提方法在Multi-PIE人脸库上引用半错误率的结果 ( half total error rate, HTER) , 并且与SIFT-PLDA、SIFT-LDML、使用卡方检验距离的LBP矩形图[13]进行了比较。HTER计算如下:

式 ( 32) 中, 错误报警率 ( false iarm rate, FAR) :

错误拒绝率 ( false rejection rate, FAR) :

HTER可以通过取阈值处评估集的误识率和拒绝率的平均来获得。各方法的比较结果如表2 所示, 这些结果的获得使用了完整训练集, 9785 张图像, 其中每个特征最多76 张图像且最少19 张图像。可以从结果中看出, PLDA方法性能超出其他方法。

从表2 可以看出, 所提方法的HTER明显低于其他各个比较方法, 为了更好地体现所提方法的可靠性, 基于3. 1 节的实验, PLDA的最优超参数设置为DF= 128, DG= 64, 变换每个特征的训练图像数量观察其对性能的影响。从2 到76 变换每个特征的训练样本最大数量, 针对训练样本的数量选取需要计算潜在变量 ( 对数尺度) 矩阵的相对大小, 结果如图3 所示。计算潜在变量的矩阵: ①可扩展的推导为和②非可扩展推导

从图3 可以看出, 所提方法的错误率随着特征的样本数增加而降低, 绘制出矩阵大小, 将其与可扩展和非可扩展矩阵中元素的对数数量作对比, 该对数数量用来计算潜在变量, 同时提供了针对训练样本的HTER图。此外, 对于这些实验而言, 增加训练样本总能提升性能, 因为随着训练样本数量的增加, 使用非可扩展方程很快会变得不可行, 清晰地表明了基于PLDA的可扩展方程是非常有效的。

3. 3 性能比较

为了更好地体现所提方法的优越性, 将所提方法的复杂度与概率线性判别分析 ( PLDA) ［7］、基于SIFT的概率线性判别分析 ( SIFT-PLDA) ［8］、基于SIFT的线性判别矩阵学习 ( SIFT-LDML) ［12］、使用卡方检测的局部二值模式矩形图 ( 卡方-LBP) ［13］进行了对比, 分别比较了训练时间复杂度、似然计算复杂度及空间复杂度, 具体比较结果如表3 所示, 其中, m、n分别表示图像矩阵的行数和列数, L、M、N分别表示投影向量数、测试样本数、训练样本数。

从表3 可以看出, 与原始PLDA方法相比, 所提方法的似然计算复杂度明显低于原始PLDA方法, 其他的两个复杂度相同; 与SIFT-PLDA方法相比, 所提方法的训练复杂度明显低于SIFT-PLDA方法, 其他两个复杂度相同; 与SIFT-LDML方法相比, 所提方法的训练阶段时间复杂度稍微高了点, 但是似然计算复杂度比SIFT-LDML方法低了一半; 与卡方-LBP方法相比, 所提方法的训练阶段时间复杂度、似然计算复杂度及总体空间复杂度均低了很多。在大大提高识别率的同时, 所提方法仍然能够保持与其它各个比较方法相当甚至更优的复杂度, 由此可见其优越性。

4 结论

针对PLDA方法中矩阵太大而影响其扩展性的问题, 提出了一种新的可扩展似然公式化方法, 通过将其应用在两个著名人脸库进行实验阐述了所提方法的有效性及可靠性。借助LFW人脸库说明这种方法的模型与文献[8]的模型是等价的, 在一些人脸识别的问题的应用中显示出了良好的性能。借助Multi-PIE人脸库, 说明了当每个特征 ( 类) 的训练样本数量更多时获得的性能上的提升, 从而说明了可扩展方法的必要性。与其他几种较为先进的类似方法的比较表明, 所提方法明显改善了原始PLDA方法计算复杂度, 并且明显低于几种比较方法。

未来会将所提方法应用到其他人脸数据集上, 进行大量的实验, 并结合其他的先进技术, 改变初始参数的设置, 进行大量的实验, 在提高识别率的同时, 进一步降低计算复杂度, 以更好地应用于实时人脸识别系统。

可扩展公式化篇2

气动元件是组成气动系统的基本单元, 因此, 准确测定组成气动系统各种元件的流量特性参数十分重要。根据国际标准ISO6358, 在非线性流量特性公式的基础上, 可用最小二乘法来辨识气动元件的声速流导C、临界压力比b等流量特性参数[1]。不过, 随着气动元件的复杂化和小型化, ISO6358规定的测试方法及其所依据的气动流量特性公式已难以准确地测定不同类型气动元件的流量特性了。因而, 人们在ISO6358原有公式的基础上, 用扩展后的流量特性公式来描述气动元件的流量特性[2], 甚至提出用等温容器在新的流量公式的基础上测试的标准[3,4]。至此, 气动元件流量特性的测试精度有了较大的提高。但是, 经过试验和研究发现, 尽管上述方法对气动元件的声速流导测量还比较准确, 但有些气动元件的临界压力比和亚声速指数ms的测量值却并不是很稳定。如在同一测试环境下对同一个元件进行重复测量, 基于各次的测试数据应用非线性最小二乘优化算法进行参数辨识, 各次的参数辨识结果相差还是很大的。一般认为, 有两个方面的原因造成临界压力b和亚声速指数ms测试不稳定。一是认为不同元件具有不同结构和不同材料, 因此, 气体流过元件时的流态 (层流或紊流假设) 、热力学状态 (绝热或等温假设) 和产生的摩擦不确定性等因素是造成测试结果不稳定的原因。另一观点认为由于ISO6358标准所规定的方法对测试硬件条件要求高, 如流量计测试量程、测量管径与被测元件不匹配, 上下游压力变化大等因素都会造成测试值较大变化。这两个观点可以解释不同元件测试精度不同的原因, 但是却不能解释在同一测试条件用同一测试方法对同一气动元件进行多次测量和参数辨识, 有些气动元件的参数测量值重复性好, 另一些元件的参数测量值重复性差的现象。

本文针对气动流量特性扩展后的非线性模型, 根据ISO6358法实测的五个气动元件的测量数据, 从微分几何的角度出发, 在非线性回归分析的基础上, 对流量特性模型的非线性强度进行了分析和计算;给出了气动元件流量特性公式的固有曲率、参数效应曲率和参数置信区间, 分析了气动元件参数测量值重复性差的问题, 为更准确地测量气动元件的流量特性参数和刻画流量特性做了基础研究。

1 ISO6358测试系统和方法

ISO6358试验硬件系统如图1所示。图1中试验的气源部分由空压机、储气罐、过滤器、冷冻式干燥机、两级油雾分离器和减压阀构成, 其中上下游测压管的尺寸及压力表测量位置符合ISO6358规定。这里所用压力传感器的精度为±0.5%, 质量流量计精度为±0.3%, 符合ISO6358中规定的A级标准。根据ISO6358, 固定被测元件的上游压力和调节节流阀, 首先得到最大的质量流量, 即壅塞流量, 计算得到声速流导C;然后找到流量开始减小的点, 记录这些点的上下游压力、温度和流量。这些点采集完之后, 根据基于ISO6358标准的扩展公式, 用最小二乘法算出被测电磁阀的临界压力比b和亚声速指数ms。其中, ISO6358标准的扩展公式为

1.压缩气源和过滤器2.调节阀3.截止阀4.测温管5.热电偶6.上游测压管7.被测元件8.下游测压管9.上游压力表10.压差表11.节流阀12.流量计13.消声器

式中, q为气体流量;ρ0为初始气体密度;P2为上游压力;P3为下游压力;T0为初始气体温度;T为气体温度;b为临界压力比。

2 参数测值的统计分析

用图1所示的测试系统, 依据ISO6358方法对五个不同的气动元件各重复做了10次试验。表1为各元件的某一次测试的数据。为了便于比较, 五个元件都采用SMC公司的产品, 其中A为SY3140-5LOZD型电磁阀, B为SY7140-5D-02型电磁阀, C为VX2110-02-3D型电磁阀, D为SV1000型电磁阀, E为VXZ22/23型电磁阀。

图2为对应表1测量值的流量特性曲线, 其Y轴为根据式 (1) 归一化的质量流量比:

结合表1和图2可以看出, 各元件流量特性曲线有较大差别。其中元件C和元件E的流量特性曲线很相近, 元件A的流量特性曲线变化最为平缓, 而元件B的流量特性曲线显示其流量在压力比值较大时, 其流量率比值r才以较快速度下降。

如表2所示, 基于各个元件的各次测试数据, 借助SPSS统计软件中基于高斯—牛顿算法的非线性回归程序辨识流量特性参数, 按照各次辨识结果中临界压力比b的最小值、中间值和最大值, 选择其中的3次参数辨识结果, 分别表示为表2中的测试1、测试2和测试3。

从表2可以看出, 所有元件流量特性参数b和ms的95%置信区间都是关于参数估值对称的, 表明SPSS软件的非线性回归程序中关于参数推断域的算法是在线性近似的基础上得到的。以表1所示元件A的一次测试数据为基础, 通过统计分析可知由式 (2) 计算的归一化流量r及其残差符合正态分布。综合以上分析可以看出:

(1) 元件B的b值最大, 元件D次之, 元件C和E的b值接近, 元件A的b值最小, 这与图2中各元件流量特性曲线的变化趋势一致。由于元件A的b值小, 在较小的压力比阶段其流量就进入亚声速阶段, 然后流量特性比值以较平缓的趋势下降;元件B的b值最大, 与元件A正好相反, 其流量特性比值在较高的压力比阶段以较大的梯度下降。

(2) 从表2中的残差分析来看, 元件A的残差最小, 元件B的残差最大。这是由于元件B的b值大, 在较短的时间和较少的测试点数内, 就完成了从声速阶段到亚声速阶段的变化, 测试值的方差大;元件A的b值小, 亚声速阶段的点数多, 测试值的方差小。A元件参数 (包括b和ms) 的置信区间的长度在5个元件的相应值中最小, 相对而言, 元件B的参数 (包括b和ms) 的置信区间的长度最大。

(3) 元件B的流量特性参数的三个辨识结果最为接近, b值的标准值为0.367, 三个辨识结果最大相对误差小于1%, 其测量的重复性相对其他元件而言最好。元件A的三个辨识结果差异最大, 其b值从测试1的0.196到测试3的0.235, 相对误差达20%, 其测量重复性最差。

3 流量特性公式非线性强度分析

由于ISO6358界定的气动元件流量特性参数的最小二乘辨识算法本质上是基于局部线性近似的高斯—牛顿算法, 从表2计算结果可以看出, 有些气动元件的测试数据经最小二乘辨识后能得到令人满意的结果, 有些则不能。这是因为不同的非线性模型具有不同的非线性强度, 非线性模型的非线性强度直接影响了基于线性近似迭代法的可靠性。为了分析气动流量特性扩展公式的非线性强度, 要计算这一模型的固有曲率指标和参数曲率指标。

3.1 非线性强度固有曲率指标和参数曲率指标的计算

文献[5]从微分几何的观点出发, 提出了表征非线性强度的固有曲率和参数效应曲率的概念, 并提出了表征非线性强度的度量指标:非线性模型的最大固有曲率ГN和最大参数效应曲率ГT。一般形式的非线性回归模型的输入输出可以表示为

式中, f (xn, θ) 为期望函数;Yn为样本第n个输出的响应变量, 本文为第n次测得的质量流量比rn;xn为信号输入, 本文为第n次调定的压力比值Pn;θ为待辨识的参数向量, 本文包括临界压力比b和亚声速指数ms;Zn为残差, 是随机部分。

假设非线性回归模型 (式 (3) ) 关于参数θ存在二阶以上偏导数, 则非线性模型公式f (x, θ) 关于θ的一阶偏导数和二阶偏导数矩阵分别为

其中, , 而, 是立体阵C的第k面、第i行、第j列的元素。参数空间中过θ0以h为方向的一条直线为

其中, t为几何参数, 这条直线在解轨迹上产生一条曲线被称为“提升线” (lifted line) , 其方程为

提升线在t=0的切线和加速度分别为

因此, 提升线的速度向量ηh是向量的线性组合, 提升线的加速度向量是由模型参数决定的向量的线性组合。作为提升线的加速度向量, 它可以分解为两个分量, 即垂直于切平面的法分量和切平面内的切分量。为了准确度量非线性模型的非线性强度还需要计算相对曲率, 即解轨迹的固有曲率KNh和参数效应曲率KTh。设由矩阵B生成的投影矩阵记为ST, 并记SN=I-ST, ST及SN可由下式表达:

非线性回归模型 (式 (3) ) 沿h方向在θ0处的固有曲率KhT和参数效应曲率KhT分别为

固有曲率KhN反映了解轨迹的性质, 是非线性模型本身的固有性质。而参数效应曲率KhT不仅由模型本身决定, 而且依赖于参数的选择, 所以在非线性模型的参数辨识过程中, KhT有着重要的意义。为了便于计算KhN和KhT, 对B的列向量进行QR分解:

式中, Q为θ0处切空间的一组p列标准正交基;N的列向量为法空间的n-p列的标准正交基;R为非退化上三角阵。

这个正交化过程实际上相当于对参数进行变换:

因此, Q的列向量又可视为切空间关于新坐标β的一组标准正交基, 则非线性模型 (式 (3) ) 关于β和θ的二阶偏导数之间的关系可以表示为

式中, A为新的立体阵。

由于在新坐标系下, , 则固有曲率可以重新写为

其中, d为单位向量, 即式 (3) 中的固有曲率可以借助固有曲率立体阵I计算, 参数效应曲率可以通过参数效应立体阵P计算, 其中I和P可以用方括号算法定义为[6]

根据式 (14) , 可以求得KdN和KdT, 通过最优化递归算法可以计算得到最大固有曲率KN和最大参数效应曲率KT[7]。分别将表2中的各元件的流量特性测试值代入上述计算过程中, 可以求得式 (3) 所表达的气动元件流量特性曲线在流量特性参数不同时的最大固有曲率KN和最大参数效应曲率KT, 其计算结果如表3所示。

由表3和表2可以看出, 各个元件的参数辨识结果和其参数效应曲率有一定的内在联系。仅从表3可以看出, 所有被测五个元件的最大固有曲率KN都在51~61之间, 数值差别不大, 这是由气动流量特性模型固有曲率的本质所决定的, 即所有被测元件流量特性曲线数学模型都由式 (1) 描述, 其数值的差异是由实际测量误差引起的。而参数效应曲率数值的变化范围都大于固有曲率变化范围, 其中元件A的参数效应曲率最小, B的参数效应曲率最大。元件C和元件E的参数效应曲率相近。由于扩展的气动元件流量公式 (式 (2) ) 类似于指数公式, 参数b和ms在参数空间的位置决定了其辨识的稳定性和难易程度。因此, 单纯用最小二乘法来辨识气动元件的流量特性参数, 虽然简单, 却难以保证辨识的精度。

3.2 非线性模型可线性近似的容许曲率的计算

根据文献[6], 如果所辨识的非线性模型的固有参数曲率大于线性化容许曲率, 那么参数的辨识及推断域的分析将难以用线性的方法处理, 非线性模型的解轨迹η=f (x) 可线性近似化的容许曲率的大小可表示为[7]

式中, t为未知参数的个数;为样本方差σ2的估值。

通过比较最大固有曲率指标ГN和最大参数曲率指标ГT与容许曲率KF的大小, 可以判断一个非线性模型是否可以近似线性化, 还可以分析非线性模型非线性强度的大小。

查F分布表可以得到F0.05 (2, 4) =6.9443, F0.1 (2, 4) =4.32214。通过计算表2中各个测试数据集方差的估值, 代入式 (16) 可以计算出各元件分别在置信水平为95%和90%时, 可以线性近似的容许曲率。计算结果如表4所示。

对照表3和表4的数值, 可以看出表3中不论是最大固有曲率还是最大参数效应曲率, 都明显地大于表4中的容许曲率的大小, 表明流量特性曲线的非线性强度很大。对于这种固有曲率和参数曲率都很大的非线性模型, 可借助参数的近似推断域或某个重要参数的边缘推断区间来描述被辨识参数的变化情况[8,9]。

4 流量特性曲线参数辨识的置信区间

当非线性模型的非线性强度很大时, 可用截面t图来描述参数的置信区间, 从而刻画某个参数的变化趋势[10]。对于一个线性模型的某一个参数θp的1-α边缘区间可以通过参数学生化表示为

其中, t (n-p;α/2) 是自由度为n-p的学生化t分布的上侧α/2分点, 而是参数估计量的标准差, 其中为样本方差, 而[ (BTB) -1]PP是矩阵 (BTB) -1的对角线上第P个元素。

由于学生化参数同时可表示为

而为子集平方和函数, 为θ-p对应于θp的条件最小二乘估计, 故记号表示元素为的向量。

用相同的记号来定义非线性模型某参数截面t函数:

参数θp的额定值为1-α的似然区间, 可以定义为所有满足下式的θp组成的集合:

截面t函数的图像给出了单参数的精确置信区间, 并揭示了非线性模型的非线性强度。图3形象地反映了式 (17) 和式 (19) 的关系, 即当模型的是线性时, τ (θp) 和δ (θp) 的图像是一条通过原点的斜率为1的直线。当模型的是非线性时, τ (θp) 和δ (θp) 的图像是一条实曲线, 其相对于虚线的弯曲程度反映了模型的非线性强度。图3~图7通过各子图右轴95%水平点画两条平行虚线, 其通过弯曲截面t图对应的参数推断域示于各个子图的上端。以图3的两个参数截面t图为例, 元件A的参数b和ms的截面t图分别反映了这两个参数的非线性强度。相对图4~图7而言, 元件A参数b的实曲线弯曲程度都要小于其他元件的实曲线弯曲程度, 而元件B的参数b的实曲线弯曲程度最大, 这点和表3计算所得的各元件的参数效应曲率的大小是一致的。从图3中的各子图可以看出, 对于截面t图弯曲程度大的元件, 如元件B, 其参数b的推断域间距为0.16, 长于其他元件的参数推断域间距;元件A的参数曲率最小, 其参数推断域间距为0.06, 也是所有元件参数b的推断间距最小的。其他元件的截面t图和参数曲率的关系也联系紧密, 即截面t图的弯曲程度越大, 参数效应曲率也越大。

综合上述分析可以看出, 截面t图可以判断非线性模型参数效益曲率的大小。一般而言, 截面t图弯曲程度大, 则非线性模型参数效应曲率大。参数曲率大的非线性模型其参数测量及优化辨识结果的稳定性好。但是, 参数曲率大的非线性模型的参数推断域大, 参数曲率小的模型参数推断域小。

5 结语

在ISO6358原有公式的基础上, 用加入亚声速指数后的流量特性公式来描述气动元件的流量特性时, 对大多数气动元件流量特性的测试精度有了较大的改进。但是应用ISO6358测试系统测试某些元件时, 常会出现测量值不稳定现象。针对这一现象, 本文对气动流量特性公式及其非线性强度进行了分析。在ISO6358法测试数据的基础上, 计算了五个气动元件的流量特性公式的非线性固有曲率及参数效应曲率。并绘制了不同元件基于线性近似和基于截面t图的参数推断域。通过分析和计算可知, 气动元件流量参数的辨识经常出现的辨识值不稳定的现象不仅与元件的结构和材料及ISO6358标准所规定的方法有关, 而且还与流量特性非线性公式本身, 即非线性强度有关。被测元件的流量特性参数曲线的参数效应曲率越大, 则该元件临界压力比和亚声速指数测试稳定性越好, 但是参数置信区间也越大;反之, 当被测元件的流量特性参数曲线的参数效应曲率越小, 则该元件临界压力比和亚声速指数测试稳定性越差, 但是参数置信区间变小。

用截图t图的方法, 不仅可以分析气动元件流量特性曲线的非线性强度, 辨识其流量特性参数, 还可以计算单个参数的置信区间, 这种方法对某些特别重要的气动元件流量特性的参数辨识提供了新途径。

参考文献

[1]International Organization for Standardization.ISO6358.Pneumatic Fluid Power—using Compressible Fluids—determination of Flow-rate Characteristics[S].Switzerland:ISO/TC 131Fluid Power Systems, 1989.

[2]腾燕, 李小宁.针对ISO6358标准的气动元件流量特性表示式的研究[J].液压与气动, 2004 (2) :6-9.Teng Yan, Li Xiaoning.Study on 6358Flow-rate Characteristics Standard of Pneumatic Components[J].Chinese Hydraulics&Pneumatics, 2004 (2) :6-9.

[3]Kagawa T, Cai M, Kawashima K, et al.Extended Representation of Flow-rate Characteristics for Pneumatic Components and its Measurement Using Isothermal Discharge[C]//Bath Workshop on Power Transmission and Motion Control, PTMC 2004.New York:Professional Engineering Publishing, 2004:271-282.

[4]International Organization for Standardization.ISO/DIS6358-3.Pneumatic Fluid Power—determination of Flow-rate Characteristics of Components Using Compressible Fluids—Part3:Alternative Test Methods—discharge Test[S].Swizerland:ISO/TC 131Fluid Power Systems, 2008.

[5]Bates D M.非线性回归分析及其应用[M].北京:中国统计出版社, 1988.

[6]王新洲.非线性模型参数估计理论与应用[M].武汉:武汉大学出版社, 2002.

[7]Bates D M, Hamilton D C.Calculation of Intrinsic and Parameter-effects Curvatures for Nonlinear Regression Models[J].Commun.Statist-Simula.Computa., 1983, 12 (4) :469-477.

[8]Clarke G P Y.Marginal Curvatures and Their Usefulness in the Analysis of Nonlinear Models[J].Journal of the American Statistical Association, 1987, 82 (399) :844-850.

[9]Cook R D, Weisberg S.Confidence Curves in Nonlinear Regression[J].Journal of the American Statistical Association, 1990, 85 (410) :544-551.

可扩展的“移动迷你屋” 篇3

如果说在帐篷或拖车上过日子的主意不那么吸引人, 那就考虑一下设计师斯蒂芬妮·贝兰杰设计的“移动迷你屋”吧。

这个小屋有一个巧妙的扩张地面计划, 突出了拥有浴室、起居室、卧室、厨房和办公室的特点。贝兰杰还为衣物、书籍等等设计了充足的储藏空间。

“移动迷你屋”的墙壁和地板能在轨道上滑动, 使它们很容易成扇形散开, 形成舒适的250°角扇形区域。我们喜爱这色彩丰富的房间和宽敞的设计, 但是, 不知道许多露营地是否有足够大的地方容纳这所房屋。也许将来有一天, “移动迷你屋”会成为既向往简单生活, 又想保留现代化便利设施的旅行者们一个理想的选择。

简单介绍可扩展标记语言XML 篇4

1 XML的发展概况

XML是什么?XML是Extensible Markup Language的缩写,译为可扩展的标记语言。XML是一套完善的定义语义标记的规则。

为了说明XML的发展历史,让我们先看看图1。

在20世纪80年代末期,位于瑞士的欧洲原子物理实验室(CERN)的研究人员为了使他们的工作方便而开发了WEB技术,他们的目的是将实验室网络上的研究文档共享。到了1986年,ISO国际标准化组织颁布了ISO 8879号国际标准,即SGML(Standard Generalized Markup Languge-标准通用标记语言),它是一种通用的文档结构描述置标语言。由于SGML非常复杂,不易使用,在1992年,CERN的研究人员把WEB技术(纯文本浏览器和最初版本HTML-简化的SGML)提交给INTERNET协会,从此,HTML(Hyper Text Markup Language)开始流行,并逐渐发展成一个庞大的家族,版本由原来的HTML 1.0,HTML 2.0,HTML 3.2,HTML 4.0到目前的HTML4.1,以及兼容XML格式的XHTML 1.0(Extensible Hyper Text Markup Language),XHTML 1.1和XHTML 2.0(XHTML 2.0的第五个工作草案在2003年5月6日公布)。

虽然HTML已经非常流行,并且现在的程序员大多数都在使用它来创建WEB网站,但是,由于HTML是一个实例置标语言,无法完整描述数据内容,也不能描述矢量图形、科学符号等对象,格式表现不能独立,结构不严格等诸多因数,在1998年2月10日,国际互联网论坛W3C(World Wide Web Consortium)发布XML 1.0,随后在2000年10月6日发布了XML 1.0(Second Edition),错误修正见http://www.w3.org/XML/xml-19980210-errata,2003年10月30日发布了XML 1.0(Third Edition),错误修正见http://www.w3.org/XML/xml-V10-2e-errata。为简单化SGML,XML重新定义了一些SGML的内部值和参数,并删去大量繁杂的、不常用的、使编程复杂的特征,内容见http://www.w3.org/TR/NOTE-sgml-xml-971215。其实XML是SGML的一个子集,它包含了很多SGML特性,继承了SGML的优点,但是要比SGML简单得多,比HTML更令编程人员喜爱。正是由于这些原因,XML的Internet应用大量涌现。如化学标记语言(Chemical Markup Language)、数学标记语言(Mathematical Markup Language)、同步的多媒体集成语言(Sychronized Multimedia Integration Language)、可伸缩的矢量图形(Scalable Vector Graphics)、矢量标记语言(Vector Markup Language)、音乐标记语言(Music ML)、语音朗读标记语言(Vox ML)、濒道定义格式(Channel Definition Format)等等。

2 XML的优点

XML和HTML都从属于SGML,但是XML是一种元标记语言。XML描述的是文档的结构和意义,而不描述页面元素的格式化,用户可以根据自己的需要定义标记来描述和创建文档,这样的文档结构严谨,层次分明,语义更加明确,更适合人类的阅读习惯和更便于计算机的查找、存档。例如,描述广东省气象局各处室科室的电话号码。通常人们用Microsoft Word描述的格式如下:

广东省气象局

电信台:

运行科电话:87754050

运行科Email:YXK@grmc.gov.cn

网络科电话:87625482

网络科Email:WLK@grmc.gov.cn

……

气象台:

短时科电话:87777786

短时科Email:DSK@grmc.gov.cn

短期科电话:87778667

短期科Email:DQK@grmc.gov.cn

……

如果改为用XML来描述,则为如下:

<广东省气象局>

<电信台>

<科室>

<名称>运行科

<电话>87754050

YXK@GRMC.GOV.CN

<科室>

<名称>网络科

<电话>87625482

WLK@GRMC.GOV.CN

……

比较上述两种文档,XML格式描述的结构和语义更加清晰明了,易于理解,并且XML文档是一种纯文本,非专有的格式,不受版权、专利等其他知识产权的限制,可以使用任意的编辑器进行编辑,可以显示在各种设备上。而用Word等其他专用编辑软件编辑的文档受到专有格式的限制,不利于数据交换,不利于计算机的查找。

XML和HTML相比,两者都支持统一字符编码协会(Unicode Consortium)制定的通用字符集(UCS-Universal Character Set),都支持层叠样式单(CSS-Cascading Style Sheets)外观输出;不同在于XML支持文档类型定义DTD(Document Type Definition),支持专有的可扩展的样式语言(XSL-Extenible Style Language),支持比HTML更为复杂的XLink和XPointer链接等。在信息交互方面,XML同样可以使用列表(有序olist和无序ulist)和表格(table)来组织和表示数据,创建表单(form)和XML数据库,通过“POST”方法将表单中的控件(文本框TEXT、口令框PASSWORD、复选框CHECK、单选框RADIO等)内容提交给服务器完成信息交互。

3 XML文档结构

以“广东省气象局各处室科室的电话号码”为例创建一个简单的结构完整的XML文档。如下:

Metelephone.xml

<广东省气象局>

<电信台>

<科室>

<名称>运行科

<电话>87754050

YXK@GRMC.GOV.CN

<科室>

<名称>网络科

WLK@GRMC.GOV.CN

Metelephone.dtd

Metelephone.xsl

xmlns="http://www.w3.org/TR/REC-html40"

result-ns="">

- 电话:
- EMAIL:

微软(Microsoft)IE5.0以上版本支持XML文档浏览。

4 结束语

随着因特网(Internet)的飞速发展,Web的应用也越来越广泛,超文本不仅用来传送文字信息,更多的是传送多媒体信息———图片、声音、视频、动画。XML的出现,为网络应用注入了强大的动力,它不仅具有良好的可读性、易编写和易维护等特性,而且使得多媒体信息在不同的系统之间相互交流成为现实。XML新的版本正在制定中,有关XML的详细资料请参阅国际互联网论坛W3C(World Wide Web Consortium)的主页http://www.w3.org。

摘要：XML全称EXtensible Markup Language,翻译为扩展的标记语言,是Internet环境中跨平台的,依赖于内容的技术,是当前处理结构化文档信息的有力工具。它与HTML一样,都是SGML(Standard Generalized Markup Language,标准通用标记语言)。比SGML简单得多,比HTML更令编程人员喜爱,它包含了很多SGML特性,继承了SGML的优点,文档结构严谨,层次分明,语义更加明确,具有良好的可读性、易编写和易维护等特性,而且使得多媒体信息在不同的系统之间相互交流成为现实。本文通过例子,简单介绍XML的使用,从中感受XML极其简单易于掌握和使用。

关键词：XML,历史发展,优点,文档结构,介绍

参考文献

[1]吴敏,丁永生,陈家训.XML的研究现状及展望[J].微型电脑应用,2001,17(4):5-9.

[2]李莉,吾守尔.斯拉木,缪成.XML在电子政务中的应用[J].计算机工程,2003,23(Z2):170-179.

[3]吴文辉,殷建平,姚丹霖.关系模式到XML模式的转换研究[J].计算机工程与科学,2004,30(18):165-167.

【可扩展公式化】推荐阅读：

可扩展设计05-28

可程式化11-05

意义扩展07-16

扩展算法07-16

扩展方法05-10

安全扩展05-24