工艺数据模型

2024-12-12

工艺数据模型(精选9篇)

工艺数据模型 篇1

电能是钢铁企业的主要生产能源之一[1], 随着对钢铁企业生产管理技术水平要求的提高, 负荷预测变得越来越重要。为了更好地对企业生产进行管理、预估企业经济效益[2], 需要对企业未来的日用电量进行准确预测。

针对钢铁企业的用电特点, 许多学者提出了大量新型电力负荷预测的方法。基于历史负荷的时序预测模型为有效预测负荷趋势提供了新的思路[3]。如减少电力负荷预测模型训练计算量的回声状态网络 ( ESN) , 广义卡尔曼滤波, 径向基神经网络 ( RBF) [4], 小波分析[5], 支持向量机[6]等。径向基神经网络, Elman网络, evolino神经网络, 回声状态网络对负荷数据采样精度较高的数据预测效果较好, 而对数据残缺或者样本受污染的数据预测效果不佳[7]。广义卡尔曼滤波虽然能够对“污染数据”进行去杂处理, 但处理过程较慢, 且需要大量内存空间。2007 年牛东晓提出了基于熵权法改善误差指标的组合预测模式, 用以避免单一预测模型拟合震荡剧烈, 伪周期性负荷波动的不足, 但是却忽略了生产工艺情况。建立基于数理统计的负荷预测方法虽能一定程度结合工艺生产状况, 但因描述此类负荷预测问题的非线性函数复杂, 模型求解困难, 推广受到一定限制。

为解决工业企业负荷数据失真, 不同工序段负荷震荡剧烈、波动较大等问题, 本文针对钢铁企业的实际日用电量预测问题, 在项目研究中提出了一种新方法在模型训练过程中, 以日生产实绩、检修计划和日用电量的历史记录作为训练样本, 采用NNLS, ESN, LS-SVM结合特征选择方法得到多个预测子模型。采用多个子模型输出的融合得到日用电量的择优预测值。经过大量的实验测试, 这一新方法可以得到较理想的预测效果, 确保算法的实用性与先进性。

1 日用电量特征分析

大型钢铁企业, 针对生产、检修等环节, 需要电量预测模型[8]。假设检修方案共有m种, 针对某检修日所对应的检修种类为Ti ( d) ; i ∈ { 1, 2, 3, …, m} 若特定的检修日未采用第i种检修方案, 则Ti ( d) 。检修日d的计划方案[9]约定为[T1 ( d) T2 ( d) T3 ( d) … Tm ( d) ]T。又假设企业共有n种产品 ( 包括中间产品) , 则对于检修日d , 产品的计划产量为Qj ( d) , j ∈ {1, 2, 3, …, n} , 则这一日的产量计划可以表示[Q1 ( d) Q2 ( d) Q3 ( d) …Qm ( d) ]T。

电量预测的输入特征选择问题, 是一个复杂的大规模组合优化问题[9], 采用前向的贪婪搜索算法 ( greedy search) 对生产, 检修计划, 进行特征选取。这种方法的思想实际上类似连续问题优化的最速下降方法, 对于有多个局部极小的问题来说, 很有可能使问题陷入局部极小。为避免进入局部极小, 当确定新的特征子集的时候, 首先进行所有测试子集的性能排序, 在性能较好的前k个子集中随机选择一个。

1. 1 特征选择

1. 1. 1 OO ( ordinal optimaztion) 方法

当确定新的特征子集的时候, 不是进行所有测试子集的性能的严格排序, 而是按照OO的思想, 进行粗略排序, 在前k个子集中选取最好一个。从而节省了计算时间。

1. 1. 2 随机近似贪婪搜索RAGS

其求解过程如图1 所示。这种改进的思想就是本项研究中所采用的随机近似贪婪搜RAGS ( ran-dom approxiated greedy search) 进行特征选取方法的基础。对未来一段时间 ( 如一个月) 的用电情况进行预测, 而日用电量预测的准确性至关重要, 预测日用电量就是要寻求各环节的生产量与用电量之间的关系, 并且在企业的日生产计划和检修计划中得到较好的反映。因此, 在能够得到检修计划和产量计划的前提下, 预测钢铁企业日用电量的过程就变成了寻找产量计划、检修计划与日用电量内部关系的过程。

1. 2 Bagging技术

由于RAGS方法并非全局收敛算法, 一般来说, 每次的运行结果均不相同, 也就是说可以得到多组的特征子集。如果能充分利用这些信息, 可以提高预测的稳定性和精度, 采用Bagging技术来进行多个模型的融合。训练之后可得到一个预测函数序列, 最终的预测函数对分类特征采用统计投票的方式进行判别。

2 基于生产检修计划的的多模型融合预测框架

在实际预测中, 某些输入因素可能会出现缺失或异常等情况, 一般来说解决的办法是采用某种措施进行数据的补齐或者校正。钢铁企业负荷预测框架要求能够适应这种情况, 在数据缺失的情况下, 继续能够利用现有信息、可用模型进行预测, 给出预测结果。为此提出了自适应数据质量的多模型择优预测框架。

2. 1 非负最小二乘

对于钢铁企业, 检修计划和产量计划一般提前一个月制定, 所以可以根据这些信息进行电量预测, 构造日用电量和检修计划、产量计划之间的线性回归表达式如下:

式 ( 1) 中: S ( d) 为日期d的日用电量, { a0a1a2…am +n} 为回归系数。若设

满足ai≥ 0 , i ∈ {0, 1, 2, 3, …, m, …, m + n} 。则式 ( 1) 可以表示为S ( d) = w ( d) Ta ( 3) 式 ( 3) 表示检修时间长度Ti ( d) 与用电量S ( d) 之间成反比例关系, 计划产量Qj ( d) 与用电量S ( d) 之间成正比例关系。

为了对回归系数a进行估计, 收集历史日用电量和相应的生产及检修计划, { ( w ( d) , S ( d) ) , d =1, 2, …, D} 其中D为样本集合的大小。回归系数a可以通过在样本集合上求解下面的优化问题得到

式 ( 4) 利用非负最小二乘问题 ( nonnegative leastsquares, NNLS) 进行求解。

2. 2 LS-SVM模型

提出一种根据生产计划和设备检修计划, 以LS-SVM函数估计算法的基本形式作为出发点, 通过适当的假设条件在LS-SVM框架下求解样本点, 然后再由LS-SVM函数估计算法对样本点进行求解, 在保证精度的前提下, 预估电量变化趋势的负荷预测方案。

对于给定的样本{xi, yi}; ( i = 1, 2, …, N) , 其中xi∈ R为输入数据 ( 即通过特征选择的择优生产, 检修数据) , yi∈ R为输出数据 ( 即日用电量实绩数据) 。LS-SVM的函数估计算法的目的就是得到一个y关于x的对应关系: y ( x) = ωTφ ( x) + b 。

在LS-SVM框架下, 将上述问题转化为求解如下优化问题

式 ( 5) 中 γ ∈ R+, b ∈ R, ω ∈ Rh, φ ( ·) : R → Rh是特征映射, h是特征空间的维数。建立如下拉格朗日函数

其中拉格朗日乘子 αi∈ R 。然后根据Karush-Kuhn-Tucker ( KKT) 优化条件得到如下等式

通过消去 ω 和ei, 整理得到如下方程组

其中1N= [1, 1, …, 1]T∈RN, α = [α1, α2…, αN]T∈ RN, y = [y1, y2…, yN]T∈ RN, IN是单位矩阵。

Ω ∈ RN ×N为满足Mercer条件的核函数矩阵, 其中 Ωij= Ω ( i, j) = K ( xi, xj) = φ ( xi) Tφ ( xj) 。

通过求解方程组得到 α 和b , 进而求得 ω , 从而得到函数估计表达式

K ( x, y) = φ ( x) Tφ ( y) 为核函数, 下面对其偏导数进行定义

本文中选取高斯径向基核函数 ( RBF) , 即

2. 3 ESN时序预测建模方法

ESN是一种新型的递归神经网络结构, 其内部有一个大的动态储备池 ( dynamical reservoir, DR) , 非线性系统的动态特性由DR产生。DR包含大量随机生成且稀疏连接的神经元。应用时间序列预测的思想, 建立钢铁企业日用电量回声状态网络 ( ESN) 时间序列预测模型, 从而预测出未来时刻数据变化的趋势[11]。采用的方法是首先建立ESN单步预测器, 然后经过多次迭代操作实现对不同预测时域的预测[12]。算法实现如下: 假设当前为第t0天, 该日用电量表示为s ( t0) , 当前时刻前一天的用电量表示为s ( t0- 1) , 从当前时刻起向前取500 个受入量的值形成500 对训练样本{ [u (1) , y (1) ], …, [u (500) , y (500) ]} 。

模型参数如下表1。

ESN时序预测思路如下:

Step1 初始化储备池DR, 即确定Win、W 、Wback, 使网络具有回声特性;

Step2 将经过特征选择的特征样本代入训练网络, 网络更新采用公式 ( 8) 和式 ( 9) ;

Step3 选择T0 ( T0< T) 作为网络初始化时间, 收集T0- T时刻教师输入状态向量和储备池中神经元状态向量和储备神经元状态向量[u ( n) , x ( n) ]形成状态矩阵M[13];

Step4 利用公式 (Wout) T= M-1T , 计算输出权值矩阵, 利用该模型, 输入u ( 1001) = [s ( t0- 99) s ( t0- 98) … s ( t0) ]T, 采用网络更新公式 ( 8) 和式 ( 9) , 可以预测出t0+ 1 时刻的发生量y ( 1001) =s ( t0+ 1) 。获得新的样本序列, 利用这组数据样本序列采用和上面相同的方法[14], 可以获得t0+ 2 时刻的日用电量预测信息。

2. 4 自适应数据质量的多模型择优预测框架

采用上文所示的输入变量特征选择和预测模型分析, 钢铁企业用电预测采用多择优预测框架进行预测, 其预测过程如下:

Step1 基于RAGS对输入样本进行特征选择;

Step2采用交叉验证选择较好的特征子集;

Step3 分别采用NNLS, ESN网络, LS-SVM模型对电量消耗进行预测, 给出预测结果;

Step4 本文在所得到的所有可进行预测的模型中, 采用“前一日预测效果最好”的择优准则进行模型择优, 日用电量负荷预测整体框架图如图2 所示;

Step5 设置一个预测误差限值, 一旦误差越限, 就提示模型需要更新;

Step6 检测预测误差变化趋势, 如果误差随着预测时间的推移, 持续变大, 则提示更新模型。

3 仿真实例分析

从前面的分析可知, 系统得到负荷预测值可以有多种方案。这就需要在这些结果中选择最优的预测结果, 作为最终输出结果。通过这种方式, 系统的预测精度得到进一步的提高。在这种情况下, 对多个方案预测结果的择优判据尤为重要。通过调研发现, 钢铁企业的负荷值在相邻时间内的相关性较大, 所以, 采用对于预测方案的预测历史精度进行评价, 采用在最近的预测周期内预测精度最高的预测方案, 作为当前预测周期采用的预测方案。具体来说, 对预测系统中的模型, 在预测出指定时段的同时, 预测出与指定的起始日期间隔一天的前n天的负荷值, n为正整数。由于前n天的实际负荷值已经可以得到, 所以通过计算前n天的误差指标即可作为择优判据。通过n取不同的值, 可得不同的择优判据。

下面通过例子来检验各择优判据的择优效果。算例的预测时间2013 年4 月1 日~ 2013 年5 月1日。其中, 总负荷的预测值由表2 中列出的各方案得到, 共6 种方案。表3 列出当前的择优判据:

为验证本文所建立电力负荷预测模型的实用性, 分别采用经典SVM, 非负最小二乘, 及ESN网络与本文所提方案进行对比预测分析, 选择2013 年1月1 日~ 5 月30 日的生产, 检修计划, 日用电数据作为训练样本, 以2013 年6 月1 日~6 月15 日的生产, 检修计划作为输入信号。仿真效果拟选用三种评价准则进行综合分析, 评价公式如下 ( 1) 平均绝对百分比误差:

( 2) 归一化均方根误差

( 3) 均方误差

式中yreal ( i) 表征负荷验证真实数据, ypre ( i) 为预测点, q表征负荷预测天数, 不同模型预测效果见表4。

由表4 预测对比结果可知, 本文提出的自适应数据质量的多模型择优预测对宝钢电力系统进行日用电量预测时, 不同的评价准则的预测效果均优于其他几种模型。ESN虽然输出波动不大, 但预测精度不高, 原因可能是由于其网络结构固定, 性能易受储备池神经元选择影响。径向基网络因为其学习过程易形成局部极值点, 因此导致模型预测效果不够理想。SVM模型输出波动最大, 性能易受核函数选择影响, 预测精度最低, 但运算速度上具有明显优势 ( 0. 309 11 s) , 且适合于小样本处理 ( 数据点数小于4 000) 。

表5 列出在10 月1 日~10 月15 日预测结果上做出的择优方案序列以及性能评价。其中, 性能评价采用的有三个指标: 平均绝对百分误差 ( MAPE) 、平均绝对百分误差的标准差、平均绝对百分误差的最大值。

通过表5 可以发现: 以择优判据1 作为判据得到的性能指标最佳。同时, 注意到被选中的方案大都在方案4 ~6 中, 这说明对大冲击负荷采用择优方案的智能算法建模要优于常规时序模型对总负荷建模的预测方案。

4 结论

( 1) 自适应数据质量的多模型择优预测框架进行电力日负荷预测的误差是3. 644 0%, 远搞于采用单一预测模型的预测精度。

( 2) 采用样本交叉融合, 提高样本特征的泛化性能。

( 3) 随机近似贪婪搜索RAGS对生产, 检修因素进行特征选择, 有效降低了模型复杂度, 缩短了预测时间, 提高了模型的工程实用性。

( 4) 选择前一日的负荷预测效果作为择优判据的预测精度更高, 效果更理想, 可以有效解决多模型择优的模型选择问题, 该模型对其他大型工业企业的用电预测也具有参考意义。

工艺数据模型 篇2

课程编码:模型制作与工艺 课程性质:专业课程 适用专业:产品设计 学

分:6学分

时:108学时(理论教学30学时,实践教学78学时)开设学期:第6学期

一、教学目的

该课程主要培养学生的动手能力和解决问题的能力,也是验证设计和训练设计思维的一种手段,培养学生在平面(图纸)与具体塑形之间转换的理解力,使学生通过直接的操作对空间体量、成型工艺、材质、比例、色彩与产品的关系有直观、亲切的体会。

本课程以设计技能实践教学的为主旨,以产品模型制作工艺为重点。要求学生学习产品设计中模型的作用,模型制作有关材料的选用,加工工艺,以及模型的检测评价与安全防范等知识。着重要求学生关注产品模型的制作材料、制作工艺技法及相关的各种问题(如常用工具、表面装饰)等。

二、教学重点与难点

1.重点:产品模型的制作是产品造型设计的主要表现手段之一.它是以立体的形态表达特定的创意,以实体的形体、线条、体量、材质、色彩等元素表现设计思想,使设计思想转化为可视觉化和触觉化的接近真实的产品设计方案。产品模型的制作由于视觉实体的可视化,可以进行评估与反复推敲,因此也是进一步完善和优化设计的过程。在教学过程中它的重点是对造型形态的塑造和创造,通过具体的造型、材质、肌理来模拟表现设计方案的最终效果。

2.难点:模型制作与工艺是对未来将要生产的产品进行真实的模拟。所以可以对生产过程中模拟真实产品的各个方面进行检测。检测的目的是看设计是否达到最初的概念.是否符合使用要求与市场潜力,同时还要看是否符合生产工艺等。一般模型制作的难点主要有以下几个方面:产品的人机关系及机能的检测:三维形态美感的检测:生产技术工艺的检测:影响产品设计的其他相关因素的检测等。

三、教学方法建议

在产品设计模型实验教学中,建议采用多媒体课件演示——教师实际操作——机器设备制作的三位一体教学模式。

1.多媒体课件演示将让学生全面了解各种制作工具,主要材料的全部制作工艺过程。

2.教师实际操作主要给学生演示某种材料的手工制作过程,让学生掌握产品模型手工制作的能力。

3.机器设备制作让学生了解新引进的先进设备的使用方法与制造技术。

四、教学内容

第1章 产品模型概述(4学时)

教学要求:重点了解产品模型的概念,分类,特点等理论知识。

第一节 产品立体造型的准确性与感知性 第二节 产品模型的特点及作用 第三节 产品模型的分类 第四节 产品材料的选择与使用

第2章 产品模型的制作工艺(10学时)

教学要求:了解产品模型制作方法、步骤、和制作原则。熟悉产品模型制作的基本工具。

第一节 产品模型的平面与立体设计能力 第二节 产品模型制作的方法 第三节 模型制作步骤

第四节 产品模型制作的常用工具 第五节 产品模型制作的原则

第3章

塑料材料在模型制作中的运用(10学时)

教学要求:要求学生熟悉了解模型制作材料中塑料材质的种类和制作过程。分析 ABs 材料和泡沫塑料制作的案例,并由学生分组讨论其成功之处和存在的缺点和不足。

第一节 塑料的种类 第二节 模型制作常用的塑料

第三节 ABs材料台灯模型的制作案例 第四节 ABs材料手机模型的制作案例 第五节 泡沫塑料电熨斗模型制作案例

第4章 黏土、油泥材料在模型制作中的运用(10学时)

教学要求:要求学生熟悉了解模型制作材料中黏土、油泥材料的种类和制作过程。分析黏土、油泥材料制作的案例,并由学生分组讨论其成功之处和存在的缺点和不足。

第一节 黏土、油泥材料的特性与成型 第二节 黏土、油泥模型的制作工艺 第三节 黏土、油泥模型的制作工具及设备 第四节 汽车油泥模型的制作案例

第5章 石膏材料在模型制作中的运用(10学时)

教学要求:要求学生熟悉了解模型制作材料中石膏材料的种类和制作过程。分析石膏材料制作的案例,并由学生分组讨论其成功之处和存在的缺点和不足。

第一节 石膏材料的构成与特性 第二节 石膏模型的成型工艺 第三节 水壶石膏模型制作案例

第6章 玻璃钢材料在模型制作中的运用(10学时)

教学要求:要求学生熟悉了解模型制作材料中玻璃钢材料的种类和制作过程。分析玻璃钢材料制作的案例,并由学生分组讨论其成功之处和存在的缺点和不足。

第一节 玻璃钢的分类与特性 第二节 玻璃钢模型成型工艺 第三节 安全帽玻璃钢模型制作案

第7章 木质材料在模型制作中的运用(10学时)

教学要求:要求学生熟悉了解模型制作材料中木质材料的种类和制作过程。分析木质材料制作的案例,并由学生分组讨论其成功之处和存在的缺点和不足。

第一节 木材的性能与种类

第二节 木材在模型中的运用 第三节 木材首饰盒模型制作案例

第8章 金属材料在模型制作中的运用(10学时)

教学要求:要求学生熟悉了解模型制作材料中金属材料的种类和制作过程。分析金属材料制作的案例,并由学生分组讨论其成功之处和存在的缺点和不足。

第一节 模型用金属材料的种类

第二节 金属模型的制作工艺 第三节 金属皱褶花瓶模型制作案

第9章 纸质材料在模型制作中的运用(10学时)

教学要求:要求学生熟悉了解模型制作材料中纸质材料的种类和制作过程。分析纸质材料制作的案例,并由学生分组讨论其成功之处和存在的缺点和不足。

第一节 纸质材料的种类与特性

第二节 纸质造型加工工具 第三节 纸质形态的基本生成方法 第四节 纸质模型制作过程与方法 第五节 瓦楞纸坐具模型设计与制作方案

第10章 产品模型欣赏(10学时)

教学要求:分析成功的案例和作品,从产品模型制作最基本的方法入手,结合具体的实例详细地介绍了各种制作方法和特点,作品内容全面丰富,通过具体案例的过程步骤详尽地阐述了产品模型常用的各种材料以及制作方法。

五、其他教学环节

1.实践[内容:在指导学生进行某种材料的模型制作过程中,要求学生进行多方案设计,从中选择最优方案,改变了过去单一设计的教学方法。在进行方案选择时,突出强调产品模型的创新意识和实用价值。目的:培养学生的创新能力和与生产实践接轨的意识,为今后学生走上工作岗位奠定基础。] 2.作业:要求学生针对每个不同材料完成产品模型制作。学生作品完成后,老师要组织讲评,分析每一个作品的优缺点。这时教师鼓励学生也参与到讲评中,对自己和别人的作品表达看法,发表评论,形成一种互动式教学气氛。由于学生在设计和制作模型时,都有自己独特的设计理念和不同的制作方法,因此教师和 4

其他同学的评论、建议,将使被讲评的同学有很多收获,在设计思想和制作能力上都有一个较大幅度的提升,丰富了专业知识面。

六、考核要求

本课程的考试均采用教研室教师集体打成绩的办法,即平时考勤和上课表现(40%)以及期末考试成绩(60%),考核成绩为百分制。

考核该课程是从上课之日起至课程结束。

七、选用教材

《产品模型制作》,江波,王宇欣主编(著),广西美术出版社,2011年版。

八、参考书目

1.《产品模型制作》,谢大康主编(著),化学工业出版社,2006年版。2.《产品模型制作》,陶裕仿主编(著),东南大学出版社,2010年版。3.《产品模型制作》,江湘芸主编(著),北京理工大学出版社,2005年版。4.《图解产品设计模型制作》,高雨辰 兰玉琪主编(著),中国建筑工业出版社,2011年版。

5.《设计 触摸 体验·产品设计模型制作基础》,潘荣,高筠,梁学勇主编(著),中国建筑工业出版社,2009年版。

执笔人:杨青 审核人:杨青 审定人:杨青 时

工艺数据模型 篇3

一、引言

三维设计软件 NX和数据管理平台 Teamcenter在以航空、船舶为代表的国内大型装备制造企业中得到了广泛的应用,实现了产品数字化设计及管理。但是当产品从设计阶段延伸到工艺阶段时却出现了三维数据传递的“断层”,在工艺系统中基于三维产品模型应用等方面还很薄弱。现有的工艺模式仍然采用二维图纸和传统工艺文件的方式进行,无法满足三维环境下工艺工作的要求。目前,工艺工作中面临的问题如下。

(1)工艺设计没有直观的产品和资源表现形式,工艺设计人员依据二维图纸去理解产品的装配关系及工装的使用方式,并构想产品的装配顺序,整个过程耗费时间,且容易出现歧义。

(2)工艺数据表达手段单一,目前工艺输出结果以二维工艺卡片为主,不能充分应用上游的三维设计数据,很难对复杂结构和过程进行清晰、直观地表达,不利于操作者快速理解产品的装配过程。

(3)工艺人员在工艺编制过程中根据生产要求提出的工装需求,只能在实际生产中验证工装的可行性和合理性,如果在虚拟环境中验证工装的可行性和合理性,能够有效避免工装返工和修改,提高工装设计效率和质量。

针对以上问题,开展数字化装配工艺应用模式研究,构建基于三维模型的装配工艺设计系统,实现三维设计、工艺数据的完整搭接,为最终实现数字化装配工艺奠定基础。

二、技术路线

基于三维模型的装配工艺设计系统的总体技术路线如图 1所示。实现途径如下。

(1)从 Teamcenter系统中获取设计 BOM及产品三维模型,进行装配结构的可视化调整,形成工艺 BOM,根据工艺BOM进行工艺分工,确定各个部件所属的装配部门,最后输出 PBOM和分单位目录。

(2)工艺编制人员接收任务后制定工艺流程顺序,确定产品在装配过程中所需的装配工序,形成装配工艺流程;进行装配工艺的详细设计,指定各个装配工序所需要的零组件、制造资源 (工装、夹具 )等信息。

(3)工艺人员根据装配工艺要求,进行装配路径规划,对装配工艺设计进行仿真验证,确保装配工艺设计的可行性和合理性,并输出相应的仿真图片、仿真动画信息。

(4)将装配工艺设计、装配工艺仿真产生的结果通过工艺卡片、包含三维模型信息的 PDF文件以及 AVI格式的视频动画等方式输出,以指导现场生产。

(5)三维装配工艺设计系统产生的结果信息存储在 Teamcenter系统,生产现场通过制造执行系统与Teamcenter系统的接口获取相应的工艺数据用于指导生产。

三、基于三维模型的装配工艺规划

1.装配工艺性审查

在产品设计阶段,工艺人员应用三维装配工艺设计系统进行工艺审查,检查产品的可装配性。当主管提出合理化建议时,通过批阅的形式反馈到设计人员,达到工艺提前介入的目的,提高产品的工程化水平。

2.构建PBOM

通过集成接口读取 Teamcenter系统中的 EBOM及相应的产品轻量化模型。根据产品的结构特点和装配关系,在可视化环境中方便地调整装配零组件组成结构、设置工艺组件、完善零组件的工艺信息,最终形成完整的PBOM。

3.工艺分工

通过三维工艺设计系统,直接在三维环境中从产品树上选取零组件分配到相应生产部门。系统能够自动识别零组件的分配状态,未分配的零组件和分配后的零组件分别以不同的方式显示,避免零组件漏分而引起工艺错误。

四、基于三维模型的装配工艺设计

1.任务分工

生产分厂接到生产任务后,主管工艺人员根据实际情况进行装配单元的分解,并且能对组件的组成进行调整,将本部门承担的任务进一步分解为更小的装配单元,并指定具体的负责人编制装配工艺。系统能够方便、快捷地输出任务分工表。任务分工完成后进行零组件遗漏检查,确保任务分工的完整性和正确性。

2.制定工艺路线

工艺编制人员接收任务后在三维环境下制定工艺流程,确定产品的装配工序,形成装配工艺路线卡,并可指定装配工位等。

3.详细工序设计

工艺编制人员在三维环境下指定本工序零部件、工装和设备,并填写工艺内容。工序设计完成后,零部件、工装和设备信息自动汇总,填入相关的汇总表中,并进行零组件遗漏检查,确保产品装配的正确性和完整性。

装配工艺设计完成后形成装配过程信息树,如图 2所示,包含具有顺序关系的各个装配工序以及对应的装配件和装配资源。

五、基于三维模型的装配工艺仿真

完成装配工艺设计后,所有的装配所需要的资源信息已经具备,进行装配过程的仿真工作。在虚拟环境中验证零组件的装配过程,确定合理的装配顺序,避免发生因装配顺序不正确而出现的无装配通路的情况,并且能够优化装配流程,得到最适合的装配顺序。装配过程仿真的主要内容如下。

1.装配路径设计

根据工艺路线的要求,在三维虚拟装配环境中通过手动交互式的操作待装配的零组件,规划每道工序中装配件的装配顺序来得到的零组件的装配路径,如图 3所示。在保证零组件装配的合理性的前提下,制定正确的装配路径。

2.装配路径仿真

装配路径仿真主要包含以下内容。

(1)根据生产的实际要求对装配过程进行模拟,以保证装配路径的可行性,最终通过验证零部件的装配顺序、装配路和装配操作姿态等数据的合理性,装配所需要的工装、工具等的可达性,以及装配操作空间的敞开性。

nlc202309042035

(2)装配路径动态分析,工艺人员根据装配路径动态的分析情况,动态的调整零组件的装配顺序、装配的优先级,重要特性的保障措施等,从而优化产品的装配过程,达到验证产品的装配工艺性,完善工艺设计的目的。

3.装配干涉检查

在装配移动过程中实时进行干涉检查,检查装配件、工装在装配过程中是否和其它装配件或装配资源发生干涉。模拟零组件在装配过程中实际可能发生的问题,帮助用户分析装配过程并检测可能产生的错误。当遇到干涉和失调时能够及时停止仿真,并且能够在装配过程中标注和修改出现的问题。

通过装配过程仿真,定位影响装配整体效能的关键装配环节,并对不同的改进方案进行实时分析、比较以及优化,建立局部和整体相结合的持续性优化机制,形成相对最优的工艺方案。

六、装配工艺的输出及管理

1.装配工艺输出

工艺人员在系统中完成了全部的工艺工作,并通过仿真验证装配工艺过程的准确性,最终得到优化后的工艺设计的结果。这些结果能够通过工艺卡片、在线交互工艺、包含三维模型信息的 PDF(3D PDF)文件以及 AVI格式的视频动画等方式输出,如图 4所示。最终以视频或电子文档形式发布到生产现场,从而指导现场工人准确、快速的进行装夹、装配、拆卸和维护等。

2.装配工艺的管理

最终形成的装配工艺等资源信息存储在 Teamcenter系统中,由 Teamcenter系统完成三维装配工艺变更过程的控制,包括工艺版本的控制、审批流程的驱动、工艺更改以及工艺升版的控制等。

七、实现意义

通过开展基于三维模型的装配工艺研究,实现意义如下。

(1)构建基于三维设计模型的装配工艺设计体系以适应 MBD环境下开展工艺工作,改变以二维图纸为主的传统工艺设计;以产品三维设计模型为基础,通过构造数字化的工艺设计与仿真环境,形成快速的装配工艺设计、装配工艺仿真及验证能力。

(2)建立三维工艺文件表达及管理模式,满足工艺文件审批、有效性管理以及现场应用等方面的需求,基于三维设计模型构建面向生产现场的工艺,丰富工艺展现形式,提高工艺指导生产的能力。

(3)一方面对产品的设计结果进行验证,实现面向装配的设计;另一方面实现基于虚拟现实的装配工艺设计,通过建立三维可视化的虚拟环境,检验产品装配工艺性,从而指导实际装配生产。

(4)将装配工艺设计与产品结构设计紧密结合,装配工艺设计能够在产品设计过程中同步开展,在产品实物到达装配现场前直观的开展工艺设计工作,充分体现并行工程的设计思想。

(5)将装配工艺设计与工装设计紧密结合。由于结构设计阶段未能充分考虑批产装配工装,往往到装配环节时设计工装夹具,影响装配进度。应用装配仿真技术将产品模型、工装夹具模型导入到虚拟环境中,进行零组件与工装之间的干涉检查,提高工装设计的效率和质量。

(6)装配工艺仿真的过程能够以动画的方式输出,包括零部件的装配顺序、装配路径、操作过程的动画演示以及所需的工装夹具和辅料等,使装配人员更清晰、更快速地理解装配意图,避免因对装配工艺的理解岐义造成错装、漏装等现象的发生。

工艺数据模型 篇4

我国国家基础地理信息数据库中, 1:10000数字高程模型数据成果格网尺寸为5m。为了更精细地反映地形特征, 以满足地理国情分析统计和其他相关应用的需要, 地理国情普查中充分发挥现有1:10000数字高程模型相关数据源的作用, 进一步细化生成多尺度数字高程模型数据, 基于1:10000数据源, 数字高程模型的格网尺寸统一细化为2m。

1 数学基础

(1) 大地基准:2000国家大地坐标系。

高程基准:1985国家高程基准, 高程单位为“米”。

投影与分带:采用高斯-克吕格投影, 3°分带, 坐标单位为“米”。

(2) 空间单元及编号

按照GB/T 13989-2012《国家基本比例尺地形图分幅和编号》执行。

(3) 格网间距

格网间距为2m, 格网间距在X、Y轴方向的分辨率应一致。

DEM数据不加带号。

(4) 起止格网点确定

起止格网中心点的坐标应根据四个图廓点坐标进行计算, 公式为:

式中:

X1, Y1, …, X4, Y4为四个图廓坐标 (+X指北, +Y指东) , 单位为米;XMAX, YMIN为DEM起始格网中心点坐标, 单位为米;

XMIN, YMAX为DEM终止格网中心点坐标, 单位为米;

△d为格网间距。

(5) 有效高程数据范围

(1) 以2000国家大地坐标系理论内图廓线的外接矩形为界的范围内所有DEM高程皆有效。

(2) DEM的范围根据起止格网点计算公式所计算的结果再向四周增加三行三列高程格网点, 便于DEM拼接以及带间接边处理。

(3) DEM数据接边区域所有同名格网点高程值应保持一致。

(6) 高程精度

本测区地貌复杂, 包含平地、丘陵地、山地、高山地, 精细化DEM高程精度的指标和要求按表1规定的限差执行。森林覆盖等隐蔽地区、沙漠地区的高程中误差可按表中规定的高程中误差的1.5倍计。采样点数据最大误差为高程中误差的两倍。高程值取位保留1位小数。具体见表1。

2 基于已有DEM的作业流程

对已有1:10000 DEM数据进行整合处理, 统一坐标系统和投影方式, 处理高程异常值, 按2m格网进行重采样, 并进行拼接与裁剪, 采用高精度检测点检查, 生成符合要求的成果数据。生产作业流程如图2所示。

3 存在的主要问题及解决办法

(1) 原始DEM中高程点错误问题及处理

在对原始资料分析过程中, 发现原始DEM数据中存在局部高程与相邻像素相差较大且与原始DLG数据矛盾的情况。

针对此类情况的处理办法:使用开发室修改高程工具, 对重采样后的DEM进行内插等高线方法调整处理。

(2) 数据跨带处理

首先将栅格数据定义到它本身的坐标系, 如要将26带的数据投影到25带, 先将数据定义到26带, 其次, 将定义后的数据投影到目标带上。

(3) 等高线穿过水面问题处理

选取1:10000 DLG数据源中面积大于400m2的静止水域, 如湖泊、水库、池塘等。当水域内等高线根数在2根 (含2根) 以内的, 根据相邻等高线或高程点估读其水涯线高程做水平处理;当水域内等高线根数在3根 (含3根) 以上的, 没有做水平处理。

(4) DEM检测点数目不够的处理

当DEM图幅检测点不满足28个点时 (一幅图) , 我院的处理方法是不足数目检测点图幅要从高程点中提取检测点。

检测点高程与DEM高程相差较大时, 应首先分析检测点情况, 若检测点在房顶、围墙顶、土包、小草丘等位置时, 应按照刺点片所描述将其高程移至地面;若检测点为未参与定向的加密点, 在保证图内至少4个检测点的前提下, 可将其删除, 不做为检测点;其余情况, 可以该检测点为中心, 对一定范围内的DEM格网点进行过渡调整。有高程错误的点, 根据周围DEM高程内插解决。

(5) 高程精度检查问题

因本测区地形复杂, 高精度的控制点和加密点稀少且不均匀, 无法满足一幅图4个高精度检测点。故均匀提取DLG数据高程点参与高程精度检查。

(6) 在检测点整理软件使用时, 拆分数据出现错误日至, 但还是可以拆分的处理方法:

检测点拆分可以不用整理软件拆分, 后期检测时4DCHECKER可以解决这类问题;在本项目的作业中, 利用先进的生产设备, 最前沿的作业技术进行生产。通过自身作业的经验, 利用作业人员的长处, 在Arc GIS软件中, 并嵌入自编的程序, 开创了一个全新的作业流程, 大大提高了作业速度和作业质量。

3 引用文件

(1) GB/T 17798-1999《地球空间数据交换格式》

(2) GB/T 13989-2012《国家基本比例尺地形图分幅和编号》

(3) CH/T 1015.2-2007《基础地理信息数字产品1∶10000 1∶50000生产技术规程第2部分:数字高程模型 (DEM) 》。

参考文献

从类模型到数据模型 篇5

在为系统建立数据库之前, 首先要对数据库进行总体设计, 设计过程产生的结果就是数据模型。

数据模型主要包含数据表以及数据表之间的关系。用面向对象方法建立数据模型, 依据是类模型。从类模型建立数据模型, 主要工作是:依次将类映射到数据表、将类属性映射到数据表的列、将类之间的关联映射到关系数据库, 最后将得到的数据表、表之间的关系画在一张图上, 数据模型便大功告成。

1 设计方法

数据模型从层次上可以分为3类:概念数据模型、逻辑数据模型和物理数据模型。

概念数据模型是面向用户、面向现实世界的数据模型, 与数据库管理系统 (DBMS) 无关;逻辑数据模型反映了DBMS的存储结构, 是用户从数据库看到的数据模型;物理数据模型是特定的DBMS, 它定义实际中的数据如何存储在持久存储设备 (例如磁盘) 上。

项目实例要设计的数据模型是逻辑数据模型。本讲座后面提到的数据模型, 除特别说明外, 均指逻辑数据模型。

用传统方法设计数据模型, 依据是ER图。用面向对象方法设计数据模型, 除依据UML类图外, 其他与用传统方法设计数据模型差别不大。

1.1 UML中的实体与E-R图中的实体

目前, 传统的数据库设计是采用实体-关系E-R (EntutyRelationship) 图。E-R图中的实体表示系统中持久的元素。UML中的实体除表示系统中持久的元素外, 还具有行为特性———操作。因此, 可以认为, UML中的实体是E-R图中的实体所提供的内容的超集。

1.2 UML类图与E-R图

由上述1可知, UML类模型的描述功能更强, 它在本质上是扩展的实体-关系 (E-R) 模型。

1.3 建模依据

由上述1.2可知, 将UML类图转换为数据模型是很方便的, 可以用类图为数据库中持久存在的数据结构建立模型。

1.4 选择数据库系统

持久性数据库层可以是关系型的数据库, 也可以是对象关系型的数据库或者对象数据库。从关系型数据库技术到对象数据库技术是一个演化过程, 对象关系数据库技术是这个演化过程的中间阶段。尽管未来将属于对象数据库, 但关系型数据库在目前的数据库软件市场中仍占主流。因此, 仍为项目实例选择关系型数据库作为持久性数据库层的数据库管理系统。

对于关系数据库来说, 可以用类图描述数据库模式 (Database Schema) , 用类描述数据表, 用类的操作描述触发器和存储过程。将UML类图用于数据库建模可以看作是类图具体应用的一个例子。

2 关系数据库术语

前面选择关系型数据库为项目实例建立数据模型。在建模过程中要涉及关系数据库的几个术语, 本节对这几个术语进行介绍。

2.1 主键和外键

主键和外键涉及关系表。关系表是由它的固定列集定义的, 列具有系统内建的或用户定义的数据类型。表可以有任意多行, 但没有重复的行。特定行的值可以是NULL, NULL意味着“值目前不知道”或“值不明确”, NULL值不等同于零或空格。

由于关系数据模型要求“没有重复的行”, 所以每个表都有一个主键 (Primary Key) 。键是列值可以用来唯一地标识表中一行的列的最小集合 (也可能只有一列) 。一个表可以有多个这样的键, 可以任意选择其中一个作为用户最重要的主键, 其他的键则称为备用键 (Alternate Keys) 。

2.2 参照完整性

在关系数据库中, 表之间的关系不是固定的行到行的连接, 而是当用户请求系统发现关系时, 才去发现行到行的连接。这种发现是通过比较一个表的主键值与另一个表的外键值来实现的。外键 (Foreign Key) 被定义为表中列的集合, 其值或者为NULL, 或者匹配同一个表或另一个表中的主键值。主、外键的一致性被称作参照完整性。参照完整性中的主键和外键必须是同一种数据类型, 但可以有不同的名字。

2.3 范式

在关系数据库中, 表与表之间的关系要满足一定的条件, 不同的范式 (Normal Forms) 指的是满足不同级别条件的关系。范式被分为6种:

(1) 第一范式

(2) 第二范式

(3) 第三范式

(4) BC范式 (Boyce-Codd范式)

(5) 第四范式

(6) 第五范式

第一范式是满足最基本条件的关系, 而这个最基本条件是指表的每个列都是不可再分的数据项。对于第一范式, 如果它又继续满足一定的条件, 就称它属于第二范式。以此类推, 可以得到其他规范程度更高的形式。高一级的范式是低一级的范式的子集, 低一级的范式则包含了高一级的范式。

3 类之间多重性向关系数据库转换的规则

数据模型是通过将关联映射到关系数据库来建立的。

在将关联映射到关系数据库之前, 首先介绍一下由关联的多重性向关系数据库转换的一些规则。

类之间的多重性可以分为:一对一、一对多和多对多3种情况。对3种多重性的处理已经有一些一般的转换规则, 如表1所示。

4 设计数据模型

如前所述, 数据模型是通过将关联映射到关系数据库来建立的。现在按照前几节介绍的方法或原则, 再依据第二讲设计的结果, 为系统设计数据模型。

4.1 将类映射为关系数据表

将类映射为关系数据表, 必须遵循表的第一范式, 列必须是不可再分的数据项。

从类到表的映射可以是一对一, 即一个类映射为一个表。但是, 一对一映射可能会导致一些问题, 如表太多、连接太多、表丢失以及对泛化关系处理不合理等, 在设计中要灵活调整。

第二讲1节2小节为本项目实例已经定义了3个类。这里将3个类分别映射为一个关系数据表。表的名称以T_打头, 其后紧跟相应的类的名称, 如表2所示。

4.2 将类的属性映射为表的列

第二讲4节已经为3个类分别定义了属性, 现在将类的属性映射为表的列。

4.2.1 项目信息表T_Project

项目信息表T_Project用于保存项目的信息。T_Project除了包含由Project类属性映射的列:项目大类、项目小类、项目经费、已报销金额、报销部门和报销人, 还要插入一个主键项目号。此外, 公司财务室还要求每个项目应有一个备注, 用于保存项目的文字描述信息。这样, 表T_Project包含的列如表3所示。

4.2.2 票据信息表T_Invoice

票据信息表T_Invoice用于保存票据的信息。

在表T_Invoice中, 由Invoice类属性映射的列有:供应商、报销内容、报销金额、报销时间、报销人、付款方式、是否附合同、是否附通知、凭证号和票据张数。其中“报销内容”公司财务室要求有大类、小类之分, 因此将列“报销内容”拆分为“报销内容大类”和“报销内容小类”两列。为了区分票据的不同状态, 还要增加一列“状态”。其次, 插入一个主键票据号。最后, 考虑到表T_Project与T_Invoice的关系, 再插入一个外键“项目号”以与表T_Project中的主键“项目号”匹配。这样, 表T_Invoice包含的列如表4所示。

4.2.3 用户信息表T_User

用户信息表T_User用于保存用户的注册信息。

表T_User包含由User类属性映射的列:账户、姓名、权限、部门和密码。其中账户对每一用户都是唯一的, 可以作为主键。这样, 表T_User包含的列如表5所示。

4.3 将关联映射到关系数据库

从第二讲2、3节知道, 3个类中包含两种类与类之间的关系。这两种关系都是关联关系。下面分别分析这两种关系向关系数据库的转换。

(1) Project与Invoice之间关系的转换

Project类与Invoice类之间存在着一到0或多的双向关联。在表T_Project和T_Invoice中, 可以通过表T_Invoice中外键“f7” (项目号) 匹配表T_Project中的主键“f0” (项目号) 来模拟类Project与Invoice之间的关系。

(2) Project与User之间关系的转换

Project类与User类之间存在着0或多到一或多的双向关联。

从表1看到, 对于类之间多对多关系向关系数据库转换, 是通过创建另外一个交叉表来解决的。这里采取一种变通的办法来处理:不增加交叉表, 而在表T_Project中的列“f5” (报销人) 中保存多个报销人的账户, 每个账户用空格‘’隔开。这样处理后, 虽然为编码增加了一点负担, 但是减少了存储空间。

⒋4数据模型

归纳以上设计结果, 可以得到系统的数据模型如图1所示。

5 结语

在传统方法中创建数据模型的依据是实体-关系 (E-R) 模型。在面向对象方法中, 创建数据模型的依据是类模型。类模型在本质上是扩展的实体-关系 (E-R) 模型。

将类模型映射到数据模型时, 要处理两种映射:由类映射到表 (包括由类属性映射到表的列) , 将关联映射到关系数据库。

为项目实例建立的数据模型表很简单, 只包含3个数据表。

回顾前面的工作, 会有两点缺憾:

(1) 在处理类Project与User之间多对多关系的转换时, 没有创建另外一个交叉表, 而是采取了一种变通的办法来处理, 即:在表T_Project中的列“f5” (报销人) 中保存多个报销人的账户, 每个账户用空格“”隔开。这样的处理虽然减少了存储空间, 但是违背了第一范式:表的每个列都是不可再分的数据项。

(2) 公司的部门被作为用户表T_User的一个列将导致公司的部门如果有变动, 系统维护会涉及修改程序代码。合理的做法是:在建立类模型时, 将部门识别为一个类, 进而在本讲将这个类映射为一个数据表, 这样, 公司的部门如果有变动, 系统维护只涉及修改数据。

参考文献

[1]范晓平.ASP.NET2.0项目开发第一步UML+VB+C#+Crystal Reports.清华大学出版社, 2008.

依据数据模型创建数据库 篇6

关键词:SQL Server,数据模型,数据库实现,数据库,数据表,数据结构,身份验证模式

主要任务是将数据模型变为实际的数据库, 即数据库实现, 包括创建数据库和数据表。

选择SQL Server作为数据库支持平台。SQL Server可以有两种方式创建数据库和数据表:

(1) 使用Transact-SQL的CREATE DATABASE或CRE-ATE TABLE命令编写代码, 然后在查询分析器中运行代码;

(2) 使用企业管理器中的数据库设计器或表设计器。采用后一种方式来创建项目实例的数据库和数据表。

1 创建数据库

首先, 为数据库确定一个名称Finnance。

然后, 按以下步骤创建数据库:

(1) 打开企业管理器, 展开服务器组, 然后展开服务器。

(2) 选择“数据库”->“新建数据库”, 打开“数据库属性”对话框。

(3) 在“数据库属性”对话框中, 键入新数据库的名称:Finnance, 如图1所示。

(4) 在“数据库属性”对话框中, 单击“数据文件”选项卡, 在“位置”处键入“D:FinnanceDataFinnance_Data.MDF”, 如图2所示。

(5) 单击“事务日志”选项卡, 在“位置”处键入“D::FinnanceDataFinnance_Log.LDF”, 如图3所示。

(6) 单击“确定”。

数据库Finnance被创建。

2 创建数据表

首先为数据表的列定义数据类型, 然后创建数据表。

2.1 数据结构设计

前文已经为数据表定义了列, 现在为列定义数据类型。

由于报销条件需要持久保存, 再增加一个表T_CtrlCondition, 用于保存报销条件信息。这样, 数据库包含4个数据表。

数据表的列的数据类型采用关系数据库SQL Server的数据类型。

2.1.1 表T_Project

表T_Project的数据结构如表1所示。

列“报销部门”的值来源于用户信息表T_User中“部门”列, 但不包括重复的值;列“报销人”的值来源于用户信息表T_User中“账户”列。

2.1.2 表T_Invoice

表T_Invoice的数据结构如表2所示。

列“报销内容大类”包含以下静态值:

(1) 耗材费

(2) 软件费

(3) 资料费

(4) 培训费

(5) 交通费

(6) 通讯费

(7) 劳务费

(8) 差旅费

(9) 会议费

(10) 咨询费

(11) 招待费

(12) 设备费

(13) 印刷费

(14) 测试费

(15) 外协费

(16) 开发费

(17) 其他

列“报销内容小类”包含以下静态值:

(1) (交通费) 汽油费

(2) (交通费) 出租费

(3) (交通费) 过路费

(4) (交通费) 过桥费

(5) (交通费) 其他

(6) (差旅费) 机票

(7) (差旅费) 火车票

(8) (差旅费) 长途汽车票

(9) (差旅费) 轮船票

(10) (差旅费) 会务费

(11) (差旅费) 住宿费

(12) (差旅费) 其他

列“付款方式”包含以下静态值:

(1) 现金

(2) 转账

列“是否附合同”包含以下静态值:

(1) 有

(2) 无

列“是否附通知”包含以下静态值:

(1) 有

(2) 无

列“状态”包含以下静态值:

(1) 1 (待送财务室)

(2) 3 (待审核报销)

(3) 5 (已报销)

2.1.3 表T_User

表T_User的数据结构如表3所示。

列“权限”包含以下静态值:

(1) 1 (高)

(2) 3 (中)

(3) 5 (低)

列“部门”包含以下静态值:

(1) 公司

(2) 财务室

(3) 总工办

(4) 产品设计所

(5) 工装设计科

(6) 材料研究所

(7) 动力科

(8) 质检科

2.1.4 表T_CtrlCondition

表T_CtrlCondition只需要两列:条件和控制值, 字段名称分别为f1和f2。表T_CtrlCondition的数据结构如表4所示。

2.2 创建数据表

定义数据结构以后, 现在就可以创建数据表。

(1) 展开数据库节点。

(2) 选择“Finnance”->“新建”->“表”, 打开表设计器。

(3) 在表设计器中, 按表1设计T_Project的数据结构, 添加列以及表的其他详细信息, 如图4所示。

(4) 关闭表设计器, 提示“您想要保存对表TABLE1的更改吗?”, 如图5所示。

(5) 回答“是”, 出现“选择名称”对话框。

(6) 在“输入表名”文本框中输入表的名称:T_Project, 如图6所示。

(7) 单击“确定”。

数据表T_Project被创建。

重复以上步骤3次, 分别按表2、3、4创建数据表T_In-voice、T_User和T_CtrlCondition。

3 设置身份验证模式

SQL Server服务器有两种身份验证模式:

(1) SQL Server和Windows

(2) 仅Windows

这里为SQL Server服务器选择SQL Server和Windows模式。

通过企业管理器设置身份验证模式, 步骤是:

(1) 打开SQL Server企业管理器。

(2) 展开一个服务器组。

(3) 右击一个服务器, 再单击“属性”。

(4) 在“安全性”选项卡的“身份验证”下, 单击“SQL Server和Windows”, 如图7所示。

(5) 在“审核级别”中选择在SQL Server错误日志中记录的用户访问SQL Server的级别:

1) “无”表示不执行审核。

2) “成功”表示只审核成功的登录尝试。

3) “失败”表示只审核失败的登录尝试。

4) “全部”表示审核成功的和失败的登录尝试。

(6) 单击“确定”。

为了使设置生效, 必须重新启动SQL Server服务器。

4 注册系统管理员

为了在后续系统编码过程中便于调试, 同时也为了让系统交付后用户能够启动系统, 在用户信息表T_User中必须注册一个用户。这个用户应该是系统管理员, 权限最高。注册信息如下:

(1) 账户:admin

(2) 姓名:管理员

(3) 权限:1

(4) 部门:财务室

(5) 密码:111

用企业管理器注册系统管理员:

(1) 在SQL Server企业管理器中, 右击T_User表。

(2) 选择“打开表”->“返回所有行”, 显示打开表窗口。

(3) 在窗格的空行中, 输入以上系统管理员信息。

(4) 关闭表窗口。

5 结语

数据库实现就是依据数据模型创建数据库和数据表。SQL Server创建数据库和数据表的方式有两种:使用Transact-SQL的CREATE DATABASE或CREATE TABLE命令编写代码, 然后在查询分析器中运行代码;使用企业管理器中的数据库设计器或表设计器。

参考文献

数据模型构建 篇7

ROLAP是在基础事实表上, 直接关联维度表, 因此, 比较灵活, 空间占用小, 但是速度较慢;MOLAP, 是在维度固定的情况下将数据首先进行所有维度层次之间组合的汇总, 最终达到给出查询条件直接命中汇总后的事实表, 进行无需关联维度表的数据的直接检索, 因此, 这是两个矛盾的过程。这对矛盾的焦点在于事实表是首先汇总, 还是不汇总, 为了提高速度, 汇总是正确的;为了减少空间占用, 不汇总就是正确的。我们将必要的层次组合进行提前汇总, 使得一部分状况下, 可以直接命中查询记录, 另有一部分状况下, 在轻量数据集上进行临时汇总生成查询结果的方式为HOLAP模型。

根据上面的描述, 整个问题的核心变成了汇总后的事实表的保留原则, 也就是说哪些表保留是合理的, 哪些表可以不保留的问题。

名词解释:

支撑表、层次差:当表A, 不存在, 针对表A的查询可以在表B上进行, 在得到的数据集上进行汇总生成所需查询结果的过程中, 表B称为表A的支撑表, B表与A, 层次标号差称为层次差。

数据源表:对于最细粒度上的表是不需要进行汇总操作的, 它为生成过程提供源数据, 这样的表称为数据源表。

事实表:在数据源表上, 进行汇总操作, 最终形成了一批各个层次组合的数据表, 这些数据表在检索过程中直接使用, 同ROLAP模型中的事实表作用等同, 对于这样的表, 我们称为事实表。

跳转:当一个事实表A不存在, 需用支撑表进行数据检索时, 我们称这样过程为跳转。

表的选取原则:

MOLAP模型中事实表是齐备的, 无需任何的跳转操作, 都能够直接命中事实表, 这样的检索效率是最高的, 但是如果采用部分数据表不生成的方案来降低空间使用率, 那么就一定存在跳转, 这就涉及到事实表的选择的问题。

当A表不存在, 需要使用支撑表时, 可以认为, 支撑表与A表的层次差越小越好。比如:表A的层次为Ca1Cb1Cc1, 它的两个支撑表为表B:Ca2Cb1Cc1和表C:Ca4Cb1Cc1, 那么通常状态下B表作为支撑表要比C表作为支撑表更为合理。那么也就是说, 最好情况是直接命中, 比较好的情况就是某一层进行一次跳转就可以到达支撑表, 跳转2层或更多才能到达支撑表, 这样的方案不好。

于是, 我们确定一个目标:不能直接命中的表, 能通过一层且仅一层跳转就可以到达支撑表。

表选取的解决方案:

假设, 只有两个维度, 每个维度为5层, 分别定义为A1、A2、A3、A4、A5和B1、B2、B3、B4、B5, 并且, 层次编号有有小到大代表粒度由粗到细。那么可以肯定, A5B5为数据源表, 它必定存在, 不需生成。而且, 它也必须存在, 没有它, 所有的数据都将无法生成, 因此, 我们使用如图1的选取表的方式, 红点表示最终被保留的数据表。选取过程可以用一个递归的过程来描述:由于A5B5存在, 那么它临近的两个表, 只需要一层跳转就可以达到A5B5, 因此, 可以不存在, 于是, A4B5和A5B4两个表就可以不存在, 由于A4B5不存在, 那么A4B4和A3B5失去了一层跳转就可以到达的支撑表, 因此, 这两个表就必须生成。

使用这样的选取方式, 我们将表数量减低为原来的约1/2, 记录总量在理想状态下也将降低为原来的约1/2。在仅有两维存在的情况下, 这样的选取方式可以认为是比较合理的。那么当维度变为3维时情况如何呢。

假设引入一个新的维度C, C仅有2层C1, C2。此时A5B5C2就是数据源表。

对于上面的操作过程我们使用了一个实例, 并且“整齐”的两个维度进行操作, 现在将其推广成为一种广义模式认为A有m层, B有n层, 并且规定m>=n。得到的这样一个操作过程:首先选取末节点Am Bn放置到集合R中, 查看集合R中的所有点是否存在某一个点的对角点不在R中, 如果不在, 提取该点放置到R中再重复上面的查找过程。直至R中的所有点的对角点全部出现在R中, 查找过程完毕。集合R则对应F模式, 没有在集合R中的点对应的就是S模式。

引入第3维以后, 我们命名新引入的维度为C, 维层次为C1, C2, C3, C4, C5。FAB和SAB交替出现在维度C的各个层次上。

我们可以看出, 问题, 又一次回到了2维模式下的表选取模式上来了。于是, 我们可以得到下面的结论{A, B, C}={{A, B}, C}={SAB, FAB;C1, C2, C3, C4, C5}=|SABC, FABC];其中:FABC=[C5FAB, C4SAB, C3FAB, C2SAB, C1FAB];

SABC=[C5SAB, C4FAB, C3SAB, C2FAB, C1SAB];

同理得到{A, B, C, D}={{A, B, C}, D}={{{A, B}, C}, D}={SABC, FABC;D1, D2, ….Dm}=|SABCD, FABCD]

综述:在实际的应用过程当中, 发现ROLAP的效率不高, MOLAP的易引起数据爆炸是两者公认的弱点, HOLAP必然是最终的归属。

摘要:在整个项目中, 数据表构建的模型是重要环节, 它影响着最终数据的膨胀比率和数据的检索速度。MOLAP模型下, 我们已经成功的使用所有层次组合的方式来生成数据, 最终达到了预期的目的, 用牺牲空间的方式换取了检索速度的提高。同时, 我们也看到了数据的大幅度膨胀和数据生成的困难性。系统中, 如果再增加一个维度或者再增加一个维层次可能都将导致数据爆炸, 导致整个优化工作的失败。因此, 在使用这种提前汇总的方式作为优化方案时, 控制膨胀比率成为一个很关键的问题。

关键词:数据源,数据模型,跳转

参考文献

[1]dorian pyle (著) :《业务建模与数据挖掘》, 机械工业出版社。

工艺数据模型 篇8

在信息时代, 谁能在信息的海洋中获取更多的知识, 谁就能取得成功的主动权。信息技术在企业的决策和商业活动中起着重要的支持作用。

信息技术的迅速发展和企业管理决策的迫切需要, 使数据仓库理论应运而生, 并成为决策支持领域中实用性极强的技术。

一、数据仓库和数据集市

数据仓库技术是当前用于企业决策支持的、先进的有效方法。

1993年, W.H.lnmon在其所著《Building the Data Warehouse》中对数据仓库进行了完整的界定。他将数据仓库定义为:“一个面向主题的、集成的、随时间变化的、非易失性的数据集合, 用以支持管理层的决策”。这一界定被学术界广泛认同。W.H.lnmon关于数据仓库的定义, 可以从几方面来理解:

1. 数据仓库是一种数据资源集成与整合的具体方法。

数据仓库不同于一般的数据库。它是按照一定的要求、围绕明确的主题, 对原有分散的、相互独立, 异构的操作型数据进行有效集成。

2. 数据仓库存储的数据具有相对的稳定性。

3. 数据仓库的数据主要用于对管理决策过程的支持。

数据仓库的鲜明特点, 使数据仓库技术具有广泛的应用前景。目前, 已有不少行业把数据仓库技术用于数据管理和决策支持, 取得了经验, 产生了效益。

数据集市是数据仓库的一个子集, 它面向部门级业务, 面向某个特定的主题。是一种简化的小型数据仓库。实际上, 多个相互联系的、围绕一个宏观大主题的多个数据集市的集成, 就构成了数据仓库。数据集市和数据仓库在其实现过程和数据模式方面, 没有根本的差异。而数据集市比数据仓库更为简洁、方便, 易于快速实施并应用。因此, 在建立企业级的数据仓库前, 可规划建立多个部门级的数据集市, 在此基础上, 集成实现企业级的数据仓库。

二、数据仓库的“星型模型”

“星型模型”是数据仓库广泛采用的数据模型。它能准确、简洁地描述出实体之间的逻辑关系。数据仓库的其他数据模型, 一般是在“星型模型”的基础上的变形与扩充。一个典型的星型模式包括一个大型的事实表和一组逻辑上围绕这个事实表的维度表。如图1所示:

事实表是星型模型的核心。用于存放大量的具有业务性质的事实数据。事实表由主键和事实的度量数据两部分组成。事实表通过主键, 把各维度表链接在一起, 形成一个相互关联的整体, 共同描述主题。事实表中存放的大量数据, 是同主题密切相关的、用户最关心的、对象的度量数据。

维度是观察事实、分析主题的角度。维度表的集合是数据仓库数据模式的关键。维度表通过主关键字与事实表相连。用户依赖于维度表中的维度属性, 对事实表中的事实数据进行查询、分析, 从而得到支持决策的数据。

因此, 对事实表和维表的分析设计, 是数据仓库数据模型设计的关键。

三、连锁超市数据集市的数据模型

数据模型是建立数据仓库的基础。业务需求是进行数据仓库数据模型设计的驱动力。连锁超市商品销售情况可以看作超市管理数据仓库的一个子集, 即数据集市。适宜选用以“星型模型”为基础, 建立能满足需求的连锁超市数据集市的数据模型。

1. 事实表的设计

如前所述, 事实表由主键和度量数据两部分组成。星型模型中各维度表主键的组合构成事实表的主键。针对本文的研究主题, 最需要关注的是连锁超市商品销售情况。因此, 在事实表中, 要准确记载各连锁超市所畅销的商品、销售数量、营业额、利润等度量数据。

事实表中数据的细节程度或综合程度的级别称为数据“粒度”。粒度是数据仓库事实表的重要的特征。粒度的级别依赖于维表的属性。不同的需求, 对数据仓库的粒度要求不同。

连锁超市数据集市需要保留最低层次的细节数据, 以满足数据集市的信息查询要求。很多数据挖掘的应用程序也需要最低层次的数据颗粒。再者, 低粒度的事实表便于从操作型系统中抽取源数据。此外, 最低层次的细节数据是聚集事实表的基础。

另一方面, 为提供决策支持, 需要多方面的高粒度的汇总数据。

因此, 连锁超市数据集市的数据模型设计, 要能方便获取从最低层次的细节数据到高度概括的汇总数据。这不仅需要设计好事实表, 同时依赖于维度表属性的设计。

2. 维度表的设计

维度表的集合是建立数据仓库数据模型的关键。

建立连锁超市数据集市的目的是要从各个角度, 分析对商品销售情况的影响, 为管理者在研究超市发展策略等方面, 提供决策支持。

针对连锁超市需要掌握的基础信息和决策的需求, 在连锁超市数据集市中, 设计了以下维度及其主要属性。

客户维:这是最重要的一个维度, 在商界, “客户就产上帝”。在客户维中, 建立了客户的基本信息、是否为会员客户、客户居住地域等, 以便掌握客户个人细节数据。从数据粒度的需要, 客户维还建立了客户的会员关系和属地等。为建立聚集事实表作好准备。

商品维:商品维也是一个重要的维度。商品不仅决定了超市的经营范围, 商品的结构、品牌、质量直接影响营业额。在商品维中, 设计了商品代码、商品名称、商品类别、品牌名称、包装类别等维度属性。

时间维:在数据仓库的多维数据结构中, 时间维往往是不可少的一个维度。因为每项“销售事实”都是在一定的时间或者时间段内发生。针对需求, 时间维采用日、月、季、年四个属性。

连锁店维:各连锁店承担了全部商品的销售业务。连锁店的服务质量直接影响企业的竞争力、销售业绩和企业利润。连锁店维中建立了连锁店名、销售经理、规模、所在地域等维度属性。

根据上述分析, 建立连锁超市数据集市的星型数据模型, 如图2所示:

3. 处理好大维度问题

在上列各个维度中, 客户维和商品维都是典型的大维度。这是因为:大的连锁超市, 客户维和商品维很深, 累计可能有数以万计的客户和上万种商品;客户维和商品维很宽, 根据需要, 这两种维可以有多个维度属性。

数据仓库的大维度, 会给数据仓库的操作应用带来一些问题。大维度中的长文本字段不仅占用存储空间, 而且维度数据不易更新和维护;向大维度表填充数据难度增大;对事实表的查询涉及大维度表时, 会影响效率。解决数据仓库“大维度”问题较好的办法是采用“雪花模型”。

“雪花模型”是在星型模型的基础上拓展而来的。将“星型模型”中的大维度表进分解, 通过增加详细类别表, 形成一些局部的层次区域, 就演变成为“雪花模型”。将连锁超市数据集市中的两个大维度表——客户维和商品维进行“雪花化”。分解出相应的类别表, 既解决了大维度表带来的问题, 也为建立“聚集事实表”作好了准备。

基于上述分析, 设计出低保基础信息数据集市的雪花模型构架。如图3所示:

四、连锁超市数据集市聚集模型设计

“聚集”是从最低粒度的事实表中衍生出来的的预先计算的汇总数据。这些汇总数据形成了一组独立的聚集事实表。实际应用中, 可以根据需要用跨越任何维度的特定的汇总数据构建为一个聚集事实表。

1. 建立数据集市聚集事实表的必要性

建立低保基础信息数据集市的主要目的, 是要为管理者提供具有决策价值的汇总数据。因此, 把使用频率高的汇总数据存放在聚集事实表中, 对提高数据集市的的使用性能, 为管理者提供决策支持, 使用户获得更好、更快的查询结果, 是非常必要的。数据集市聚集模型的好坏将在很大程度上影响到数据集市的使用效果。

2. 怎样建立聚集事实表

在数据集市中建立聚集事实表, 要注意以下原则:

⑴每一个不同的聚集必须使用单独的事实表存储聚集数据, 成为相对独立的聚集事实表。

⑵聚集事实表中的维表必须是基本事实表中的维表的压缩。

⑶基本事实表中的度量数据加载后, 才能作聚集处理。

3. 连锁超市数据集市常用的聚集事实表

每一个数据仓库 (数据集市) , 都可能有多个维度表。因此, 一个数据仓库 (数据集市) 会有很多个聚集事实表。究竟需要那些聚集, 要针对用户需求和决策需要。例如, 连锁超市数据集市中可建立以下常用聚集事实表:

⑴单路聚集:在有多个维度的数据模型中, 如果只有一个维度升高维度层次, 其他维度保持最低层次, 所生成的事实表为单路聚集事实表。在连锁超市数据集市中, 把时间维度的属性层次升高到月、季或年, 其他维度层次保持不变, 就生成一个单路时间聚集事实表。

⑵二路聚集:在多维数据模型中, 如果有二个维度升高维度层次, 其他维度保持最低层次, 所生成的事实表为二路聚集事实表。在连锁超市数据集市中, 如果需要掌握在某年对会员客户的销售情况, 可以生成时间维属性为年, 客户维属性为会员, 其他维保持不变的二路聚集事实表。如图4所示。

⑶三路聚集:在多维数据模型中, 如果有三个维度升高维度层次, 其他维度保持最低层次, 所生成的事实表为三路聚集事实表。例如:在连锁超市数据集市中, 需要掌握在某年会员客户对某个品牌商品的购买情况, 就需要对销售事实表进行三路聚集, 如图5所示。

按照上述方法, 可以根据需要灵活方便地生成多个聚集事实表。

五、结束语

能否满足需求, 是衡量一个应用软件质量的重要依据。利用本文提出的连锁超市数据集市的数据模型架构, 不仅为建立连锁超市数据集市奠定了基础;而且为数据集市的发展利用创造了条件。通过数据挖掘技术, 能够从多方面获取连锁超市经营管理中的重要信息, 为企业在竞争中取得主动权, 促进企业的进一步发展, 提供决策支持。

参考文献

[1]王志海:数据仓库[M].机械工业出版社, 2003

[2]邵红全 赵 茜:运用多维数据模型实现数据集市[J].河北省科学院学报, 2003 (2) :99~102

[3]段云峰:数据仓库基础[M].电子工业出版社, 2004

[4]李姗姗 宁 洪 陈 波:通用数据仓库元数据模型的研究[J].计算机工程与应用, 2004, 26 (5) :52~55

[5]刘中蔚 陈 红:用基于元数据库的工作流调度数据仓库的更新[]].计算机应用研究, 2006, 23 (3) :178~180

[6]范 明:数据挖掘概念与技术[M].机械工业出版社, 2004

[7]平 静 林平瑞:元数据管理及其在数据仓库中的应用[J].平原大学学报, 2006 (8) :130~132

寿命数据的参数模型 篇9

1 寿命分布的几个常用参数

1.1 平均寿命与寿命的方差

用T的数学期望来刻画总体T的“平均寿命”, 用方差DT=E (T-ET) 2来刻画总体寿命的波动程度。ET, DT是分布的重要数字特征。

1.2 生存函数 (可靠度)

定义函数

在生存分析中, S (t) 称为生存函数, 在可靠性统计中, S (t) 又被称为可靠度。它刻画了寿命超过一定年龄t的概率, 或者失效时间超过规定长度t的概率。

显然, 对指定的t, S (t) 越大越好。

若有两个总体:T1, T2, 其生存函数分别为S1 (t) 和S2 (t) , 满足S1 (t) ≥S2 (t) , 0≤t,

则总体1的寿命分布一致优于总体2的分布。

S (t) 具备下列性质:S (0) =1;S (t) 为t的下降函数;limt→∞S (t) =0;S' (t) =-f (t) 。

1.3 危险函数 (失效率)

P (tt) 表示个体已经存活过 (产品有效工作过) 时间t, 而在下一个时间间隔△t内死亡 (失效) 的条件概率。当△t很小时, 则

这说明, 当△t很小时, P (t

这个比例系数h (t) 称为危险函数或者失效率。

上述的两个定义的等价性是易知的。

以下说明:危险函数h (t) , 密度函数f (t) , 生存函数S (t) 三者可以相互确定。

事实上, 首先f (t) 与F (t) 是可以彼此相互确定的, 进而f (t) 与S (t) 可以相互确定, h (t) 可以由f (t) 或S (t) 确定。

另外, 由于

危险函数 (失效率) h (t) 随时间t的流逝而变化。例如一台汽车在出厂后, 需要一段磨合期, 在磨合初期发生故障率较高 (h (t) 较大) ;而在磨合后期发生故障率较低 (h (t) 较小) 。此后会逐渐趋于稳定, h (t) 大致可看成是一个常数, 相当长时间后, 零部件老化, 故障率会增高, h (t) 变大。人的寿命分布也有类似这样一个“三部曲”。h (t) 的这种特性无论对于医学研究还是对于产品的可靠性改善都有其重要的意义。

2 常用的寿命分布

我们仅用参数模型来刻画寿命分布。即认为寿命分布为某种已知类型的分布, 其中有一些未知参数, 当这些参数确定后, 寿命分布就完全确定了。在寿命分布的参数模型中, 下面几个是最常见的。

2.1 指数分布e (λ)

即指数分布的危险函数 (失效率) 为常数, 而且它的条件寿命分布与无条件分布相同, 这种性质叫无后效性。

可以证明:若失效时间分布的危险函数 (失效率) 为常数, 则它一定是指数分布。

事实上设h (t) =λ>0, 则它的生存函数

, 恰好为指数分布的生存函数。

2.2 韦布尔分布

当β=1时h (t) =1/α, 即指数分布的危险函数, 因此指数分布是韦布尔分布的一个特例。

当β<1时, h (t) 关于t单调下降, β=1时, h (t) 是常数, β>1时, h (t) 关于t单调上升。

2.3 伽玛分布G (k, λ)

伽玛分布G (k, λ) 的密度函数为

其中k>0, λ>0为参数。显然G (1, λ) =e (λ) , 即指数分布也是伽玛分布的一个特例。

伽玛分布的数学期望和方差分别为ET=k/λ, DT=k/λ2,

伽玛分布的生存函数S (t) 和危险函数h (t) 都没有简单的表达形式。

m为正整数时, G (m, λ) 可看作m个独立同分布于ε (λ) 的随机变量的和的分布;设T服从G (m, λ) , 则2λT服从x2 (2m) 分布。

2.4 对数正态分布LN (μ, σ2)

对数正态分布LN (μ, σ2) 的密度函数为

事实上若ln T~N (μ, σ2) , 则T服从对数正态分布LN (μ, σ2) 。LN (μ, σ2) 的期望和方差分别为

其生存函数与危险函数都没有简单的表达形式。对数正态分布作为寿命的模型有一个好处, 就是将寿命或失效时间T作对数变换后, 就得到大家最熟悉和最易分析处理的正态分布。

摘要:寿命分布是统计学中一类重要分布。人的寿命或者电子产品或其它物种等的寿命, 其统计规律是许多行业必须重视和分析处理的。寿命数据的统计分析在大学的数理统计教材中较少涉及, 本文系统的介绍这类问题的几个概念和几个常用的寿命参数模型, 供学习者参考。

关键词:寿命分布,生存函数,危险函数,指数分布,韦布尔分布,伽玛分布,对数正态分布

参考文献

[1]陆璇.应用统计[M].北京:清华大学出版社, 1999.

[2]魏宗舒.概率论与数理统计教程[M].北京:高等教育出版社, 1987.

[3]茆诗松.可靠性统计[M].上海:华东师范大学出版社, 1984.

[4]张春华, 陈循, 杨拥民.常见寿命分布下环境因子的研究[J].强度与环境, 2001 (4) :7-12.

[5]高尚.剩余寿命分布研究[J].强度与环境, 1995 (3) :61-64.

上一篇:备用系统下一篇:食品安全不容忽视