视觉算法工程师的主要职责

2024-07-06

视觉算法工程师的主要职责(共15篇)

视觉算法工程师的主要职责 篇1

职责:

1.负责公司视觉分析算法研发,包括运动轨迹预测、同图像上多人脸识别、物体特征提取的算法研发工作

2.负责技术的前期预研,完成算法开发库,封装算法调用文档;

3.负责业务模块的功能设计、代码实现,对代码进行优化,提升效率和准确度;

4.训练数据,对训练的精准度进行调参,项目上的订制开发

岗位要求:

1、负责运动分析算法的开发、熟练使用Python、CUDA、C/C++等编程语言

2、精通H.264和YUV,对运动侦测有一定了解

3、有人脸识别、运动分析、Opencv、Tensorflow的相关经验

4、熟悉硬件加速,算法效率优级化,有运动特征、运动轨迹经验的优先录制

视觉算法工程师的主要职责 篇2

目前国内正全面推行建设项目全过程跟踪审计, 全过程跟踪审计是指在项目实施的各个阶段, 对投资进行事前、事中及事后控制。投资控制工作的好坏, 直接影响到工程的工期和质量, 投资控制方法是否合理, 更是直接影响到整个项目的预期效果。所以必须在工作中配备既懂工程技术又懂经济、管理、法律知识及具有实践经验和良好职业道德素质的复合型人才—————造价工程师。造价工程师的工作始终贯穿于项目的全过程, 在项目实施的各个阶段提供投资、进度、质量“三控制”, 防止决算超预算、预算超概算、概算超投资估算的“三超”现象。造价工程师是建设项目造价工作的重要组织者和负责人, 具有工程计量审核权、支付工程进度款审核权和工程造价审批权, 对维护国家和社会公共利益, 维护业主和承包商利益, 有着不可替代的地位和作用。

在整个项目的管理过程中, 造价工程师的作用主要体现在以下几个方面:

1 投资决策阶段

可行性研究是项目合理决策的依据, 是避免决策失误, 实现项目决策科学化的重要手段。作为一名造价工程师首先要有实事求是、客观公正的态度, 杜绝为了“可行性”报告而人为地压低投资、提高效益的现象;其次要提高风险意识, 强化风险分析, 打破传统观念, 不能只做算帐的机器, 而要充分考虑各种风险因素, 实现投资的效益化。造价工程师还要在日常工作中不断加强资料收集、整理及经验的积累。对已经完成的工程数据进行详细归类、比较, 从中总结出各类经验数据, 使投资估算更贴近实际。

2 设计阶段

项目实施阶段控制项目投资的关键就在于设计。加强设计阶段的投资控制, 确定合理的设计方案, 减少在施工阶段重大设计变更和方案变化的发生, 对有效控制工程造价将起到重要作用。所以做好设计阶段的工程造价控制是有效控制“投资失控”的首要任务。价值工程原理通过对功能和成本的分析, 将技术问题和经济问题有效地结合起来进行研究, 是设计阶段进行投资控制的科学方法之一。造价工程师应能熟练运用价值工程原理, 做多种方案的功能和成本研究, 选择价值系数最大的方案作为最优方案, 实现设计阶段的投资控制目标。

3 招投标阶段

严格以批准的设计概算为控制目标, 编制施工招标文件, 起草施工合同条款, 编制工程量清单和工料说明, 协助业主通过招投标择优选择承包商, 这是造价工程师在招标阶段的重要任务。造价工程师应贯彻“公开、公正、公平”的招标原则, 在招投标阶段应紧紧围绕标底造价是否合理进行投资控制, 根据现行规范、定额取费标准、施工图纸、现场因素、工期等认真审核标底, 包括审核工程量、单价、取费及价差、各种包干费用和主要材料指标等是否合理, 使工程造价控制在“合理价”范围内。

4 施工阶段

造价工程师在施工阶段的投资控制, 就是把计划投资额作为投资控制的目标值, 在施工中定期分析投资实际值和目标值之间的偏差原因, 并采取有效措施加以控制, 保证投资控制目标的实现。

4.1 严格控制工程进度款

工程进度款支付是投资控制的有效手段, 是工程质量和进度的有力保证。造价工程师应随时掌握了解工程款支付情况, 确定其与现场施工进度是否相符, 并通过监理人员对已完工程质量进行检验, 确认是否符合要求。依据合同规定, 对计量核实的工程项目支付进度款。

4.2 严格核查工程变更

造价工程师应从使用功能、经济、美观的角度协助业主确定是否需要进行工程变更。必须依据工程变更内容, 认真核查工程量清单, 估算工程变更价格。同时进行技术经济分析比较, 核查每个子项单价、数量和金额的变化情况, 按照承包合同中工程变更价格的条款, 确定变更价格, 并计算该项工程变更对总投资额的影响。

4.3 正确处理施工索赔

在施工过程中引起索赔的原因很多, 这就要求造价工程师应精通施工合同条款, 熟悉工程项目的专业技术标准, 公正地当好索赔事件的“准仲裁员”, 维护合同双方的合法权益。发生索赔事件时, 应认真研究合同条款, 首先核查索赔报告是否在索赔事件发生后的有效期间内提出, 否则索赔不成立, 进而对索赔事件的起因和责任归属进行划分, 最后再对索赔要求进行辨别和分析。造价工程师还应协助业主做好反索赔工作, 促使承包商履行合同约定的义务, 保证工程质量和按时竣工。

5 竣工阶段

竣工结算是进行投资控制的一个很重要的环节。造价工程师审核的具体内容包括:竣工结算是否符合合同条款、招投标文件、结算是否按规定的定额和工程量计算规则及造价主管部门的调价规定等进行编制。在确定工程造价时, 坚持以现行的计价规范为依据, 按照施工合同和招标文件的规定, 根据竣工图、结合现场签证和设计变更进行审核。同时要坚持深入现场, 掌握工程动态, 了解工程是否按图纸及工程变更内容进行施工, 要根据合同、图纸、甲方供应材料设备等资料逐项审核, 确保工程结算的质量, 提高投资效益。使竣工结算真实反映工程实际造价。

6 结语

工程造价工作是一项既懂工程技术又懂经济, 既懂管理又懂法律知识及具有实践经验和良好职业道德素质的复合型人才。因此这就要求造价工程师要不断加强学习, 学习新技术、新知识, 不断总结、积累经验数据, 努力提高自身的专业技能, 加强自身职业道德约束, 严格履行合同, 正确行使合同赋予自己的权利, 合理运用自身掌握的专业技能, 同时要不断提升组织协调能力和管理水平。增强法制观念, 坚持实事求是的职业道德和认真负责的工作态度。只有这样, 才能有效地在项目实施各个阶段把好投资控制关, 进行科学有效地投资管理, 实现建设工作预期的投资控制目标。

摘要:在提倡建设项目全过程造价管理的今天, 造价工程师的作用和地位日趋重要。造价工程师在工程建设中直接与经济, 建设成本, 投资效益相结合, 投资控制的好坏也直接由造价师来掌握。下文主要讲述了造价工程师在建设项目全过程投资控制的作用及职责。

关键词:造价工程师,经济,成本,工作职责

参考文献

[1]姜早龙.建设工程质量、投资、进度控制[M].大连:大连理工大学出版社, 2009.

视觉算法工程师的工作职责 篇3

1、负责机器视觉系统图像处理、分析及算法研发,视频图像特征提取等应用开发;

2、研究并开发基于地图信息的单目、双目摄像头,vslam及其他相关传感器的自主定位算法。

3、完成算法设计、实现、测试,完成应用调试;

4、完成技术文档。

任职资格:

1、图像处理领域相关专业(如电子工程,计算机,自动控制等)本科学历5年以上工作经验,有计算机视觉,模式识别,视频图像处理的算法开发经验;

2、熟练使用C/C++编程语言,掌握计算机视觉基础理论和算法,熟悉基于特征的图像定位算法;

4、熟练使用OpenCV进行视觉应用开发;

5、有在ARM平台Linux 操作系统上软件开发的经验;

视觉算法工程师岗位的基本职责 篇4

1.利用OpenCV完成视觉常用算子的开发;

2.参与通用视觉平台的算法模块及工具开发;

3.参与关键项目的视觉技术攻关;

4.使用深度学习模型探索解决视觉问题的方法。

任职要求:

1. 熟练使用halcon,OpenCV进行视觉算法开发,具备2年以上机器视觉算法的开发经验;

2. 精通机器视觉的算法原理,数学能力突出;

2. 具有很强的软件开发能力,精通C++,熟悉操作系统原理,具有模块化开发思想;

视觉算法工程师岗位的工作职责 篇5

1. 研究各种工业领域的机器视觉算法(定位、识别、检测、测量),实时跟踪国内外的行业发展现状与方向;

2. 根据公司项目需求,设计与开发新的视觉算法;

3. 对公司产品中现有的视觉算法从稳定性、处理效果和速度上做持续改进;

4. 负责算法测试相关工作,撰写开发文档;

任职要求:

1. 硕士及以上学历,图像处理、计算机视觉、自动化相关专业;

2. 熟悉C ,VC++ ,python;

3. 精通数字图像处理算法,包括图像增强、图像分割、特征提取、模板匹配等,熟悉opencv,halcon等视觉算法库;

4. 有工业领域机器视觉算法(目标定位、OCR、测量、缺陷检测)开发经验;

5. 有windows平台下算法优化的经验;

6. 具有阅读专业英文资料的能力,以了解国际先进的视觉算法;

基于机器视觉的车流量检测算法 篇6

实时准确的车流量检测技术是智能交通系统中的重要组成部分,是进行交通监控、道路管理调度的基础。传统的车流量检测方法如地感线圈法、超声检测和红外检测法,存在安装不便、设备价格昂贵、易受干扰等各方面的问题。而随着计算机和图像处理技术的飞速发展,基于机器视觉和图像处理技术的车流量检测技术,因具有安装维护简便、应用范围广等优点,越来越受到国内外学者的关注[1,2],已成为该领域研究的热点。2007年张永丽等在交通流检测中运用自适应背景初始化算法,根据车流情况自动确定所需要的帧数,同时采用窗口截取方式只对窗口内图像进行计算,取得了较好的效果[3]。2007年陈望等提出了一种道路背景提取新方法,且利用车辆中心的连续匹配来确定车辆数目,获得较高的准确率[4]。2007年罗东华等提出基于边缘信息的背景差车流量检测方法,采用动态开窗的方式进行车辆计数[5]。2010年郭怡文等通过背景差分方法实现图像分割,使用虚拟检测线实现车流量的检测[6]。2010年李宇成等针对图像容易受光线变化及相邻车辆阴影影响的问题提出基于车辆图像能量差分的车流量检测方法[7]。这些方法需要在图像上设置一检测线或一检测区域,以用来对车辆进行计数,而检测区域的位置和大小若设置不合理将会造成车辆漏检或重复计数,从而影响车辆计数的准确度。为此,提出不需设置检测区域,将车流图片处理后通过神经网络的方法进行车流量检测的方法。

1 车流量检测算法

基于机器视觉的车流量检测,是通过安装在道路旁边或者天桥支架上的摄像机和图像采集设备将实时的图像信息采入,经过对图像处理分析得出车流量的信息。本文通过图像处理和神经网络相结合的方法进行车流量检测。

目前,对获取的车流图像进行处理的方法很多,包括帧差法、背景差法、光流法和边缘检测法等,其中背景差法是较常用的车流量检测方法。背景差法的基本原理是利用两幅图像之间的差来判断物体的出现和运动,即计算当前图像与一个固定的静止参考图像(背景图像)的差值,从而得到图中的车辆数。同时,许多学者针对背景差法存在的局限及不足也进行了很多改进和完善[3,4,6]。在背景图像准确可靠的条件下,背景差法往往具有处理速度快和精度高的优点。为此本文采用基于背景差的方法进行车流图像的处理。首先将当前获取图像与背景图像进行差值计算,判断图中是否有车辆。若图中有车辆,则对图像进一步进行滤波、开运算、转化为灰度图、增强对比度等处理后,将图像转化为二值图,从而把车辆从图片中提取出来,最后通过统计图中连通区域个数来得到图中车辆总数。车流图像处理的结果如图1所示。

基于神经网络具有的非线性拟合能力及在预测领域的广泛使用,这里采用BP网络进行车流量的估测。在获得图片中车辆数目后,将某一时段内拍摄得到的每幅图片的车辆数作为网络的输入,该时段内图中的车辆总数作为网络输出,最终车流量即为网络的输出与检测时间的比值。通过对已知样本数据的学习,确定隐层的神经元个数与相应的网络连接权值,可最终建立基于背景差法的车流量检测的神经网络模型。

2 实验结果与分析

实验通过在天桥上拍摄某车道上的图像进行车流量检测。对每次车流量检测采用图像四连拍的方式,时长1.2 s,共采集了25组四连拍数据。所得到的25组图片中每幅图中实际的车辆数如表1所示,同时将每张图片进行上述基于背景差法处理后,得到经图像处理获得的车辆数,如表1所示。表中总车辆数为在四连拍时间段内实际通过的总车辆数。

通过构建神经网络进行车流量估测。将四连拍得到的四幅图像的车辆数作为网络输入,四连拍时间段内通过的总车辆数作为输出,构建4×10×1的BP网络结构。将数据归一化处理后,用前19组四连拍数据作为训练样本,后6组数据作为测试样本,最终建立车流量检测的神经网络模型。利用建立好的模型对后6组测试样本车流量进行估测,结果如表2所示。

从表2中可看出,有3组样本测试准确率达到100%,有两组准确率在85%以上,只有第3组测试样本误差较大,原因除了图像处理中的误差和BP网络的误差外,主要由于总车辆数值较小时,一辆车的误差也会大大影响准确率值。当检测的时长增加时,准确率将进一步提高。

3 小结

针对基于机器视觉的车流量的检测,提出了将背景差法和神经网络相结合的检测方法。通过将当前图片与背景图片差值计算及图像二值化处理得到图片中的车辆数,再利用神经网络估测得到当前的车流量。实验结果表明,提出的方法用于车流量的检测是有效可行的。

摘要:准确的车流量检测是实现智能交通管理的基础。提出了一种将背景差法和神经网络相结合的车流量检测算法。首先计算当前图像与背景图像的差值,判断图中是否有车,并在此基础上得到车辆数目,然后通过神经网络实现对一个时段内通过车辆数目进行估测,进而得到该时段内的车流量。实验结果表明,提出的方法用于车流量的检测是有效可行的。

关键词:车流量检测,背景差,图像处理

参考文献

[1]STAUFFER C,GRIMSON W.Adaptive background mixture modelsfor real-time tracking[J].IEEE Computer Society Conference on Computer Vision and Pattern Recognition,1999(4):246-252.

[2]TSENG B L,LIN C Y,SMITH J R.Real-time video surveillance for traffic monitoring using virtual line analysis[C]//Proceedings of2002 IEEE International Conference on Multimedia and Expo.[S.l.]:IEEE Press,2002,2:541-544.

[3]张永丽,张太镒,毕建民.基于自适应背景初始化的车流量检测算法[J].微电子学与计算机,2007,24(5):138-140.

[4]陈望,陈兵旗.基于图像处理的公路车流量统计方法的研究[J].计算机工程与应用,2007,43(6):236-239.

[5]罗东华,余志,李熙莹,等.基于边缘的背景差法在车流量检测中的应用[J].光电工程,2007,34(11):70-73.

[6]郭怡文,袁飞虎.基于背景差分的多车道车流量检测系统[J].电光与控制,2010,17(9):90-93.

高级算法工程师的主要职责说明 篇7

1、负责产品图像算法的设计和研发,包括图像的三维重建算法、双能物质识别算法、物质标定和数据校正前处理的算法开发和测试验证;分解任务并指导相关人员进行代码开发;

2、负责选定部分代码的外包方,协调外包方并控制其工作周期和工作质量;

3、负责产品图像的伪影去除和图像质量优化,根据测试结果优化算法;

4、负责算法的并行加速优化;

5、负责设计开发过程的设计文件及记录文件的编制和归档。

任职要求:

1、具有辐射成像相关的物理知识和CT重建算法、校正算法方面的开发经验,有双能物质识别算法方面经验者优先;

2、精通C++或MATLAB语言,有基于CPU以及GPU编程的工作经验;

3、具有伪影去除经验和较强的图像阅读能力;

4、具备良好的编程风格和文档编写能力;

高级测试工程师的主要职责 篇8

1) 主要负责光电控制类仪器测试方案设计和策划工作,并且能组织分解执行;

2) 负责光电控制类仪器的部分测试执行工作;

3) 负责测试后问题的反馈和闭环确认;

4) 参与研发过程中关键部件及单机模块的测试验证;

5) 完成项目负责人交于的其他开发配合工作;

能力要求:

1) 具有三年以上光电类产品或测试类产品测试方案独立策划和测试执行的经验;

2) 熟练使用测试常用工具:万用表、示波器、EMC测试设备、安规安规设备、高低温设备等;

3) 能独立策划系统测试方案,编写测试大纲、测试用例,并且能根据测试缺陷进行分析和判断问题;

视觉算法工程师的主要职责 篇9

图像匹配定位技术是机器立体视觉导航的关键所在。视觉导航是采用摄像头拍摄到的路面图像, 应用相关技术来识别路径的的自动导航方法[1]。目前国内外主要采用在机器人身上安装摄像机的基于局部视觉的导航方法[2], 本文提出一种基于SIFT算法的视觉导航方法, 通过SIFT算法得到两幅图中相匹配点的坐标, 进而由相对定向直接解算出运动物体的位置坐标。通过与实际的位置坐标相比较可以验证方法的可靠性和稳定性, 多次解算之后得到物体的运动轨迹。

1 基于SIFT算法的视觉导航方法

1.1 SIFT算法

SIFT算法主要分为3个步骤:

1.1.1 尺度空间极值点的检测

对于二维图像I (x, y) , 在不同尺度下的尺度空间表示L (x, y, σ) 可由图像I (x, y) 与高斯核G (x, y, σ) 的卷积得到。在图像的DOG尺度空间中的26个领域中检测极值, D (x, y, σ) 是两个相邻尺度图像之差, 即:

一个点如果与周围的八个点和上下层的十八个邻域点共26个邻域中是最大值或最小值, 就可以确定这个点是图像在该尺度下的一个极值点。

1.1.2 关键点方向参数确定及特征向量生成

通过关键点邻域像素的梯度方向分布的特性, 可以得到每个关键点的指定方向参数, 这样算子就有了旋转不变性。

将坐标轴旋转到特征点方向, 以保证旋转不变性。在实验中对每个关键点使用4×4共16个种子点来进行特征描述, 这样一个关键点就产生了128个数据, 最终形成128维的SIFT特征向量 (即特征描述符) [4]。

1.1.3 关键点特征向量的匹配

SIFT特征向量的匹配主要是通过特征向量相似性进行度量来实现的, 通过计算第1幅图像的每个局部特征点在第2幅图像中的最邻近匹配特征点, 特征点的相似性度量采用斜面距离[5]。通过比较最邻近距离和次邻近距离可以消除因为一些原因产生的无匹配关系特征点来消除错配点。

1.2 相对定向的直接解算方法

相对定向的数学模型建立在摄影光线与基线满足共面条件的基础之上:

其中x1, y1, z1为左影像上的像坐标;xr, yr, zr为右影像上的像坐标;Bx, By, Br为基线分量。

经推导可以得到相对定向的观测方程:

对于右片而言, 将整个坐标系统绕着右投影中心进行旋转到右片的像空间坐标系, 可得到与左片相类似的核线方程[6]。

由上式可知需六对以上的匹配点的像空间坐标来解算共面方程, 通过解算得到的相对定向元素, 求解出左右影像核线方程, 最后形成几何约束条件来判断匹配点是否为所需要的内点。相对于其他描述旋转矩阵的方法, 此种算法不依赖初始值, 迭代次数相对较少, 以及收敛速度较快, 计算结果相对稳定可靠的优点。

2 实验方案及数据

2.1 实验环境及测量

利用matlab程序对所取得的图片进行数据运算, 每幅图片都是在实验室利用定点摄影技术得到, 因此可以得到每幅图片拍摄时的焦距以及所在的具体位置坐标。具体实验过程如图1所示, 第一步在实验室中采集的灰度化图片。

2.2 特征点匹配

利用得到的灰度化图片, 在matlab中进行SIFT算法的运算, 找到匹配点得到匹配坐标, 其中有一些误差点, 要进行剔除, 否则会影响下面的相对定向的精确度, 实验结果如图2。

2.3相对定向实验结果及运动轨迹

根据相对定向的方法, 对匹配点进行相对定向的直接结算, 得到物体的坐标, 解算结果见表1、图3、表2。通过物体的坐标可以得到物体的运动轨迹, 并进行误差分析。

通过与物体的真实坐标进行比较, 其误差基本在3%到8%之间有着较好的实验效果, 并且稳定性很好。可以通过改变匹配特征点的选择以及对匹配方法的改进来进一步提高精度。

3 结论

通过实验方法及结果分析得到以下结论:

1) 本方法能够实现视觉导航功能, 其误差较小, 准确度较高。

2) 通过采集含有位置信息的视觉图片序列通过SIFT算法以及相对定向直接解算方法, 可以解算出物体的位置坐标, 通过对比我们可以看出本方法具有收敛性以及稳定性。

3) 拍摄时的拍摄效果会影响解算坐标的准确性, 拍摄效果越好, 解算的坐标越接近真实坐标, 反之则误差变大。

参考文献

[1]王宝丰.计算机视觉工业测量系统的建立与标定[D].解放军信息工程大学测绘学院, 2004.

[2]黄桂平.数字近景工业摄影测量关键技术研究与应用[D].天津:天津大学, 2005.

[3]谢磊, 谢建平, 毛学农, 等.基于普通机相的相对定向直接解法[J].计算机工程与应用, 2001 (09) :93-96.

[4]冯文灏.关于近景摄影机检校的几个问题[J].测绘通报, 2000 (10) :1-3.

[5]保文星, 虞鹤松, 林卫公.基于普通数码相机的影像匹配技术[J].测绘工程, 2003, 12 (2) :30,

数据仓库工程师的主要职责 篇10

1.建设公司级数据仓库,并根据业务变化持续迭代和优化;

2.对业务数据进行梳理和抽象,建设数据仓库的数据模型;

3.对业务数据进行采集、清洗、转换和存储;

4.支撑BI、用户数据、用户运营、用户画像、房源数据、推荐系统等核心数据平台产品;

5.研究大数据前沿技术,不断持续优化大数据平台,为业务提供价值。

任职资格:

1.本科及以上计算机、统计学、数据库、机器学习等相关专业,5年以上数据相关工作;

2.对业务数据有敏锐的理解能力,并能快速梳理和分析业务数据;

3.熟练掌握SQL语言、熟悉MySQL,对Shell、Java(主要开发语言)、Python编程非常熟悉;

4.熟悉常用的ETL技术和原则;精通数据仓库数据库设计规范和实操;

5.熟悉Hadoop、Hive、HBase、Spark、Storm等开源平台者优先;

手机系统测试工程师的主要职责 篇11

1、执行现有测试用例,包括软件测试和硬件测试;

2、负责对发现的软件问题进行跟踪分析和报告;

3、负责构建测试环境,设计测试用例;

4、负责内部产品功能测试、系统测试,及对产品的功能、性能及兼容方面的全面测试;

5、负责外部公测的前期协调,用户反馈的搜集、整理、鉴别和跟进工作;

6、在项目中保持有效沟通,推动问题解决,与产品经理、开发工程师等密切合作。

【任职资格】

1、大专以上学历,有3年或以上手机软件测试经验;

2、熟悉测试流程、测试理论及测试方法;

3、具备良好的需求、问题分析能力;

4、具备良好的内外部沟通能力以及团队协作精神 ;

5、有丰富的系统技术知识,熟练使用BUG管理系统;

6、熟悉Android系统者、或熟悉测试工具者优先;

视觉算法工程师的主要职责 篇12

在机器人研究领域里,无人机系统已经成为一个主要趋势,在无人机降落过程中,对降落目标的识别以及无人机位姿估计是两个至关重要的问题。文献[3]中采用net-Recovery方法,系统整体分为地面系统和无人机搭载系统。无人机搭载系统负责图像采集以及控制无人机的飞行,通过GPS和IMU收集位置信息;地面系统负责图像处理,获取基于视觉的位置和速度评估值。文献[2]中设计了一种新型降落目标模型,充分应用到几何特性。由此篇文章的启发,本文中也自主设计了一种易于识别的模型,在识别之后,先将目标区域进行分割,然后再进行无人机位姿估计。文献[5]中的设计是基于文献[2]中设计的目标识别的改进,考虑到了光线及遮挡问题,提取效果较好,增强了目标识别的鲁棒性。文献[6]提出了一种新型着陆模型,用到同心圆图形比例关系,但没有给出侧方检测出椭圆时的处理方法。文献[1]和文献[4]中都提出了一种目标分割的方法和流程。文献[1]中应用到了直方图均衡、图像分块匹配及Cam Shift算法提取图像轮廓。而本文应用彩色直方图分割,先确定图像中是否有降落目标,再通过椭圆拟合和椭圆分割,将目标图像分割出来,然后再通过坐标转换,将位置估计转化为一个一元十二次方程的求解问题。

本文采用一种新型着陆目标,如图1所示,本图形由一个六边形、三个同心圆和一个等边三角形组成,每个图形的边长如表1所示。每个图形与其外围图形之间有颜色区分,着陆目标大部分都为红色,少部分为白色。视觉算法流程图如图2所示。

1 基于彩色直方图及椭圆拟合的目标提取

本文采用HSV颜色模式,通常采集的图片颜色模式为RGB,但是RGB模式对颜色的失真度较大,所以首先将RGB模式转为HSV模式,其中H代表色相,通过公式1求取红色像素个数。

其中M为红色像素个数,N为总像素个数。当比例满足一定阈值时,我们认为图像中有要寻找的着陆目标;否则,直接进行下一帧图像检索,如公式(1)所示。考虑到目标远近及角度问题,其中Color Treshold阈值我们取0.05。

初步预判图像中是否有着陆目标后,采用边缘识别比较优秀的Canny边缘检测算法进行检测。为了防止边界细小并且出现细小的断续,我们采用膨胀腐蚀方法对图像进行处理。先做膨胀,使图形闭合,再做腐蚀,消除膨胀后边界过粗现象。

边缘检测好后,我们采用最小二乘法进行椭圆拟合,椭圆的表达式如公式(2)所示。其中包括六个位置参数,令α=[αuu,αvv,αuv,αu,αv,α0],w=[u,v],求出椭圆参数。求出的椭圆方程满足所有边界点与其距离差方和最小。接下来通过椭圆过滤,滤掉不规则的外部边界以及着陆目标中非椭圆部分。在拟合出的椭圆中会得到长半轴和短半轴长度m和n,这里我们将m和n的范围同时扩大或缩小相同的倍数,使得一个椭圆变成一个椭圆簇,椭圆簇中每个椭圆的旋转角度相同,两个焦点坐标相同,短半轴与长半轴的比例相同,即满足公式(2)的关系。本文中Threshold1设在0.85~1.15之间,同时我们计算满足公式(2)的点数占边缘点数的比例,比例范围在一定区间的椭圆才确定是我们需要检测出的边缘,如表达式(3)所示。本文中Threshold2设为0.95。因为我们所选择的图形椭圆比例固定,并且圆映射后其半径会映射为椭圆的长半轴长度,在检测出的椭圆中我们需要进行不同椭圆长半轴之间比值判断,这里我们只判断外圆和第二层圆的比值,而内部圆形用于圆心的定位,比例如公式(4)所示,δ范围为0.95~1.10。

单位:cm

当椭圆确定后,因为范围大的椭圆对圆心估计的失真较大,所以我们根据识别出来的最小椭圆来判定圆心坐标,同时根据外圆半径与六边形的比例关系,可以确定着陆目标的范围,通过基于Ramer–Douglas–Peucker(RDP)算法多边形拟合,可以降低曲线中的点数,只保留顶点坐标,通过判定顶点坐标是否全部都在预先确定的着陆目标范围内而排除干扰图形。其中顶点坐标范围判别如公式(5)所示,L为六边形顶点到圆心距离,Threshold3为阈值,设为1.2。

通过以上公式,可以提取出六边形和三角形,并且过滤掉外围干扰边缘。

2 位置估计及参数估计

当我们得到椭圆方程后,根据外圆的参数,可以得到长短半轴与坐标轴平行时椭圆的横滚角为φ、长半轴长为m,短半轴长为n,如公式(6)~(8)所示。空间位置具有六个自由度,即,其中V是无人机相对于着陆目标原点的空间位置坐标,R是无人机相对于着陆目标原点的角度坐标,ad为俯仰角,γd为偏航角,φd为横滚角。其中,φd可以通过椭圆参数求得的φ直接得出,而其他五个参数可以通过坐标转换得出,各坐标系之间的关系如图3所示。

在摄像机拍摄的图像中,设光心与地面交点为原点O,光轴在水平面投影为X轴,水平面上与X轴垂直的为Y轴,与水平面垂直的为Z轴,以O为坐标原点的地面坐标系为OXYZ。以Y轴为旋转轴,将OXZ平面旋转α角,使Z'轴与光轴重合,得到O'X'Y'Z'坐标系。在获取的图像上,我们以图像的中心为坐标原点,图像横向为U轴,图像的纵向为V轴,光心为原点Oc,即图像中心。由于拍摄图像时摄像机会有一定的横滚角φ,即椭圆与图像U轴的夹角,让坐标系OCUV旋转φ角度,使横滚角为0℃,旋转后的坐标轴为O'CU'V',坐标系O'CU'V'为坐标系O'X'Y'Z'的投影。令OOC长度为h,圆心在OXYZ中的坐标为(x0,y0),大圆的半径已知为R。

地面坐标系中,圆的方程如公式(9)所示;坐标系OXYZ与坐标系O'X'Y'Z'的转换关系如公式(10)所示;坐标系OCUV与坐标系O'CU'V'的转换关系如公式(11)所示。

从坐标系O'X'Y'Z'到坐标系O'CU'V'的映射满足小孔成像映射原理,其映射表达式如(12)所示,其中f为摄像机焦距。图像中椭圆的一般方程表达式如(13)所示,由坐标系OCUV旋转φ角得到坐标系O'CU'V'后,椭圆的表达式如(14)所示,由表达式(9)、(10)、(11)、(12)和(14)解得椭圆方程的参数如(15)所示。[αuu,αvv,αuv,αu,αv,α0]已知,φ角可直接由公式(8)求得,所以由(13)可求得O'CU'V'坐标系中椭圆方程的参数如公式(17)所示。

联立(15)和(17),并令得关于x的一元十二次方程,将j由公式(8)求得值带入公式(1 7)中求[α'uu,α'vv,α'uv,α'u,α'v,α'0]的值,椭圆短半轴与长半轴的比值是COSα,将[α'uu,α'vv,α'uv,α'u,α'v,α'0]和α值带入(15)中,可求出[x0,y0,h]的值。

图3中我们令坐标系OdXdYdZd以圆心为原点,以OdOc轴在水平面投影方向为Xd轴,以Xd轴垂直方向为Yd轴,以垂直水平面方向向上为Zd轴,光心在OdXdYdZd坐标系中的位置为[xd,yd,zd],如公式(1 8),俯仰角、偏航角和横滚角可如公式(19)解得。至此无人机的六个自由度都已求出。

3 实验结果

3.1 不同角度和光线下目标提取效果

在室外通过无人机拍摄,将摄像机固定在无人机下方,获取不同光照条件下地标图形,图4是在普通自然光下地标提取效果图,图5为在光照较暗的条件下提取的效果。

在自然光和阴暗条件下,通过不同角度拍摄,目标识别效果均比较理想,可以排除噪点的影响。红色部分为改进的椭圆拟合提取的椭圆图形,蓝色和绿色部分为多边形拟合提取的结果,多边形拟合过程中会对三角形和六边形做不同的处理,以充分识别多边形的形状,中间的红色原点为识别出来的圆心位置。可见本文目标提取算法可以准确提取目标,可以有效排除周围噪点的干扰,在不同光线和拍摄角度下提取效果均比较理性,可见本文算法具有良好的稳定性。

3.2 基于椭圆和多边形的位姿估计

表2和表3分别是在自然光和光线较暗的条件下的位姿估计结果。拍摄高度在40cm~180cm范围,水平距离在20cm~200cm范围内,横滚角控制在20°以内,偏航角在50°以内,俯仰角30°~80°之间,实验结果比较准确,但是在俯仰角较小而偏航角较大的情况下误差会增大,但仍能控制在5cm范围内,说明本文能够满足无人机定位的要求。

4 总结

本文设计了一个新型着陆模型,利用HSV彩色直方图排除无目标图像,通过改善的椭圆拟合和多边形拟合识别着陆目标,识别结果理想,对光照和旋转有很高的鲁棒性。本文通过坐标变换及椭圆方程的性质求得无人机位姿,误差控制在5cm范围内。实验结果充分证明本文方法稳定可行。

参考文献

[1]Zhao Y,Pei H.An improved vision-based algorithm for unmanned aerial vehicles autonomous landing[J].Physics Procedia,2012,33:935-941.

[2]Cocchioni F,Mancini A,Longhi S.Autonomous navigation,landing and recharge of a quadrotor using artificial vision[C]Unmanned Aircraft Systems(ICUAS),2014 International Conference on.IEEE,2014:418-429.

[3]Kim H J,Kim M,Lim H,et al.Fully autonomous vision-based net-recovery landing system for a fixed-wing uav[J].Mechatronics,IEEE/ASME Transactions on,2013,18(4):1320-1333.

[4]Hui C,Yousheng C,Xiaokun L,et al.Autonomous takeoff,tracking and landing of a UAV on a moving UGV using onboard monocular vision[C]Control Conference(CCC),2013 32nd Chinese.IEEE,2013:5895-5901.

[5]Cocchioni F,Frontoni E,Ippoliti G,et al.Visual Based Landing for an Unmanned Quadrotor[J].Journal of Intelligent&Robotic Systems,2015:1-18.

算法工程师的职责表述 篇13

1、维护、扩展的大数据处理分析平台;

2、负责将先进的工业大数据分析技术转化为标准化的分析工具与模块;

3、规范并优化算法,提高可靠性;

4、帮助建立标准化的数据分析路线图,能够提取、转换并加强数据及其内在价值;

5、开发与应用分布式数据分析技术,人工智能技术,帮助客户挖掘数据潜在价值,并转化为新的产品与项目。

岗位要求:

1、有数据ETL、数据清洗、数据预处理方面相关经验;

2、熟悉各种数据库类型;

3、有数据分析平台使用经验,了解Hadoop 生态系统;

4、熟悉spark计算引擎,包括其生态环境与应用库,如SQL、DataFrames、MLlib、GraphX、Spark Streaming;

视觉算法工程师的主要职责 篇14

职责:

1.负责360IOT业务线家庭智能安防产品的硬件固件测试,负责从试产到量产导入的品质保证工作;

2.根据项目需求、硬件规格书以及相关测试标准,设计测试标准以及测试计划、编写测试用例、执行测试,保证测试质量,并总结设备通用测试用例。

3.负责对硬件质量问题进行跟踪分析和报告,推动测试中发现的问题及时合理地解决,向研发部门提供产品技术以及体验性能改进方面的建议,并追踪落实;

4.负责产品认证技术相关的支持工作,配合公司软件与硬件对接测试工作;

5.负责硬件固件自动化测试与效率提升;

6.负责售前售后反馈问题验证。

职位要求:

1.通信、电子、计算机等相关专业,统招本科及以上学历;

2.三年以上硬件固件测试经验,熟悉工厂生产流程,熟悉从试产到量产导入的品质要求;

3.了解C、C++语言,了解嵌入式测试基本方法;

4.具备基本的电路等相关知识,熟悉硬件工作原理,能够读懂原理图位置图;

硬件测试工程师岗位的主要职责描述2

职责:

1、熟练完成各类产品售后服务工作,及时解答客户疑问

2、在客户、市场、技术之间起到良好的交流沟通作用;

3、实施方案撰写,产品的实施部署及故障排查;

4、解答客户的有关技术方面问题,为顾客提供技术服务

5、负责软件和硬件的测试工作

任职要求:

1、计算机、电子及相关专业

2、了解基本电子电路、网络知识

3、熟练掌握办公OFFICE软件

4、有清晰的表达、沟通能力、学习能力

5、工作细致认真,责任心强

硬件测试工程师岗位的主要职责描述3

职责:

1、负责公司产品的硬件系统测试管理工作,与开发人员、项目管理人员沟通和协作,推动整个项目的顺利进行;

2、编写公司产品的硬件测试方案与计划,完成公司产品测试工作任务;

3、输出测试文档、测试报告,提交测试结果;

4、进行测试环境的设计、设置,完善测试规范流程,创建和维护测试用例;

5、维护测试流程,统计和分析测试结果,提高测试效率和质量参与测试结果评审。

6、主导跟进产品硬件的投诉,协调本公司和外围资源排查问题,拟定对策和方案,及时解决问题。

岗位要求:

1、___年以上正规的硬件测试工作经验,从事过中到大型硬件测试项目或者开发项目,并能帮助项目团队解决测试中遇到的疑难问题;

2、具备产品测试理论,熟悉测试流程和正规的测试策略;

3、精通产品测试方法和技术,对各种自动化测试工具、压力测试工具、缺陷追踪工具,有比较深入的应用经验,能熟练编写测试相关文档

4、擅长通过先进测试技术引入和测试流程改进提高测试效率和质量,能全局制定和控制一个产品形态完整的测试方案;

5、团队管理协作能力强,具有良好的沟通能力,有较强的独立工作能力和解决问题的能力;

6、具备各种测试环境维护和搭建、问题排查;

硬件测试工程师岗位的主要职责描述4

职责:

1、按照产品要求制定、编写产品测试方案与计划,负责执行产品标准和相关技术文件;

2、负责编制产品研发、产品生产阶段测试流程、测试规范,整理测试报告;

3、负责首批投产(小批试制)产品的测试工作,分析生产过程中的所有测试问题,提出设计改善建议或完善生产指引;

4、负责按项目计划组织完成产品研发设计验证和产品可靠性评估;

5、跟踪产品批量生产测试问题,提出改善建议或完善生产指导。

职位要求:

1、电子、自动化、测控等相关专业本科以上学历,___年以上硬件测试工作经验;

2.掌握常用数字、模拟电路原理,有较丰富的的硬件、软件测试经验;

3、深入理解电子产品的工装夹具设计、装配流程、生产工艺、可靠性、成品率等批产关键环节;

4、具备较强的团队协作观念和沟通协调能力,能承受较大的压力,工作态度主动、认真负责。

硬件测试工程师岗位的主要职责描述5

职责:

1、设计、编写测试规范、测试用例,编写产品测试报告等相关文档。

2、对研制阶段样机焊接、组装、软硬件测试;对元器件进行性能功能测试。

3、设计、开发测试工装,协助研发和工艺做相关工作。

4、参与研发项目讨论等相关事宜。

5、有能力者可转开发岗位

任职资格

1、大学专科及以上学历(条件符合者专业可以放宽);

2、熟悉硬件测试的各种基础仪表及相关的硬件设计软件;

3、熟悉相关领域的基本理论知识;熟悉并掌握各种测试仪器的使用;

4、较强的学习能力和良好的沟通能力,善于团队合作;

视觉算法工程师的主要职责 篇15

在信息技术领域, 图像压缩已经成为一个十分重要的课题。目前出现的图像压缩技术已达到上百种, 但是压缩比和压缩效果不佳, 且编码、解码时间过长, 远不能满足当前信息时代的需要。分形图像编码技术是一种思想新颖的图像压缩技术, 具有压缩比率高、解码分辨率无关、解码速度快等优点, 受到了国际科学界的广泛关注。但是, 分形编码技术具有不对称性, 虽然具有很高的压缩比且能快速解码, 但是编码时间非常长, 使得该技术一直没有得到广泛应用。因此对如何加快分形编码速度方面的研究将具有重要的理论意义和实际意义。

2 分形图像压缩的基本原理

图像数据的分形压缩是利用图像的自相似和自仿射性质, 寻找生成该图像的若干局部IFS, 将所得的局部IFS参数保存起来, 形成编码文件 (即压缩后的图像) , 这就是编码过程。分形压缩的理论基础是迭代函数系统定理和拼贴定理。至于解码过程, 是从任意一个初始图像出发, 用编码文件中的局部IFS参数, 经过若干次迭代生成不变集, 所得到的就是与原图像近似的一个图像。

2.1 经典的分形图像压缩算法

Jacquin首次成功实现了分形图像压缩的全自动算法[1], 该算法成为分形图像压缩的一个新的里程碑, 其编码算法的主要步骤如下:

步骤1:对大小为M×M的原始图像G进行正方形分割, 得到互不重叠且大小相同的2k×2k的图像子块, 将其称为值域块, 用R表示, 以下相同。

步骤2:对于每一个R块, 在原始图像G中找出一个尺寸为2k+1×2k+1的子块D (称之为定义域块, 用D表示, 以下相同) , 确保对D进行灰度仿射变换及空间变换后, 所得到的D′与R之间的平方误差值最小。

步骤3:对于每一个值域块R, 记录下面5个参数:

(1) 搜索到的最佳匹配子块D的左上角坐标 (dx, dy) 。

(2) 使R与D成为最佳匹配的等距变换的序号n (一共有8种等距变换) 。

(3) 灰度对比度因子w, 灰度平移因子g。

以上参数便为原始图像的IFS码, 解码时可从任意一个初始图像出发, 利用这些IFS码, 经过10次迭代生成不变集, 得到与原图近似的重建图像。

3 基于视觉阈值分割的分形图像编码算法

Jacquin的算法是将图像分割成固定尺寸的方块, 但图像的自相似性不一定会精确地落在给定尺寸的方块内, 因此影响了压缩效果。于是学者们提出了更多的分割方法。由Fisher等人提出的四叉树分割法[2]最大特点在于可依据匹配误差及压缩比自适应地调整子块和父块的尺寸, 尽可能合理地分割图像。与Jacquin的基本分形压缩算法相比, 虽然解码图像质量有一定下降, 但具备灵活的分块机制和较高的压缩比, 使其较为流行。HV分割法将原始图像分割成一系列矩形子块, 对于搜索不到匹配父块的子块, 水平或垂直地将其划分为两个矩形区域, 在划分时须使矩形子块的边与图像中出现的水平边、垂直边位置对应, 使得子块与父块的图像内容具备自相似性, 故能更好地进行匹配。

3.1 基于视觉阈值分割的分形图像编码算法的提出

四叉树分割法、HV分割法及其后续的一些改进方案, 基本思路都是把图像分割成矩形, 但均未考虑到人类视觉系统 (HVS) 的特性, 故无法确保图像子块间的相似性一定能落在矩形块内。由于人眼对灰度的分辨能力仅有几十个数量级, 故在一幅相邻像素灰度值相近的的灰度图像中, 即便其包含的信息量较为丰富, 人眼也难以精确地识别和提取。这说明了人类视觉系统的一个显著特性就是非均匀、非线性的认知图像, 即人眼并不能完全感知到图像中的任意细节和变化。因此, 如能把压缩过程中一些由数量化误差引起的解码图像变化控制在人眼无法察觉的范围内, 就能够在HVS认可的相同图像质量下获得较高的压缩比。

本文提出了一种基于视觉阈值分割的分形编码方案, 是在改进的四叉树法的图像块分割过程中, 引入了检测像素灰度值一致性的步骤, 即划分过程中要确保同一块内的各像素灰度值的取值范围不超过给定的阈值S。S的取值一般为几十个数量级, 这是由人类视觉系统的特性决定的。

与Fisher等人提出的四叉树分割法相比, 本文提出的算法主要改进的方面为:

(1) 对值域块的分割方案。若值域块内所有像素灰度值的两个最值之差超过给定阈值, 则把该值域块分割成4个尺寸相同的子块, 直至小于给定阈值或达到预设的图像分割尺度时, 则分割过程停止, 最后得到多种不同尺寸的R块。本方案将HVS的视觉阈值这一特性纳入了考量, 按照一致性准则, 图像块的相似性必定落在矩形内。

(2) 对定义域块的分割方案。首先将M×M的原始图像G整体进行水平与垂直的1/2的子采样, 得到子采样图像G′, 其尺寸为 (M/2) × (M/2) , 该方法通过对图像整体的一次子采样即实现了对全部D块的缩放, 大大加快了编码速度。随后采用对值域块的分割方案对采样图像G′进行定义域块分割, 最后得到多种不同尺寸的D块。

(3) 对搜索D块方案的改进。寻找与某一R块形成最佳匹配的D块, 只需搜索D池的一个子集, 该子集中所有D块的尺寸均与该R块相同, 故避免了对D池进行全域搜索, 有效地缩小了搜索范围。因此, 本文算法总的搜索空间仅仅为不同尺寸值域块的总数和定义域块的总数的乘积之和的8倍, 之所以要乘以8是因为每个定义域块还存在8种等距变换。

显然, 这种基于视觉阈值的分割方案能极大地缩小搜索空间, 从而也能显著地降低编码时间, 并且由于引入HVS的视觉阈值分割方案, 也保证了重建图像的质量。设原始图像G的尺寸为M×M, 以下是编码算法的详细步骤:

步骤1:给定视觉阈值Q, 将G分割为4个尺寸相同的正方形子块, 对每个子块进行一致性标准检测, 即检测子块内像素灰度值的取值范围不超过阈值Q。

步骤2:设置分割R块时的深度范围, 即R块尺寸的最大值、最小值。

步骤3:若子块尺寸分割已达最小深度范围, 即便其各像素灰度值的范围大于Q, 仍停止分割;否则若块内像素灰度值范围大于Q, 则将其分割为4个更小的正方形子块, 并对这些子块进行深度范围检测和像素灰度值范围检测。

步骤4:循环执行步骤3, 当全部方块的像素灰度值范围均不超过Q时 (即满足一致性标准) , 退出循环, 得到所有R块。

步骤5:对G进行水平与垂直的1/2的子采样, 得到次采样图像G′, 其尺寸为 (M/2) × (M/2) , 将G′分成4个大小相同的方块, 判断每个方块是否满足一致性标准。

步骤6:重复步骤3, 直到所有的方块都满足一致性标准才结束。得到多种尺寸的D块, 形成D块池。

步骤7:对任意R块, 在D块池中搜索一个尺寸相同的最佳匹配D块。使得D经空间位置变换和等距变换后, 与R块具有最小平方误差。

步骤8:记录每个R块的如下参数:最佳匹配D块的空间坐标 (其左上角坐标dx, dy) 、等距变换的编号i、灰度对比度因子w、灰度平移因子g。

3.2 实验结果

本节将本文提出的算法和基本的Jacquin算法进行了实验比较, 以期证明本文算法的有效性和正确性。在本实验中机器配置为:OS为Windows XP, CPU为P4 3.0G, RAM为2G。实验环境为Matlab 6.5, 通过编程分别实现了这两种算法。在本实验中, 基本Jacquin算法的值域块的大小定义为4×4, 定义域块的大小定义为8×8, 定义域块的水平和垂直移动步长均设定为4;根据客观情况, 为了获得较好的重建图像质量, 方块 (定义域块或值域块) 所允许的最小与最大尺寸分别定义为4×4和8×8。根据HVS的特性, 阈值Q通常是几十个数量级。以256×256×8的标准灰度图像Lena和Goldhill为测试对象, 本实验获得了Q为30、60、90的实验结果, 如表1所示。

当采用Jacquin的基本分形算法时, 由于对图像进行分割后所获得的值域块的总数是一个固定值, 如在本实验中即为:S=256/4×256/4=4 096, 因而采用Jacquin的基本分形算法时图像的压缩比为:C=256×256×8/ (4 096× (6+6+3+5+7) ) =4.74。

而当采用本文算法时, 压缩比是会随着阈值Q的变化而变化的。表1中压缩比C的计算公式是:C=256×256×8/ (S× (6+6+3+5+7) ) , 其中S表示值域块的总数。其中, 定义域块左上角的坐标值dx和dy被量化为6 bits和6 bits, 等距变换的矩阵号i被量化为3 bits, 灰度对比度因子w被量化为5 bits, 灰度平移因子g被量化为7 bits。本实验结果中的压缩比C是在熵编码前所获得的。

4 结论

本文将改进的四叉树分割方案同时应用于定义域块和值域块的划分上。同时, 基于人类视觉系统理论, 对传统的定义域块的搜索方法进行了改进, 提出了一种新的搜索方法。最后, 基于基本分形算法, 提出并实现了一种基于视觉阈值分割的分形图像压缩算法, 并将其与基本分形算法通过实验进行了比较。实验结果表明该算法是一种有效的图像压缩方法。

参考文献

[1]A E Jacquin.Image Coding Based on a Fractal Theory of Iterated Contractive Image[J].IEEE Transactions on Image Processing, 1992, 1 (1) :18-30.

[2]Y Fisher.Fractal Image Compression:Theory and Application[M].New York, NY:Springer, 1994.

[3]朱伟勇, 于海, 宋春林.基于误差阈值和分层搜索的快速分形图像压缩方法[J].小型微型计算机系统, 2005, 26 (2) :277-280.

上一篇:从概念整合理论看比喻的句法形式下一篇:安全投入台账记录表