播放技术(精选12篇)
播放技术 篇1
摘要:随着人体感知技术的不断发展, 基于人体感知智能播放技术的应用越来越广泛。本文针对目前基于人体感知的智能播放技术的应用情况进行了总结及概述, 对现有的应用领域进行分类介绍, 并通过举例的方式介绍了目前最前沿的应用实例, 以利于未来对本技术的进一步深入应用和探索新的应用空间。
关键词:人体感知,人体识别,智能播放
0 引言
现今的技术应用中, 用户体验至关重要, 如何让用户快速获取想要的信息, 让商家迅速捕捉用户, 如何自动的推送给用户想要的信息是最值得关注的。智能化的实现“所需即所送”、“所送即所需”是媒体发布的终极目标。基于人体识别技术的媒体播放显然更贴合该目标。由此不断演变出人体感知播放技术的新的应用, 本文将对所有应用领域进行深入分析总结, 以利于对本技术的继续深入应用和探索新的应用空间。
1 人体感知播放技术
人体感知是指通过传感器技术识别人体。人体识别技术涉及到模式特征识别和行为特征识别, 其中模式特征是与生俱来的人体特征, 比如人脸、指纹、虹膜等;行为特征则是后天个人习惯形成的, 例如步态、姿态、手势等[1]。目前, 人体感知在近几年有了飞跃的发展。
基于模式/行为的人体感知播放技术就是根据基于人体模式特征/行为特征识别的感知技术, 获取人体的模式特征/行为特征, 对其进行分析判断, 然后根据预设策略进行相应的智能播放。
2 人体感知播放技术应用
2.1 广告领域的应用
基于人体感知的广告播放主要可以实现两种智能播放功能:
1) 人体存在感应播放
所谓“人体存在感应播放”是指在检测到有人体出现时才进行播放。
例如, 当远红外感应器探测到广告受众接近广告音频播放装置时, 远红外感应器输出一个触发信号给微处理器, 微处理器接收到信号后输出一个播放信号给音频播放器, 音频播放器开始播放音频内容。
2) 人体特征感应播放
所谓的“人体特征感应播放”是指在识别出人体的情况下, 根据人体特征有针对性的匹配适合的广告, 将与目标人群对应的广告项推送到该目标人群所面对的屏幕上。
人体特征感应广告播放的精准性高, 减少了广告资源的浪费。达到了“因人而异”的广告投放的智能播放效果, 按照不同的“人体”选择不同的广告, 提升了媒体的整体价值, 也提升了目标人群的个人体验。
2.2 智能家居领域的应用
以下介绍几种目前主流的基于人体感知技术的智能播放家居产品:
1) 基于人体感知技术的音视频播放装置
基于人体感知技术的音视频播放设备可以检测目标区域内的人体对象, 当在预设的时间范围内没有检测到人体对象时, 则控制音视频播放设备进入待机状态。避免音视频播放设备始终处于音视频播放状态。
2) 基于人体感知技术的智能机顶盒
以监测老年人睡眠状态的智能机顶盒逐渐成为一个趋势。例如通过智能机顶盒的摄像传感模块与红外传感模块监测老年人是否睡着, 睡着后自动将电视音量调小, 然后切换到音乐频道先播放舒缓的音乐, 再自动将电视关机, 之后通过发出轻微的震动唤醒老年人, 使其进行正常的睡眠。
3) 基于人体感知技术的耳机装置
基于人体感知技术的耳机具有可侦测是否与人体耳朵相接触的功能, 当耳机装置脱离人体耳朵时, 耳机装置便停止传输音乐以减少电源的浪费。
4) 手势控制音视频播放装置[2]
手势是一种自然而直观的人机交流模式, 可以通过手势来控制视频播放的开始、结束、前进、后退、声音控制等。使得视频播放控制更加直观、自然、人性化。
2.3 智慧健康领域的应用
基于人体感知技术的智能播放则可以通过对人体健康的检测, 实现音乐治疗、实时监测、即时提醒等功能。这类应用主要体现在如下几种类型:
1) 基于人体感知技术的音乐治疗仪
音乐治疗的积极意义不言而喻。例如智能心情调整仪, 根据心跳频率、人体温度、人体阻值及手指温度等获取心情, 这些因素均可利用相应检测仪的传感器采集相关数据, 作为建立情绪数学模型的输入参数, 获得精确数字模型。对情绪状况进行分析, 并自动播放适合的音乐, 逐步调整使用者的心情, 使人获得一种积极的阳光心态。
2) 基于人体感知技术的健康报警装置
通过对人体健康参数的监测, 在出现意外情况时进行相应的报警。例如人体跌倒报警器, 能将被检测对象的姿态、视频信息等进行上传, 同时能与上位通信功能进行通话, 为监护人提供多种被检测对象的检测信息, 全方位监护老人安全。
2.4 智能安防领域的应用
目前, 人体感应播放在安防领域的应用主要体现在以下方面:
1) 基于人体检测的智能家居安防报警系统
如门磁感应器, 当有盗贼非法闯入时报警;再如红外感应器, 安装在窗户和阳台附近, 红外探测非法闯入者。
2) 基于人体身份检测的区域安防报警系统
应用在建筑物的出入口对人的进、出监测, 例如通过人体感应技术识别人体特征信息, 对进出人员的身份进行检测、记录。当发生意外情况时及时向保安中心报警。
3) 基于人体状态检测的智能驾驶报警系统
通过获取驾驶行为检测信息 (例如驾驶员的表情、瞳孔、动作等) , 当发现驾驶行为达到一定条件时获取相应的提醒视频, 该提醒视频包含与检测到的驾驶行为相对应的事故内容, 并由视频播放设备播放该视频。以“眼见为实”的方式促使驾驶员改掉不良的驾驶习惯。
2.5 智能建筑领域的应用
智能楼宇电视能够识别站在电视面前的受众, 通过制定好的识别策略获取识别信息, 根据所识别信息匹配媒体资源, 进行有针对性的推送和播放。这样突出服务性, 易于被受众接受, 增强了互动, 产生了收益渠道。
2.6 其他应用
伴随着人体感知技术的不断发展, 陆续出现越来越多的新应用领域。以下介绍其中的几种。
1) 智能播放教学设备
人体感知播放技术在教学设备上的应用有很多种。例如虚拟星空教学设备, 包括感应学生所在位置的感应器、感应及分析学生动作的三维动作识别器等。将模拟星空投射在成像屏上, 通过多媒体播放, 使学生产生一种身临其境的感觉, 吸引学生的注意力, 具有广阔的发展前景。
2) 车载影音设备
基于脸部识别技术的车载音乐设备能根据用户的面部情绪, 自动下载与用户的面部情绪相应的音乐并播放, 例如在情绪低落时下载并播放安抚性的音乐, 在疲劳时下载并播放劲爆的音乐, 使得音乐欣赏更智能化, 同时减少事故, 尽量消除不良情绪对行车的影响。
3) 手语翻译系统
通过动作识别设备采集人体的运动图像, 对其进行解析, 经图像合成与仿真, 最后得到相应的动作视频, 再将视频信号转化为语音信息播出, 就能实现基于动作识别及语音合成技术的手语翻译系统。
3 总结
通过上述的应用介绍可以看出, 目前基于人体感知的智能播放技术应用非常广泛, 一些传统的应用也在不断深入扩展。同时, 除了传统的应用领域外, 还不断探及新的不同领域。尤其伴随着人体感知技术的进一步发展, 其适用性越来越高, 使得很多概念性的想法变成可实现, 推动了基于人体感知的智能播放技术的深入发展, 呈现出多领域、新花样、更人性的特点, 为日常生活增添了不少的便利和乐趣, 使得科技更近于人。鉴于人体感知智能播放技术的普适性, 未来一定会出现更多、更新颖的应用。
参考文献
[1]卢世军.生物特征识别技术发展与应用综述[J].计算机安全, 2013 (01) :63-67.
[2]赵爱芳, 等.复杂环境中多信息融合的手势识别[J].计算机工程与应用, 2014 (05) :180-184.
播放技术 篇2
摘要:随着数字编解码及压缩技术的发展,语音文件也朝着高压缩比、高保真的方向发展,从MP1、MP2到目前的MP3格式。本文设计了一种廉价基于DSP的MP3播放器,利用硬件存储语音文件,并能够从PC 机下载,从而可以随时更新MP3音乐。该MP3播放器同时附加了文本阅读的功能,可做到语音和文本的同步输出。
关键词: MP3播放器 DSP 编码
前言
现在市场上推出了各种型号的MP3随身听,它们采用先进的智能控制技术,利用先进的芯片,不仅实现了MP3格式语音的播放,而且集多种功能于一身。
但这些精巧的随身听价格较昂贵,因此本文根据要求设计了一种廉价MP3播放器,利用硬件存储语音文件,并能够从PC 机下载,从而可随时更新MP3音乐。该MP3播放器同时附加了文本阅读的功能,可做到语音和文本的同步输出。
MP3播放器系统构成
MP3播放器系统结构由图1所示,根据MP3播放器特点要求选择了TI公司的TMS320VC5402芯片,该DSP芯片优越的效价比既可充分胜任本设计的信号处理又能满足本设计要求的价廉目的。而主机选用功能较强的AT89C51芯片。
设计原理上,C5402芯片的信号处理部分和89C51的智能控制部分来分别完成电路设计,并相应制作两块PCB,可以明确设计思路,实物的大小也减半。
由图1,MP3播放器系统选用大容量的FLASH MEMORY作为主存储器硬件存储语音文件,DSP程序也存储在FLASH中,运行时再引导到DSP的高速RAM,从而省去DSP芯片部分的程序存储空间。利用串口通信电路可以实现由PC机下载语音文件功能,利用液晶显示屏LCD,还可以从PC机下载小说并在LCD上阅读。
DSP、MPU硬件设计
MP3播放器中,DSP芯片的Bootloader采用了HPI口方式。由于在硬件上HPI引脚与DSP的数据、地址总线引脚是相互独立的,同时HPI口内部又有控制机制,所以外部主机通过HPI口访问DSP内部RAM时不会影响DSP的正常运行。HPI利用DSP芯片上1000H地址开始的一块具有共享存储器功能的2K字RAM,来实现主机与从机间的数据交换。
DSP扩展了一片64K字高速静态RAM(CY7C1021V33-10),作为DSP芯片的片外RAM,用以适应各种音频处理算法对存储器容量的要求。
DSP芯片处理后的信号由D/A输出到耳机,我们就可听到MP3音乐。D/A变换由LM4545实现,它具有48K字转换速度,可直接和DSP芯片的输出相连。
而MPU主要完成三项功能,分别是LCD显示,控制DSP芯片的运行和文件的串口下载。89C51与29F040B的连接电路如图2所示。
MPU用来访问FLASH的地址线由P0口和P2.0~P2.5组成。这14根地址线既提供14位页内地址又提供5位的页码地址,P0口同时与两片74LS373相连,分别以P3.5和ALE作为这两个芯片的片选信号;第一片74LS373A输出信号的低5位作为5位页码地址与29F040B的A14~A18连接,第6位作为片选信号连接29F040B的CS,后两位则留作以后扩展用;第二片74LS373B的8位输出连接29F040B的A0~A7;89C51的`P2.0~P2.5直接连接29F040B的A8~A13,和74LS373B的8位输出共同构作14位的页内地址。
相应的寻址过程(假设访问地址1FFFFH)是:第一步,先将P3.5置1,打开74LS373A,再向 P0口写入所要寻址的页码地址,1FFFFH的页码为7H;第二步,再将P3.5置0,关闭74LS373A,向P0口和P2口写入14位页内地址,1FFFFH的页内地址为3FFFH。因为74LS373B由ALE片选,每次MPU访问外设时自动打开,所以这两步骤次序不能颠倒,否则访问的地址就出错。
软件设计
能够从PC机下载音乐是MP3播放器的特点,这一功能由MPU与PC机的串口通信来实现。而且设计所需的下载软件要求能够下载书籍文本,要求能够中文字符的串口通信。因此实现中文传输也是本设计的程序部分的关键。
图3是用VB实现MP3播放器的下载软件。
图3的文件下载软件,由Mscomm控件来实现。Setting设置为“9600,N,8,1”,89C51的串口寄存器SCON和PCON也做对应的设置。用Mscomm控件可以实现发送中文字符功能,具体方法如下:
(1)直接发送
直接发送即把中文字符等同于英文字符。如:MSComm1.output=“这是一行中文数据!”,但这种方法发送的中文数据不能太长,发送缓冲区和接收缓冲区的大小需设定为中文字符的两倍以上,否则会出现接收或发送缓冲区溢出之类的错误。这种方法可用于一般要求不太高的场合。
(2)间接发送
在发送端将汉字或字符转换为机器内码或区位码数据数组,然后将转换后的数据发送到串口,在接收端接收到数据后,按照相反的顺序将得到的数据转换为相应的汉字或字符,对于MPU这端要求能有较大容量的汉字表。在转换过程中,我们采用位运算,在取得汉字的内码后将高字节和低字节分开,求整数高、低字节的函数如下:
Public Function HiByte(a As Integer)
Dim b
b = a And &HFF00
b = b / 256
If b < 0 Then b = b + 256
HiByte = b
End Function
Public Func
tion LowByte(a As Integer)
Dim b
b = a And &HFF
LowByte = b
End Function
结语
该MP3播放器基于DSP技术,采用慢速大容量外存加高速小容量外存的组合方式,音乐文件先从慢速外存下载至高速外存再载入DSP的高速RAM,下载一部分处理一部分。采用与PC机的串口通信方式实现文件的下载速度较慢,也可利用USB接口进行高速的通信。另外系统中连接的电话线可充作电话的录音。
播放技术 篇3
统一的视频搜索、播放、互动平台;
全网视频搜索,视频一搜就有,一点就播;
自主创新的P2SP点播加速技术, 加速点播,流畅稳定;
全方位互动超爽体验,视频观看一站式解决。
官方网址:http://www.vvbox.com/
听专家谈创业
2006年国内视频领域风起云涌,全国出现了数百家类Youtube视频网站,一直从事视频领域研究和开发工作的我也在时刻关注着这一变化,在使用这些网站服务的时候发现这类网站模式大同小异,内容小异大同。我们发现视频网站或者视频搜索网站都不能很好地解决用户体验的问题,用户对统一的搜索、播放、互动平台非常需要。2006年年初我们开始技术研发,目标是给用户最好的视频收视体验,软件采用了先进的网络视频搜索技术、多媒体播放器技术、P2SP点播加速技术等。
专家帮你就业
VVBOX在软件开发上,采用的什么程序?
学文:VVBOX采用VC++平台开发。
为什么要采用该程序开发呢?
学文:因为VC++开发程序执行效率高,占有系统资源少。
对初学者或大学生,您建议他们学C++吗?您认为哪类语言最有前途?
学文:对于初学者学习编程,建议从标准C开始学习,有了一定基础以后可以学习一些可视化编程工具,比如VB等,能比较快地获得一些成就感。
能给大家讲下是为什么吗?
学文:对于将来以软件开发为职业的人来说,基础软件设计开发能力的培养是最重要的,有好的编程技能和编程习惯,可以很容易地掌握不同的编程语言,在实际工作中可以不同的应用软件采用不同的开发工具实现。
如果您在招聘时,哪几方面会是您招人的目标?
学文:基本功扎实,具有创新思维是我们招人的目标。
当大家还在进行HTTP等下载,还认为P2P是很流行的技术时,新的技术已经出现了,那就是P2SP技术。其实P2SP技术大家已经在用了,那就是迅雷,迅雷将P2SP用于了下载,而VVBOX就更进一步,将P2SP用于就是视频播放。于是记者采访了威播网的技术总监吴学文先生。
吴学文
清华大学计算机专业硕士毕业,主要研究方向为多媒体传输以及视频图像编解码算法研究,具有很强的技术创新能力和坚定的创业精神。2001年研究生期间,在清华创业园创办北京东方睿智科技发展有限公司,是公司主要创始人之一,承担主要技术攻关和技术团队管理工作。2003年进入东芝(中国)有限公司先后担任项目经理,高级技术经理等职,曾管理50多人的研发团队,有非常丰富的软件项目开发管理经验,主持开发成功的项目近10个。2006年初,发起创建北京领先英特传媒技术有限公司,公司从无到有,从弱到强,发展到现在逐渐拥有了一支非常强的技术研发队伍和技术支持队伍,在宽带流媒体应用领域具有了非常强的技术实力。公司运营的VVBOX网络视频搜索播放器平台正在成为广大用户观看互联网视频新的门户。
软件精典应用
海量视频瞬间搜索
VVBOX能提供按分类和按关键字等多种搜索功能,点击相应的明星、体育、新闻或学习等视频库,就能找到相关内容,当然,你也可以在搜索栏里输入想要的内容,点击“搜索”一搜就有。
视频下载经典收藏
VVBOX支持本地或者网络flv文件播放,是一款不错的flv播放器。在收看时,点击“保存”即可下载。当然,你也可以点击“收藏”,下次想打开时,只需点击“我的VV”,在“我的收藏”里点击相应的视频即可。
互动体验短信交流
VVBOX支持用户互动发表评论,登录后点击“站内短信”,再输入用户和内容即可发送。支持用户视频文件收藏,推荐视频给好友,定制自己喜欢的视频等功能。如果你没有注册,那你就只能看视频,不能发短信了哟!
防止打扰置顶播放
点击右上角的置顶即可让播放器窗口处于所有窗口的顶层,这能方便你观看视频。再点击一下,即可取消置顶。
视频模式快捷切换
在右上角还有个“精筒模式”按钮,点击即可进入精筒模式,只能看到视频窗口,没有其他的信息窗口。再点击“完整模式”即可轻松返回。也可以按“Ctrl+G”来进行快速切换。
个人设置轻松设置
右击拖盘区的图标,选择“系统设置”,在“系统设置”的“个人设置”里,可以设置“系统运行自动启动”、“是否弹出今日热点”和“下载完成提醒”。当然也可以对模式切换的快捷键进行设置。
赠送珍藏版VV号
播放技术 篇4
随着立体显示技术的发展和市场需求的推动, HTC、夏普、三星等公司相继推出了基于Android系统的3D手机。除此之外, 基于Android系统的3D平板电脑、3D电视也越来越多。因此, 如何在Android系统上播放立体视频成为值得研究的问题之一。目前, Android系统的立体视频播放器仅有3DVPlayer一款。3DVPlayer是由深圳维尚视界立体显示技术有限公司开发, 该播放器仅支持左右格式的立体视频和垂直交错的立体视频显示方式, 功能还有待完善。鉴于这种情况, 本文重点对立体视频解码、立体视频显示这两个立体视频播放的关键技术进行研究, 开发一款支持常见立体视频格式、具有多种视频显示方式的立体视频播放器, 旨在为基于Android系统的立体显示产品解决立体视频播放的问题。
1 立体视频解码
立体视频格式有多种, 但是目前最常见的两种立体视频格式是左/右格式和上/下格式[1], 如图1所示。本文主要的研究对象即为这两种格式的立体视频。立体视频解码和普通的2D视频解码的最大区别就在于, 在得到一帧图像的像素数据后, 前者需要进行左右眼图像的分离, 而后者不用。
本文中的立体视频使用FFmpeg进行解码。FFmpeg是一个开源免费跨平台的音视频流方案, 它包含功能强大的音视频解码库。立体视频文件包含音频流和视频流, 视频流中包含左右眼图像。视频解码是一个比较复杂的过程, 而FFmpeg解码库的使用使得解码过程变得相对简单, 解码流程如图2所示。
首先, 注册所有的解码器 (av_register_all () 函数) , 解码器注册以后才可以使用。然后, 打开视频文件 (av_open_input_file () 函数) , 读取流信息 (av_find_stream_info () 函数) , 并确定音视频流的索引, 根据流索引确定音视频流对应的解码器并初始化 (avcodec_find_decoder () 、avcodec_open () 函数) 。接下来开始读取数据包 (av_read_frame () 函数) , 判断是音频包还是视频包, 如果是音频包则使用前面确定的音频解码器进行解码 (avcodec_decode_audio3 () 函数) , 如果是视频包, 则使用视频解码器进行解码 (avcodec_decode_video2 () 函数) [2]。
不同格式的立体视频每帧图像的像素数据在内存中的存储结构不同, 上/下格式、左/右格式的像素数据 (RGB888格式) 在内存中的存储结构如图3所示。
图3中:L代表左眼图像数据;R代表右眼图像数据;width表示图像宽;height表示图像高;pointer为指向一帧图像数据的指针;lpointer为指向左眼图像数据的指针;rpointer为指向右眼图像数据的指针;stride表示一行像素在内存中占据的字节个数;padding代表填补字节。
每一行像素数据后也许会包含有额外的填补字节 (padding) , 这部分字节主要是用于字节对齐, 以提升数据的存取效率。pointer和stride由前面FFmpeg视频解码时得到, 根据图3所示的图像数据存储结构, 可以计算出访问左右眼图像数据所需的变量, 计算结果如表1所示。
注: (1) lstride为左眼图像相邻两行第1个像素间间隔的字节个数; (2) rstride为右眼图像相邻两行第1个像素间间隔的字节个数。
根据表1中变量就可以分别访问组成左、右眼图像的像素数据, 如此一来, 左右眼图像在逻辑上就是两幅独立的图像, 也就实现了左右眼图像的分离。在立体视频显示部分就可以使用这里分离出来的左右眼图像按不同的显示方式来显示立体视频。
2 立体视频显示
立体视频显示决定像素在屏幕上的排列方式, 关系到立体显示设备能否产生立体效果, 是立体视频播放过程中最关键的一环。本文主要讨论7种立体视频显示方式, 如表2所示。
本文采用Android系统的OpenGL ES 2.0图形库来显示立体视频。OpenGL是应用最为广泛的图形库之一, 而OpenGL ES (OpenGL for Embedded System) 是由OpenGL裁剪而来, 为嵌入式设备而设计的图形库。OpenGL ES2.0的Shadering Language包括vertexShader和fragmentShader, 在vertexShader中处理顶点的坐标, 对纹理的采样则位于fragmentShader中[3]。
视频显示主要用到了OpenGL ES 2.0中的纹理贴图技术。首先在画布上绘制两个直角三角形, 构成一个矩形, 矩形相当于屏幕。使用立体视频解码后分离出来的左右眼图像数据生成左右眼纹理, 然后通过不同的处理方法, 以达到上述7种显示效果。这7种视频显示方式可以分为3类进行处理, 分别是:
1) 左/右
对于这两种显示方式, 只将左纹理或右纹理贴到显示区域即可。
2) 左/右、上/下
对于这两种显示方式, 生成一个新的纹理 (调用glTexImage2D () 函数) , 分别用左右眼像素数据更新显示区域的左右或上下部分即可 (调用glTexSubImage2D () 函数) 。
3) 水平交错、垂直交错、棋盘交错
对于这3种显示方式, 需要先生成一个模板纹理, 3种显示方式的模板纹理如图4所示。
在fragmentShader中, 采样器对模版纹理进行采样, 如果某一像素点的采样结果为白, 则显示区域中该像素点的颜色取左眼图像中对应像素点的颜色;否则, 取右眼图像中对应像素点的颜色。
3 立体视频播放器整体方案
立体视频播放器由文件浏览、参数选择、立体视频播放3个模块组成, 其中立体视频播放模块包括立体视频解码、立体视频显示、快进快退及其他子模块。立体视频播放器的整体方案如图5所示。
Android系统应用程序设计有3种编程语言组合可以选择:1) Java;2) Java+C/C++;3) C/C++。本文选择组合2) , 使用Java和C++语言编程。文件浏览、参数选择模块是用Java语言编程实现的, 立体视频播放模块则是用C++语言编程实现的。各模块功能如下:
1) 文件浏览
文件浏览可以逐个目录浏览文件, 也可以选择某个文件夹, 扫描其中包含的视频文件[4]。
2) 参数选择
参数选择主要进行立体视频格式以及立体视频显示方式的选择, 将用户的选择保存并传递给立体视频显示模块[5], 这些参数将影响后续的立体视频解码及显示。
3) 立体视频播放
立体视频播放模块是用C++语言实现的, 主要包含立体视频的解码、显示以及快进、快退、进度拖拽等播放控制功能。
4 测试
根据上述整体方案, 采用本文中研究的立体视频解码和显示的实现方法, 开发了一款Android系统立体视频播放器, 该播放器支持左/右、上/下格式的立体视频, 支持7种显示方式。在一款Android 2.3系统的平板电脑上对该立体视频播放器进行测试, 测试结果表明, 预期功能均已实现, 可以正常使用。以播放一个左/右格式的立体视频为例, 选择水平交错显示, 测试效果如图6所示, 图6b是图6a中方框部分的局部放大图。
5 小结
本文重点研究了在Android系统上播放立体视频的关键技术:立体视频解码、立体视频显示。在此基础上, 实现了一款支持7种显示方式的立体视频播放器, 该播放器适用于不同显示原理的立体显示设备。经过测试, 立体视频播放的基本功能均已实现, 可供用户使用。由于该立体视频播放器仅支持两种常见格式的立体视频, 因此, Android系统立体视频播放器对更多立体视频格式的支持将是下一步研究的重点。
摘要:为了解决立体视频在Android系统上的播放问题, 对在Android系统进行立体视频播放的关键技术进行了研究。与传统2D视频播放器相比, 立体视频播放器的关键技术是立体视频解码和立体视频显示。文中对这两种关键技术的实现方法进行了详细阐述, 并据此开发了一款立体视频播放器。该立体视频播放器, 支持常见的左/右、上/下格式立体视频, 有7种视频显示方式可供选择。该视频播放器在Android 2.3系统的平板电脑上进行了测试, 测试结果表明在Android系统上播放立体视频的基本功能均已实现, 可以供用户使用。
关键词:立体视频播放器,立体视频解码,立体视频显示,Android,FFmpeg
参考文献
[1]High-definition multimedia interface speciation version 1.4a extrac tion of 3D signaling portion[EB/OL].[2012-05-01].http://etmriwi.home.xs4all.nl/forum/hdmi_spec1.4a_3dextraction.pdf.
[2]Stephen Dranger.An ffmpeg and SDL Tutorial.[EB/OL].[2012-05-01].http://dranger.com/ffmpeg/.
[3]MUNSHI A, GINSBURG D, SHREINER D.OpenGL ES 2.0 program ming guide[M].Boston, USA:Addison-Wesley Professional, 2008.
[4]佘志龙, 陈昱勋, 郑名杰, 等.Google Android SDK开发范例大全[M].3版.北京:人民邮电出版社, 2011.
播放技术 篇5
1、单击【开始】菜单,选择【运行】,并输入“gpedit.msc”然后确定;
2、在左栏的“本地计算机策略”下,打开“计算机配置——管理模板——系统”,然后在右栏的“设置”标题下,找到“关闭自动播放” 3、我们双击“关闭自动播放”,在弹出的设置窗口设置为“已禁用”或“未配置”并按确定,
WinXP光盘不能播放如何启用光盘自动播放功能
。然后重启计算机, 这里说明一下几个设置的作用:未配置(系统默认未配置是开启自动播放功能)已启用(你可以在关闭自动播放里选择只禁用光盘还是禁用全部驱动器)
方法二、注册表
1、单击【开始】菜单,选择【运行】——键入regedit,然后回车;
2、在注册表编辑器里找到HKEY_CURRENT_USER/Software/Microsoft/Windows/CurrentVersion/Policies/Explroer主键下,找到“NoDriveTypeAutoRun” 右键点击并选择“修改二进位数据”将值改为“95 00 00 00”; 3、编辑完成后退出注册表编辑器,并重启计算机。
空间实验全景播放 篇6
多模态微波遥感器 太空演好戏
多模态微波遥感器是我国第一台实验性的微波遥感系统,也是神舟四号飞船有效载荷应用任务中的重头戏。
与可见光和红外遥感相比,微波遥感器有其独特的优越性,它不受云、雷、雨的限制,可以全天时、全天候工作,而且对土壤和植被具有一定的穿透能力。
三种微波遥感器即微波辐射计、雷达高度计和雷达散射计在这项研究中担任“主角”,在太空上演一出出好戏。
微波辐射计主要用于探测土壤温度、降水、大气水汽含量、积雪、土壤成分、海面温度;还可以得到植被生长情况,对农作物进行估产。
雷达高度计可获得海浪的有效波高、海洋环流等海洋动力学参数,对全球军事、自然灾害研究有十分重大的意义。
雷达散射计可以测量海面风速与风向,从而测到海面风场,可应用于海洋动力研究、海况预测及灾害监测等许多方面。
这项应用任务将为我国海洋卫星、气象卫星上的微波遥感有效载荷的研制,为全天候信息的获取打下坚实的基础。
看液滴在太空起舞
神舟四号飞船有效载荷实验中,首次在长时间稳定的微重力环境下进行空间微重力流体物理科学实验。这一实验如同在太空开一场别开生面的“舞会”。
在太空中,不同大小的液滴摆脱了地球引力、浮力的羁绊,像一个个自由的“舞者”;“舞场”经过精心的设计,是一个有连续温差的硅油液;“舞者”将经历从冷到热的变化,依靠因温差产生的界面张力,在“舞场”中翩翩起舞,跳出专业上称作热毛细迁移的独有太空“舞步”。研究人员将利用自行设计的仪器将每一个“舞者”的每一个“舞步”精确记录下来,并传输回地面进行研究。
中科院国家微重力实验室的研究人员介绍说,在未来的空间材料加工、晶体掺杂、空间焊接、电泳过程中以及航天员生保系统等都会遇到液滴或气泡的迁移问题。空间微重力流体物理实验将为寻找空间气体、液体排出或是定向移动的方法,提供相关的理论依据,建立基本的理论模型,解决太空生活的实际问题。
小白鼠娇生惯养
此次动物细胞的融合实验,采用的是小白鼠淋巴细胞和骨髓瘤细胞。据介绍,实验用的淋巴细胞是从纯种小白鼠的脾脏得到,这些纯种小白鼠,在饲养8周后,开始注入抗原进行免疫,三周为一周期,共注射四次抗体。这样,在小白鼠生长到17周到18周左右,在第三次注射抗原后5~7天内,从小白鼠尾静脉中取血,制备血清,血清中抗原达到一定量,就可以被用于细胞融合的解剖对象了。虽然这次实验只需要8只小白鼠,但为了完成这次实验,发射场的实验室内共有40只小白鼠等待献身,另外还有32只在上海备用。
在发射中心的新家,为保证它们的安全,发射场的战士们24小时为它们“站岗放哨”。
走进小白鼠生活的无菌实验室,马上会闻到一股怪怪的鱼腥味,令人不太习惯,但小白鼠的饲养条件格外讲究,它们生活在无菌环境中,所有笼子、笼具都经过消毒;它们的食物里富含各种维生素、矿物质等多种营养成分;它们在上海喝的是无菌水,在发射场喝的是农夫矿泉水。小白鼠自己也非常爱干净,它们会集中在笼子的一边排泄,让自己休息的另一边保持清洁,垫在笼子里的木屑也被它们拉到干净的一侧。令人惊讶的是,一只小白鼠的饲养费每个月只有5元。
据参试人员介绍,淋巴细胞可以产生抗体但不能繁殖,而骨髓瘤在体外可以无限繁殖,利用它们的各自优势进行细胞融合,将可以得到能够在体外产生单克隆抗体的杂交体,用以产生单克隆抗体。在地面,这两种细胞的地面融合率大约在10-4到10-5左右。神舟飞船在轨飞行时处于微重力的环境,进行细胞的融合,可以验证几年来进行的地基研究的结果,并力争在实验方法和技术上有所突破。
飞船高度精定位
天上飞行的飞船到底离我们有多远?为了配合多模态微波遥感器对地观测系统的实验,中国科学院首次进行了综合精密定轨实验,将在预定的定轨区域内的径向测量精度提高到2~3米,力争1米;这还将对国内低轨卫星轨道的精确测量工作起到促进作用。
这次的精密定轨实验主要采用三种方法进行,再结合动力学和几何学的方法,对观测资料进行处理,以精确确定飞船的运行轨道。
第一种方法是利用全球定位系统,测量仪器装在飞船内。这种方法可以实时获得飞船全球定位的观测数据,再经过进一步的计算,得出最终数据。
第二种方法是统一S波段测速测距系统,这是国际常规测轨手段之一,也是飞船上已有的手段。这种方法不受天气条件的影响,测速精度较高。
第三种方法是激光测距系统。科研人员在飞船的腹部装上激光反射镜,在飞船到达测控区内时,从地面发射出激光束,打到飞船的反射镜后反射回地面的接收设备,来测量飞船的在轨高度。这种方法在观测条件好的时候,可以获得厘米量级的测量精度,作为精密定轨的校验手段,来判断定轨结果的准确程度。
为载人派出“太空哨兵”
正如飞机的飞行安全会受到雷电、暴风、骤雨等大气天气条件的影响一样,飞船和航天员的运行安全也会受到太空中的“空间天气”的影响。
神舟四号飞船将国内现有的各种用于空间环境探测的仪器都纳入到空间环境监测系统中,装上了飞船,发挥其“太空哨兵”的作用,在飞船发射、运行、返回及留轨运行期间,进行实时空间环境监测,及时将“空间天气”情况通报给飞船控制管理人员,为未来载人打下基础。
空间环境的探测仪器包括安装在附加段的高能质子重离子探测器、高能电子探测器、低能粒子探测器;安装在返回舱的固体径迹探测器,以及在神舟二号和神舟三号上发挥过重要作用的大气密度探测器和大气成分探测器等。
植物苗倍受呵护
发射前夕,上海生命科学研究院植物生理生态研究所的科技人员,在发射基地的实验室里,按不同的时间段精心培育了8批次植物苗,这些植物苗分为两个品种。神舟四号飞船上用于植物融合的细胞就从它们之中提取。
为了养好这些植物苗,实验室中安装了电脑定时开关器,根据它们最适宜生长的湿度和温度,进行实时调控。
这些植物苗被栽培在专门的营养 土壤中,喝的是蒸馏水,经过六周的生长,就可以从中提取细胞了。植物苗分成两个品种,提取的一号细胞被去掉细胞壁,与二号细胞在空间融合。为使空间实验用细胞有更强的活力,直到发射前两天,才从其中的一批生长时间为6周的植物苗中提取细胞。
据参加该项目研究的科技人员介绍,之所以挑选这两种植物苗,是由于它们本身的细胞特征明显,并已经进行了大量深入的研究。从陆地的实验结果看,一号植物开的是粉花,二号植物开的是黄花,将两种植物细胞融合后,再生植株开出的是黄花,但形状却和一号植物相同。
由于细胞的密度是不同的,因此在地面上受重力影响细胞的融合是一个难题。在微重力条件下,重力的沉降现象消失了,从理论上讲细胞更容易组合。
融合后的细胞为细胞遗传物质的修饰提供了各种各样的可能性,尤其在生物制药上有更深远的意义。
电泳实验空间做
与细胞融合实验正好相反,在神舟四号上第一次进行的生物大分子和细胞的空间分离纯化实验,是将生物样品利用电泳的方法分离提纯。
神舟四号飞船发射前一周,“生物大分子和细胞的空间分离提纯化实验”进行了最后一次地面电泳实验研究。实验用生物样品与太空飞行使用的是同一批样品,经过电泳实验分离提纯后,在电场的作用下,细胞色素C分子与牛血红蛋白分子分离开,在透明的玻璃试管中分别呈现出淡黄色和淡粉色。
中国科学院上海生命科学研究院研究人员介绍,这次太空实验样品在太空连续分离时间设计为1小时。实验中,样品被分级收集并在太空中进行光电检测,检测仪器与陆地完全一致。
据介绍,电泳的基本原理就是离子在外加电场下的迁移现象。由于各种离子在同一电场中的迁移率不同,从而达到分离的目的。在陆地上进行的电泳实验,分子因重力影响而产生热扩散,使样品的分离效果大幅度降低。而在太空环境中的电泳实验,消除了重力的影响,样品的分离率大幅度提高。
上世纪80年代,美国、德国都做过不少空间电泳实验。NASA和麦道公司曾联合在航天飞机上进行过七八次空间电泳实验,结果表明,提纯纯度比地面高出5倍。用这种方法对一些高纯度的生物材料如氨基酸、多肽、蛋白质、核酸以及各种细胞的分离纯化,是生物医学和生物技术领域基础的应用技术。
我国首次在太空进行的电泳实验重在掌握空间电泳的基本技术和方法,主要目的是研究在微重力环境下有关电泳迁移率及各种影响因素而导致的动态过程稳定控制,分辨率控制以及空间制药分离纯化设备的设计技术等问题。
公用设备担重任
神舟四号有效载荷中的公用设备与神舟二号、神舟三号相比几乎完全一致,只是根据神舟四号飞船上不同有效载荷和不同需求作了局部的适应性修改。据介绍,由于有效载荷公用设备分系统是有效载荷的支持系统,承担了有效载荷供配电、数据管理和传输等极其重要的任务,因此公用设备是否正常工作将直接关系到有效载荷任务的成败。
在公用设备的系统设计中,对于主要数据通路和主要设备都采取双冗余备份,主设备万一出现故障,将进行系统重构,切换为备份设备工作,避免了单点失效,确保飞船上各项科学实验顺利进行。但从神舟二号和神舟三号在轨运行情况来看,公用设备具有很高的可靠性,主设备工作正常,到目前为止还从未使用备份设备工作。
公用设备分系统由有效载荷电源、数据管理、数据传输和微重力测量子系统组成,为有效载荷提供了多项服务。公用设备将飞船上分散的有效载荷连接起来,构成相对独立的有效载荷系统,为有效载荷供配电和提供二次电源,进行有效载荷数据采集、处理、存储和传输,指令分发,信息共享及运行管理,同时通过S波段高速数传信道将有效载荷的科学数据及工程参数由飞船传输到地面接收站。据参试人员介绍,早在设计神舟二号有效载荷的公用设备时,就充分考虑了公用设备既要尽可能地减少飞船系统技术状态的变化,又要适应各艘飞船有效载荷的变化。因此在公用设备的系统设计中采用了多项先进的国际标准。并首次在国内航天器上采用了先进的CCSDS高级在轨系统数据标准,并研制成功实现CCSDS标准的关键——高速多路复接器。高速多路复接器运用虚拟信道和分包遥测的概念,将各种不同速率、不同应用过程、不同性质的数据异步复接为符合CCSDS标准的串行位流数据通过S波段发射机传输下行。
公用设备中的固态大容量存储器用于存储和回放多模态微波遥感和GPS的数据。该设备实现了RS纠错编码、存储失效检测和旁路功能,具有很高的可靠性。公用设备采用QPSK调制方式的S波段发射机传输有效载荷的高速数据。
播放技术 篇7
关键词:语音识别,技术,音乐播放器,设计
目前,人类实现了由传统靠键盘和按键控制机电、计算机系统的生活作业模式到通过语音识别技术控制机电和计算机系统的飞跃。语音识别技术的播放器设计过程实际是实现语音智能控制音乐播放器的技术。很长一段时间,人机对话通过数字领域的“手动操作”来进行,这种交流方式将人与机电系统和计算机系统之间的交流变得狭隘,人与机器只能通过数字量或者数字转换形式在近距离的空间里进行交换。语言本是人类最基本的沟通交流工具,在日常活动中,人们通过语言进行信息传递。语言能承载很大的信息量,具有较高的智能水平,在以后的探索中,它是实现机电系统和计算机系统向人一样能感知、能表达的发展方标。一般的播放器都是通过手动来调节,这种操作形式不仅使硬件设施老化迅速,还给手脚不方便的使用者带来很多麻烦。有人预测,语音识别技术在10年之内将迅速进入家电、通信、家庭、汽车及工业等领域。
1语音识别技术的发展现状
语音识别技术最早出现在50年代,AT&T Bell实验室研制的可识别十个英文数字的语音识别系统标志着语音识别技术时代的到来;60年代的重要成果就是用动态规划方法来解决语音识别中不等长的对正问题;70年代,取得了突破性的进展,研制出了基于线性预测倒谱和DW技术的特定人孤立语音识别系统,80年代,HMM模型和人工神经元网络在语音识别系统中的应用使语音识别研究进一步加深;90年代,伴随着多媒体的到来,迫切要求语音识别系统从实验室中走到现实生活中。许多发达国家的著名工资投入巨资在语音系统地实际应用开发中,现今,是市场上出现了语音识别电话和语音识别笔记本电脑等产品的身影,尤其在家电方面应用广泛。
2语音识别技术
2.1语音识别技术定义
语音识别技术是让机器通过识别和理解将人类的语言信号转换为相对应的文本或者命令的技术。语音识别是一门与声学、与声学、语音学、语言学、数学信号处理理论、信息论、计算机学科等众多学科紧密联系的综合学科。它是人和机器交流的一项重要工具,目的在于让机器听懂人类的语言,是机器智能化的一个重要表现。语音识别与人的说话方式、说话语速、说话内容和不同的环境情况有关,语音信号本身的多变性、波动性,持续性、瞬间性在某种程度上增加了语音识别的困难。
2.2语音识别类别
2.2.1按照识别单位划分
包括音素识别、音节识别、孤立局识别、语音理解、识别的单词之间由停顿和连续的识别等。
2.2.2按照词汇识别量划分
包括10-50个的小词汇、50-200个的中词汇、200个以上的大词汇等。
2.2.3按照说话对象的划分
包括固定说话人、多个说话人、不关联说话人的人。其中固定说话人的语音识别比较简单,识别率较高。多个说话人和与说话人无关的语音识别系统的应用范围比较广,实用性较高,但难度系数也是比较大的,识别率不是太高。但是后两者的使用价值比固定说话人的价值更大。
2.2.4按照识别方法分
大体包括概率语义分析法、随机模式法、模板匹配法,还涉及到人工神经网络语音识别和语法是语音识别等。现今,语音识别在连续语音、不是固定人、大量词汇方面发展较多并且取得了一些突破性的成就,如以HMM为构架,构建识别系统模型。
2.3语音识别基本原理
现在大多数语音识别系统都采用模式匹配原理。将待识别的语音先经过话筒转换成为语音信号,然后从识别系统顶端输入,在进行预处理。特征提取部分用来提取语音识别信息中能够代表本质的声音参数。通常训练在识别之前进行,通过讲话者反复重复语音,最初语音样本中除掉多余信息,保留关键数据来实现。模式匹配时语音识别系统的中心,它是根据专家知识和一定的准则计算出输入特征和库存模式之间的近似度,推断出输入语音所要表达的意思。
2.4语音识别的瓶颈
语音识别虽已有50多年的发展史,但在语音识别系统的实际应用中还是碰到了瓶颈,具体表现在依赖外在环境条件和只能在安静的环境下工作。语音识别系统一旦在吵闹的环境下工作,会发生声音失真、发音速度和音调变动的不良现象,一般通过谱减法、环境技术调整、修正识别模型、建立噪声模型这四种手段进行整顿。要想跨过以上瓶颈我们在实际的应用研究中应慎重选择语音识别基元,提高端点检测技术,在语音识别系统中结合韵律信息(说话人的重音、语调等)。
3音乐播放器设计
音乐播放系统实际是多媒体技术在社会生活中的实际应用。多媒体是指能够同时获取、处理、编辑、存储和展示文字、声音、图片、动画、视频等两种不同信息媒体的技术,简而言之,多媒体是一种技术。计算机技术和信息处理技术的发展 , 极大的提高了人类处理多媒体信息的能力。
音频播放系统可以通过音频硬件的自动检测和使用加速,来控制媒体的播放,也可支持没有硬件加速的系统。它所支持的媒体格式包括MP3、WAVE、AVI、DV,这都是我们生活中常用的格式。特别重要的是它可直接支持DVD播放,并且提供的是一种开放式的开发环境。
4 基于语音识别技术的单片机音乐播放器设计
4.1 基于语音识别技术的音乐播放器的硬件设计
4.1.1音乐播放器系统设计
该音乐播放器系统由音频输入和音频输出两个模块组成,音频输入是为实现语音信号识别,音频输入是为实现播放。现提出方案如下:
这一方案件简单易行,节约了很多电路结构。只要注意在语音录入时加入麦克风电路,在语音输出时外接功放电路即可进行实现语音播放功能。
4.1.2音乐播放器电路设计
音乐播放器单片机电路设计
单片机的主电路主要包括晶振,锁相环,复位电路等外围的基本模块。
音乐播放器电源电路设计
通过电池盒提供给的4.5V直流电压经由SPY0029后产生3.3V给整个系统提供电量。SPY0029是一个电压调整IC,引用CMOS技术,它的静态电流低,驱动能力较强,线性调整突出。
音乐播放器键盘调控电路设计
因为该音乐播放器是双重模式控制,除了语音控制播放器外,还有播放,开关机,暂停,停止,上一首,下一首六个按键控制播放器模式。
4.2 音识别技术的音乐播放器的软件设计
在较早的程序设计中都是采用不同的软件来进行处理,研制人员得在几种软件中来回转换使用,例如先用文字处理软件编辑源程序,再用链接程序进行函数处理,最后用编译程序进行编译。现在的研制人员将编辑、翻译、处理等功能放在了一个桌面环境里,这在无形之中给使用者带来了很多的方便。
4.2.1音乐播放器的集成开发环境
该集成开发环境支持16位单片机系列、语言汇编、C语言混合编程的程序开发。它为使用者提供完整的交互桌面,操作简单,调试工作便于进行,他所提供的软件仿真功能可以在脱离仿真板的条件下,模拟硬件部分功能。该开发环境的主口操作界面由六部分组成 : 主菜单、工具栏、工作区、输出去、编辑区、状态栏。
4.2.2 音乐播放器的训练命令程序设计
通过特定发音人训练播放器识别播放、暂停、停止、上一首、下一首这五种命令。
当检测到训练标志位内容为非训练时,这就要求训练者对它进行训练操作。获取结果一般经过两次训练。以训练音乐播放器暂停为例,播放器先会提示操作者输入第一条语音指令,此时训练者说出暂停命令,然后播放器会提示请再说一遍,训练者按照提示再说一遍,只要两次暂停的声音差别不是太大,播放器就会成功建立模型,这时暂停命令训练已经成功,若未能成功建立模型,播放器会提示失败原因,只要注意原因重新训练即可。暂停指令训练成功后,会自然给出下一条有待训练方式。依照按键顺序完成全部训练,训练结束后,子程序返回。
5结语
本文通过对基于语音识别技术的SPCE061A单片机音乐播放器设计分析,有力的证明了语音控制音乐播放器的实用性,通过该项技术我们可以简单轻松的对已经开机的播放器进行播放、暂停、停止、上一首、下一首等模式的命令。与传统的按键控制播放模式相比,其优势是显而易见的。
播放技术 篇8
随着医院的发展,放射科每日检查量不断升高,每天CT拍片达几百人次。对于每个病人登记、取片,登记室工作人员均需反复说明。虽然登记室窗口安装了对讲机,一天下来,工作人员仍然感到口感舌燥。为减轻工作人员工作强度,基于TTS编程技开发了一套术语音播放系统。系统由语音播放程序和音频放大器、扬声器组成。工作人员对每天的提示语言进行筛选编入程序,播放时点击相应按钮、由电脑自动播放该语句。同时,还可读取放射科管理信息系统(RIS)登记程序中的病人姓名并播放。
1 TTS介绍
TTS (Text To Speech)[1],即语音合成,是一种将文本转换为语音的技术,是信息处理领域的一项前沿技术,解决的主要问题就是如何将文字信息转化为可听的声音信息。
TTS是一种智能型的语言合成,它涉及语言学、语音学、语言信号处理、心理学等多个领域。语言学处理主要模拟人对自然语言的理解过程,包括对文本进行规整、词的切分、语法分析和语义分析,使计算机对输入的文本能够完全理解;韵律处理是为合成语音规划出音段特征,包括高音、音长、音强、变声等处理,使合成输出声音接近于自然语言;声学处理主要根据前两步的处理结果完成语音合成并输出[2]。
目前TTS技术分为硬件TTS和软件TTS。硬件TTS是在内置芯片的支持之下,通过神经网络的设计,把文字智能地转化为自然语音流。由于硬件的支持,这种转换基本上可以达到实时的效果,而且输出的语音音律流畅自然,毫无机器语音输出的冷漠与生涩感。软件TTS技术较之硬件TTS效果稍差,但成本也较为低廉[3]。许多公司开发了优秀的TTS,如微软的Microsoft Speech,SeanSoft语音引擎、Acapela语音引擎和美国NeoSpeech公司的NeoSpeech TTS。
2 语音播放系统软件开发
选用微软公司Microsoft Speech SDK 5.1和Delphi2010开发平台,可以在微软的网站免费下载安装MicrosoftSpeech SDK 5.1和附加的语言包。Microsoft Speech SDK 5.1提供的中文语音库是男声(Microsoft Simplified Chinese),而且效果不好。因此,本系统另外安装了音质较好的NeoSpeech男声语音库(VW Wang、VW Liang、VW Paul)和女声语音库(VW Hui、VW Julie、VW Lily),可朗读简体、繁体中文,并支持中英文混读。
Delphi具有可视化的编程环境,为我们提供了一种方便、快捷的Windows应用程序开发工具。它采用面向对象的程序语言,对于广大的程序开发人员来讲,使用Delphi开发应用软件,无疑会大大地提高编程效率。
在Delphi IDE中选择菜单“Import Component”,点击按钮Add (C:Program FilesCommon FilesMicrosoft SharedSpeechsapi.dll)直至完成安装。至此,共20多个控件被添加到Delphi组件板AciveX页上。其中Spvoice控件是我们要使用的,它有许多属性、方法:
Spvoice.Rate//取得或设置阅读的速度。
Spvoice.Volume//取得或设置声音的大小。
Spvoice.Voice//取得或设置发音对象。
Spvoice.Pause//暂停朗读。
Spvoice.Resume//恢复暂停,继续播放。
Spvoice.Skip//在当前输入的文本流中向前或向后跳一定距离再播放。
Spvoice.Speak//阅读一个字符串。
……
在Delphi IDE中点击“Filel New|VCL Forms Application”新建一个窗体程序,主窗口界面,见图1。在主窗口中添加Spvoice控件,窗口FormStyle设为fsStayOnTop,使主窗口始终悬浮在其他窗口之上,在主窗口工作区添加GridPanel控件,并在其中布局SpeedButton、CheckBox控件,使用户可以动态调节窗口大小、停放位置。另外,创建参数设置窗口,设置按钮Caption属性和对应播放内容的文本,以及发声对象、语速、音量。设置窗口界面,见图2。
通过以下代码可获得系统可用的语音发声对象(语音库):
程序启动或更改设置后,均需进行初始化:
当需要播放某句语句时,点击主窗口相应按钮,在其OnClick事件中调用Speak方法:
Spvoicel.Speak('
至此,已完成语音播放功能的实现,但仍无法呼叫病人姓名,需从RIS系统登记窗口提取当前病人姓名信息。为实现此功能,首先通过窗口标题获取登记窗口的句柄,并通过调用回调函数遍历窗口中的控件,判断并获取病人姓名输入控件的句柄:
如果主窗口中播放姓名复选框被选中,则将病人姓名插入到字符串中进行朗读,如“请张某某到5号机房检查”。
3 系统硬件配置
软件编译完成后安装在登记室电脑中,即可通过声卡输出音频信号,为此还需配备必需的放大器、扬声器,可通过购置有源音箱解决。
由于登记室配有窗口对讲机,故对窗口对讲机进行改造,增加线路输入接口作为有源音箱使用。分析窗口对讲机电路,使用了声控扬声电话电路UTC34018,其内部合并了必需的放大器、衰减器和几种控制功能,包括一个话筒放大器、一个用于扬声器的音频功率放大器,另外主机有一空闲的外置麦克风接口J1,插入音频线可断开内置麦克风转而使用外置麦克风。为此,断开线路板中内置麦克风通往外置接口及返回的信号线Line1、Line2,并短接,同时将外置接口通过电阻、电容接至UTC34018集成电路27脚的接收衰减器器输入端,这样,既保持了窗口对讲机原有功能,又兼顾了语音播放。语音播放电路图原理简图,见图3。
4 结果
该系统播放的声音标准、清晰,语音文本可随时更改,并可读取第三方软件中的信息,在一定程度上减轻了工作人员的劳动强度。由于系统开发采用软件技术、并充分利用现有的电脑硬件资源,所以开发周期短,兼容性强,投入资金少。在此基础上,通过与医院信息系统(HIS)数据库连接,还可方便地开发出语音叫号排队、收费窗口语音提示等系统。
摘要:目的 开发放射科语音播放系统,减轻放射科工作人员的劳动强度。方法 充分利用医院现有计算机硬件资源,采用TTS技术开语音播放系统。结果 播放系统声音标准、清晰,使用灵活。结论 TTS编程技术使系统开发周期短,兼容性强,投入资金少。
关键词:放射科语音播放系统,TTS技术,对讲机,医院信息系统,放射科管理信息系统
参考文献
[1]徐一峰.Microsoft TTS的改进策略研究[J].宁波职业技术学院学报,2010,14(2):87-89.
[2]金建乐.TTS技术在水库调度值班中的应用[J].水利水文自动化,2005,(4):21-24.
[3]高明.TTS技术在HIS系统中的应用[J].医学信息,2011,24(12):30-31.
[4]齐志华,吴冬云,朱贵忠.基于TTS技术的“人声语音定时提醒”系统设计及应用[J].医疗卫生装备,2012,33(1):45-46.
[5]韩雨峰,陈武鑫,杨毕辉,等.基于TTS药房取药排队系统设计[J].医学信息,2009,22(12):2627-2629.
[6]韩乾.我院数字化手术室音视频通讯网络及应用[J].中国医疗设备,2012,27(1):33-35.
[7]齐志华,朱贵忠,吴冬云,等.人声语音定时提醒系统的设计及应用[J].中华护理杂志,2011,46(12):1209-1210.
[8]张以锦,范鲁雁.医院药房语音系统的开发与应用[J].中国药房,2005,16(8):587.
[9]计佩影,金茹.预配候取和语音系统在儿童医院门诊药房的应用[J].海峡药学,2006,18(4):244-246.
[10]郑善銮,郝晓柯.中文语音联机程序在血液分析仪检测数据管理中的应用[J].中华医院管理杂志,2006,22(11):784-785.
[11]杨长春,刘俊,石林,等.Delphi程序设计教程[M].2版.北京:清华大学出版社,2008.
播放技术 篇9
已申请专利
项目简介:
通过对MPEG-2压缩技术的重新发展, 获得一种新的极低成本的解压算法。其特点包括:1.只需要1/16的视频信息;2.其计算量仅需八次加法, 无任何乘法。而原MPEG解压则需要1094个乘法和894个加法;3.图像质量无可观察的失真。主要技术指标包括: (1) 由于其计算量仅为标准DVD视频解码的千分之一, 其造价可能非常低, 预计约为百分之一; (2) 在同一分辨率下, 其视频质量接近标准DVD (但不适合高分辨率播放) ; (3) 其功耗约为标准DVD芯片的十分之一。市场前景非常广阔, 可参见上面的用途部分。该算法的软件已研制成功, 可作现场演示。
应用领域:
播放技术 篇10
已申请专利
项目简介:
通过对MPEG-2压缩技术的重新发展, 获得一种新的极低成本的解压算法。其特点包括:1.只需要1/16的视频信息;2.其计算量仅需八次加法, 无任何乘法。而原MPEG解压则需要1094个乘法和894个加法;3.图像质量无可观察的失真。主要技术指标包括: (1) 由于其计算量仅为标准DVD视频解码的千分之一, 其造价可能非常低, 预计约为百分之一; (2) 在同一分辨率下, 其视频质量接近标准DVD (但不适合高分辨率播放) ; (3) 其功耗约为标准DVD芯片的十分之一。市场前景非常广阔, 可参见上面的用途部分。该算法的软件已研制成功, 可作现场演示。
应用领域:
温润白玉 全能播放 篇11
外形温满如白玉
华录HMC9502的外观在一众影碟机中独树一帜,纯白色珐琅质感的外壳,配合圆角和斜面按键设计,显得温文典雅。碟仓与显示液晶屏连成一体,正面显得简洁大方。电源指示灯在待机状态为红色,打开电源后就变成绿色,美观之余,也让用户可以很轻松判断出碟机的工作状态。
为了更好的和机身的特点保持一致,随机遥控器采用白色的设计,连电源线都是白色的,可以看出,华录的设计师充分考虑到了当今消费者对家居环境的美观要求,在工业设计上的追求值得表扬。遥控器的大小比较合适,在按键的安排上有自己的特色,在数字键的周边环绕了一圈功能键,初次使用者需要适应一段时间,否则容易出现误操作。熟悉之后,这样的安排又显示出了其方便操作的一面。最常用的播放、暂停、返回等功能键被安放在遥控器的下部,大拇指操作起来刚刚好。整个遥控器的按键手感不错。不过碟机的接收反应似乎稍微有点延迟,使用者不能太过着急。
HMC9502背面得接口非常齐备,除了数字高清显示必不可少的HDMI输出外,还设置了色差分量输出,并且附带7.1声道的模拟输出,便于尚未升级功放的用户使用,当然用于输出数字音频的光纤输出也不会欠缺。另外值得一提的是,这块机器还配备了两组USB扩展槽与以太网接口,用于外接视频文件以及直接从阿上下载高清影片,这样的接口,对于内置硬盘的HMC9502来说,是非常实用的,并且凸显了其独特的功能。
蓝光播放中规中矩
开机后HMC9502默认直接进入蓝光播放模式,开机速度比起上一代产品没有明显的改观,这与索尼、松下等厂商新产品的快速开机相比有着不小的差距,是这款机器美中不足之处,希望华录的下一代产品在这个问题上可以有长足的进步。
蓝光播放模式下的系统设置也与之前的产品一样,突出简洁明快的特色,输出分辨率可以设置成720p/1080i/1080p,还支持1080p的24P输出模式,得到更加完美的电影画面。音频方面,具备HDMI无损音轨源码输出、7.1声道模拟输出解码和测试功能等。
HMC9502作为一款蓝光播放机,播放蓝光碟片的操作特点与之前的产品并没有明显的区别,通过播放蓝光碟《建国大业》,可以看出其播放蓝光碟的影音品质中规中矩,完全可以体现到蓝光光盘的高清优势。
硬盘网络一网打尽
作为一款号称蓝光高清电影机的多合一播放机,HMC9502内置的500GB硬盘才是最引人关注的特别之处,因此我们重点试用了其硬盘播放功能。
在初始界面中选择HDD Player,会黑屏一段时间,这是HMC9502在切换播放界面,用户不要担心机器出了毛病。选择本地播放按钮,会进入下一级菜单,让用户选择是播放本地硬盘预存的30部高清影片或者进入网络下载页面。硬盘播放状态下的音视频设置选项与蓝光播放状态下略有不同,视频输出多了480p少了1080的24p输出,也无法通过HDMI输出无损音频源码到外置功放。很特别的一点是,HMC9502支持局域网共享播放,用户利用PC下载或者NAS之类的网络存储设备都无需通过移动硬盘就可以直接访问并播放了,这~功能搭起了PC和家庭影院的桥梁,使得HTPC可以轻松实现。
在本地硬盘媒体目录中,可以看到,HMC9502预装了30部华录购买了版权的电影,里面包括《建国大业》、《梅兰芳》、《南京南京》、《投名状》、《迁徙的鸟》和《贝奥武夫》等经典高清电影,视频文件全部是ts格式,字幕则采用外挂形式,可以调节其显示位置。相信是为了节省硬盘空间,这些ts格式电影只附带了DTS或AC3音轨,而将菜单花絮等等附件一概删去。所有这些硬盘上的高清电影都可以直接通过左右键快速搜索全片,非常方便。
通过USB接口播放外接硬盘上的高清文件,与内置硬盘上的文件播放流畅度并没有差别,画质也是令人满意的。
连接互联网,可以看到华录提供的网络下载资源,包括热门歌曲、体育赛事、时尚演出、科教节目、热门影视剧等,应该可以满足绝大部分消费者的需求了,并且全部是免费的。可供下载的视频节目包括WMV、MKV、MP4等文件格式,基本上都是高清内容。我们试着下载了一些内容,在2MB带宽的ADSL网络下,下载速度基本维持在150KB以上,直接播放音频文件也很流畅。
总结
虽说日本厂商早有将蓝光录像机和硬盘录像机组合在一起的机型,但是蓝光光盘+硬盘+网络的多合一模式,还是让华录HMC9502成为业界第一款全能播放机,开创了一个新的时代。硬盘上预装正版影片,在日益重视知识产权的中国,也是一个顺应潮流的举动,值得表扬。
播放技术 篇12
我国从2007年开始发放3G牌照, 手机多媒体终端的用户数量将会伴随着终端开发技术和3G网络技术的发展而逐渐庞大。对于运营商来说, 市场规模将明显增大, 而产品运营、业务扩展、市场营销将会是近3年移动流媒体市场的核心竞争力。
据艾瑞咨询主办的“2006手机网民看3G”的互联网调查中统计, 视听娱乐将成为3G应用普及后智能手机用户最期待的无线业务。手机视频的巨大市场前景是包括运营商在内的所有企业都不可小视的。
类似优酷、 土豆、爱 奇艺等国 内视频巨 头非常看 好手机视频 终端 , 因为i Phone手机非常 普及 , 用户群体 庞大 ,最重要的是手机能随时随地地拍照、录视频, 而且能随时随地把拍摄 的视频上 传到视频 网站上去 , 非常方便 ; 另外iPhone多媒体客户端的播放内容可以直接从电视台、影视公司等多媒体提供商那里获得, 资源极其丰富。对用 户而言 ,手机视频播放客户端将成为人们非常重要的娱乐方式。手机往视频方向发展也是势不可挡的, 而对手机视频的需求也是非常大的。
2体系结构及其特性
1、i Phone SDK架构
i Phone SDK是由苹果公司提供的i Phone应用开发包 , 整个SDK包括了界面开发工具、集成开发工具、框架工具、编译器、 分析工具 、开发样 本和多个i Phone、i Pad、i Pod模拟器。如图1所示。
(1) Core OS 层
很多人听说过IOS系统是基于UNIX的。而Core OS层就是用Free BSD与Mach所改写的Darwin, Core OS是开源、符合POSIX标准的一个Unix内核。这一层包含并且提供了整个iPhone OS的基础功 能 , 如 : 硬件驱动 、内存管 理、程序 管理、线程管理、文件系统、网络接口,以及标准输入输出等,所有这些功能都是通过C语言的API接口来提供。此外, 这一层是最具有UNIX色彩的, 如果你需要把UNIX上所开发的程序移植到i Phone上, 多半都会使用到Core OS的API接口。
(2) Core Services 层
Core Services层基于Core OS基础之上 , 它提供了更多更丰富的功能, 它包含了Foundation.Framework和Core Foundation.Framework两个部分 , 并且 , 它提供了一系列处理字串、排列、 组合、日 历、时间 等基本功 能 , 所以叫Foundation。Core Fundation是属于C语言的API接口 , 而Foundation是属于Objective-C的API接口。另外Core servieces还提供了其他的常用功能, 比如: Security、Core Location、SQLite、Address Book. 其中Security是用来处理认证 , 密码管理 , 按安全性管理的; Core Location是用来处理GPS定位和地理信息处理; SQLLite是小型的、轻量级的本地数据库; 而Address Boo是用来处理电话薄资料的。
(3) Media 层
Media层提供了图片、音乐、 影片等多媒体功能。与音乐对应的是Core Audio和Open AL, Media Player实现了影片的播放 ; 图像处理 方面分为2D图像和3D图像 , 2D图像由Quartz2D来支持 , 3D图像则是用Opengl ES来支持 ; 最后用Core Animation来对动画提供了强大支持。
(4) Cocoa Touch 层
Cocoa Touch是Objective-C的API接口 , 其中最核心的部分是UIKit.Framework,应用程序界面上的各种组件, 全是由它来提供呈现的, 除此之外它还负责处理屏幕上的多点触摸事件、文字的输出、图片网页的显示、相机或文件的存取、 以及加速感应的部分等。
2开发环境
(1) 软件环境
操作系统: Mac OS X 10.6.4;
IDE: Xcode 5.0;
SDK版本 : iphone SDK 7.1;
模拟器: iphone 5s、ipad air;
(2) 硬件环境
CPU: 至少双核CPU, 1.2GHz以上主频 ;
内存: 至少1GB;
硬盘: 至少60GB;
网络: 10M/100M网卡。
3需求分析
3.1可行性
3.1.1经济
本项目的开发全部采用苹果公司的产品, 包括操作系统、开发IDE、测试用模拟器、真实i Phone手机。这些软硬件设备虽然价格不菲但对于专业苹果应用开发人员来说都是必须有的, 并且, 这些软硬件都为一次性投入, 在以后开发苹果应用时也可以继续采用这一套软硬件, 不存在人力物力的过度浪费现象。所以开发一款基于i OS的音乐播放器在经济方面是可行的。
3.1.2技术
苹果公司的产品在多媒体应用方面下了极大的功夫, 因此也提供一整套非常强大的多媒体开发框架。在程序设计语言上采用Object-C足够, 在UI布局方面采用.xib或storyboard等布局文件就可以设计出使用比较友好的UI界面, 媒体流的获取采用HTTP或是UDP协议获取网络视频资源; 在媒体播放方面采 用Iphone SDK 7.1中Core Audio和Open AL, MediaPlayer实现了影片的播放。从而分析得出开发这款音乐播放器在技术方面是可行的。
所以, 基于i OS的音乐播放器的开发是可行的。
3.2功能
当用户进入播放列表, 在本地视频文件或网络在线视频文件列表中, 选择播放, 即可观看视频, 切入到横屏模式可进入全屏播放。
3.3性能需求
(1) 对i Phone支持MP4/3GP/AVC/AVI/MPEG-4等格式的
视频文件进行播放, 分别对来源于本地和网络的视频文件进行处理, 利用横竖屏的灵活切换, 实现全屏播放, 使播放效果更为显著。
(2) 支持MP3音频文件的播放 , 从本地和网络列表中读取音乐播放列表, 根据歌曲和歌手名称从3G网络上搜索歌词, 支持歌词同步; 放完一首歌可自动播放下一首, 支持循环播放。
(3) 支持网络MP3流媒体的广播格式 , 简朴大方的用户界面, 增加文字流动效果, 更具观赏性。如果当前电台流出现问题, 可使用向前和向后来对同一站点的不同端口频段进行调整。
(4) 对本地文件媒体文件进行管理 , 刷新功能重新搜索本机上所有的媒体文件, 删除功能删除不必的媒体文件, 选中文件后可根据不同的媒体格式选择播放器, 支持本地蓝牙传输。
(5) 在线音音频列表按照用户输入的关键字搜索歌曲 ,支持在线播放、音乐文件下载。
(6) 从网站shoutcast上获取网络电台 , 支持电台搜索功能, 用户点击可在线收听。
(7) 通过土豆网站、56视频网站获取相应的视频信息 ,对视频文件进行分类管理, 用户进入后只需点击即可轻松地观看和下载, 支持视频搜索, 根据用户输入的关键字, 搜索网站中的视频, 支持翻页功能;利用六间房网站对i Phone手机平台的友好支持界面, 采用手机Web打开网页, 支持在线观看、收藏、搜索和访问友请链接网站等多种功能。
(8) 提供媒体文件下截 , 支持断点续传、文件播放、 删除等功能。
(9) 更多设置模块包括蓝牙管理、用户手册、 背景设置、动画效果设置等后台管理功能。
(10) 网络环境 : 播放网络视频 , 要求网络带宽流畅 , 信号好。
3.4关键技术
(1) 播放视频用到的API主要使用的是Media Player框架中的MPMovie Player Controller类和MPVolume View类。
(2) 链接网络资源获得歌词 , 进行分割排序比较 , 使用NSTimer来监测播放的时间 , 实现歌词同步。
(3) 广播播放器采用Code Morphic公司的Co Mo Radio开源软件底层的部分功能实现广播流的播放, 该开源软件提供的Cm Audio Player用于管理和播放网络广播。
( 4) 结合NSURLRequest类和UIWeb View控件 , 实现手机网页浏览。
(5) 下载管理采用ASIHTTPRequest实现网络连接 , 加入到network Array下载队列实现多个网络资源同时下载。
(6) 创建GKPeer Picker Controller类的实例 对及相关 的接口, 把大的媒体文件分割成小的模块, 来实现蓝牙传输。
4视频播放器模块
4.1视频播放器模块描述
视频播放 器模块是 对i Phone支持MP4/3GP/AVC/AVIMPEG-4等格式的视频文件进行播放 , 分别对来源于本地和网络的视频文件进行处理, 利用重力感应技术, 实现横屏和竖屏的灵活切换, 使播放效果更为显著。
4.2算法实现
播放视频用到的API主要使用的是Media Player框架, 该框架包括 两个类 : MPMovie Player Controller类和MPVolume View。它们用于管理整个视频的播放, 只需要提供视频文件的URL, 并调用play方法播放视频即可。视频文件支持如下:
( 1) H.264视频 , 高达1.5Mbit/s, 640×480像素 , 每秒30帧 , Low-Complexity版本的H.264 Baseline Profile采用AAC-LC音频, 高达160Kbit/s, 480k Hz, 立体声音频为.m4v、 .mp4和.mov文件格式。
( 2) H.264视频 , 高达2.5Mbit/s, 640×480像素 , 每秒30帧 , Baseline Profile高达Level 3.0采用AAC-LC音频 , 高达160Kbit/s, 480k Hz, 立体声音频为.m4v、 .mp4和.mov文件格式。
(3) MPEG-4视频 , 高达2.5Mbit/s, 640×480像素 , 每秒30帧 , Low -Complexity采用AAC -LC音频 , 高达160Kbit/s,480k Hz, 立体声音频为.m4v、 .mp4和.mov文件格式。
程序代码如下:
(1) 在项目中加入Media Player框架 , 并引入Media Player/Media Player.h头文件 :
( 2) 在View Controller.h文件里创 建一个MPMovie PlayerController指针 :
(3) 获取视频文件存储路径。由于从播放列表View Controller中采用委托传递数据操作过于繁琐 , 在本项目中各个模块之间进行数据传递基本上都使用文件读取用为中介来实现数据传递;
(4) 初始化一个网络视频播放player
(5) 初始化一个本地视频播放player
(6) player操作方法 :
播放: [self.movie_Player play] ;
暂停: [self.movie_Player pause] ;
停止: [self.movie_Player stop] ;
(7) 通过消息中心NSNotification Center时刻监视视频的播放状态:
4.3逻辑流程
视频播放模块的流程图如图2所示。
5结语