性能计算

2024-10-10

性能计算（共12篇）

性能计算篇1

德州仪器推出TMS320C66x多核DSP新品

日前,德州仪器(TI)宣布推出TMS320C66x系列最新产品TMS320C6678与TMS320TCI6609数字信号处理器(DSP),为开发人员带来业界性能最高、功耗最低的DSP,这预示着全新高性能计算(HPC)时代的到来。TI TMS320C6678与TMS320TCI6609多核DSP非常适合诸如油气勘探、金融建模以及分子动力学等需要超高性能、低功耗以及简单可编程性的计算应用。TI不但为HPC提供免费优化库,无需花费时间优化代码,就可更便捷地实现最高性能,而且还支持C与OpenMP等标准编程语言。

多核帮助您实现最高性能

TI基于C66x KeyStone的多核DSP支持16 GFLOP/W最高性能浮点DSP内核,其正在改变HPC开发人员满足性能、功耗及易用性等需求的方式。全球电信计算刀片及多核处理器平台制造商研华(Advantech)开发了DSPC-8681多媒体处理引擎(MPE),该款半长PCIe卡可在50W的极低功耗下实现超过500 GFLOP的性能。除目前提供的PCIe卡之外,TI和研华(Advantech)还将很快推出支持1～2万亿次浮点运算性能的全长卡,为HPC应用带来更高效、更快速的解决方案,实现业界转型。此外,TI优化型数学及影像库以及标准编程模型可帮助HPC开发人员快速便捷实现最高性能。

全面满足HPC开发人员当前及未来需求

DSPC-8681 PCIe卡包含4个C6678多核DSP,而更新版本的PCIe卡则将包含8个C6678多核DSP(可实现1万亿次浮点运算)或4个TCI6609多核DSP(可实现2万亿次浮点运算)。C6678是目前业界最高性能的量产多核DSP,具有8个1.25 GHz DSP内核,可在10 W功耗下实现160 GFLOP的性能。TI即将推出的TCIC6609多内DSP将为开发人员带来4倍于C6678多核DSP的性能,可在32 W功耗下实现512 GFLOP的性能,不但可使DSP成为HPC的理想解决方案,还改变着开发人员选择应用解决方案的方式。将于2012年提供样片的TCIC6609代码兼容于C6678 DSP,有助于开发人员重复使用现有软件,保护其对TI多核DSP的投资。

更多详情请访问:www.ti.conm.cn/c66multicore。

性能计算篇2

“高性能计算”重点专项2016年度

项目申报指南

依据《国家中长期科学和技术发展规划纲要（2006—2020年）》，科技部会同有关部门组织开展了《高性能计算重点专项实施方案》编制工作，在此基础上启动“高性能计算”重点专项2016年度项目，并发布本指南。

本专项总体目标是：在E级计算机的体系结构，新型处理器结构、高速互连网络、整机基础架构、软件环境、面向应用的协同设计、大规模系统管控与容错等核心技术方面取得突破，依托自主可控技术，研制适应应用需求的E级（百亿亿次左右）高性能计算机系统，使我国高性能计算机的性能在“十三五”末期保持世界领先水平。研发一批重大关键领域/行业的高性能计算应用软件，建立适应不同行业的2—3个高性能计算应用软件中心，构建可持续发展的高性能计算应用生态环境。配合E级计算机和应

用软件研发，探索新型高性能计算服务的可持续发展机制，创新组织管理与运营模式，建立具有世界一流资源能力和服务水平的国家高性能计算环境，在我国科学研究和经济与社会发展中发挥重要作用，并通过国家高性能计算环境所取得的经验，促进我国计算服务业的产生和成长。

本专项围绕E级高性能计算机系统研制、高性能计算应用软件研发、高性能计算环境研发等三个创新链（技术方向）部署20个重点研究任务，专项实施周期为5年，即2016年—2020年。

按照分步实施、重点突出原则，2016年启动项目的主要研究内容包括：E级计算机总体技术及评测技术与系统，高性能应用软件研发与推广应用机制，重大行业高性能数值装置和应用软件，E级高性能应用软件编程框架及应用示范，国家高性能计算环境服务化机制与支撑体系，基于国家高性能计算环境的服务系统等重大共性关键技术与应用示范研究，以及新型高性能互连网络、适应于百亿亿次级计算的可计算物理建模与新型计算方法等基础 — 2 —

前沿研究。2016年在三个技术方向启动10个任务。

针对任务中的研究内容，以项目为单位进行申报。项目设1名项目负责人，项目下设课题数原则上不超过5个，每个课题设1名课题负责人，每个课题承担单位原则上不超过5个。

1.E级高性能计算机系统研制

1.1 总体技术及评测技术与系统研究（重大共性关键技术类）研究内容：研究提出我国高性能计算机系统发展技术路线图和总体技术方案。研究我国高性能计算技术标准体系和核心标准，推动高性能计算机、高性能计算应用和高性能计算环境的协调均衡发展。研究E级高性能计算机评测方法与技术，发展体现应用特点的基准测试程序集，对E级高性能计算机系统进行全面评测，以评测促进研究工作。

考核指标：完成高性能计算机系统技术路线图和总体技术方案；完成我国高性能计算技术标准体系，制定3个核心标准；提出适应E级高性能计算机评测需求的评测方法，研制基准测试程

序集和评测系统，建立可持续发展的评测环境，完成对E级高性能计算机系统的评测。

支持年限：不超过5年拟支持项目数：1项

1.2 新型高性能互连网络（基础前沿类）

研究内容：面向百万节点、数千万处理器核规模，开展按需弹性网络设计方法和光互连网络的研究，实现互连网络结构（拓扑和路由）与应用通信特征的最优匹配。主要研究内容包括：

与计算和存储协同的融合网络理论、架构与协议、相应的编程模型和通信模型，网络与国产处理器的融合架构与设计，融合多协议的新型网络设备体系结构。

高性能高密度的光互连网络架构、基于光交换的动态光路可重构网络和路由算法、低功耗设计及光电高密度集成。

应用通信行为分析和建模、面向应用通信特征的高性能互连网络结构设计方法、高阶路由器设计方法、无死锁和可容错路由 — 4 —

算法等。

考核指标：提供原型芯片及原型系统，证明技术有效性。形成网络与应用、计算和存储相互协同的设计新方法，建立和发展新型大规模计算机互连网络理论，为我国在高性能计算领域保持领先优势提供关键保障。

实施年限：不超过3年拟支持项目数：1—2项

1.3E级计算机关键技术验证系统（重大共性关键技术）研究内容：提出突破制约E级计算系统功耗、性能、可扩展性等技术瓶颈的新思路，基于自主可控核心器件，探索先进的体系结构及关键技术，构建规模性验证系统，验证E级计算机系统的可实现性，为国产E级计算机的研制奠定坚实的技术基础。

研究可实现E级计算机的体系结构、高性能高可扩展的互连通信、能耗管控和高效冷却、高效计算节点、自感知操作系统、编程模型和编译系统、多层次存储、综合容错技术等E级系统关

键技术，采用国产超高性能处理器以及相关系统技术，实现规模性验证系统，并运行基础软件和典型应用，验证E级计算机的可实现性。

考核指标：完成E级系统关键技术验证系统，系统的规模为512个节点，单节点每秒5T—10TFlops双精度浮点计算性能，节点能效每瓦10—20Gflops，互连网络的点对点单向带宽大于200Gbps，MPI延迟小于1.5us，并证明其可实现10万节点以上规模。验证系统配备包括节点操作系统、系统并行操作系统、运行时系统、并行编译系统等在内的系统软件。在系统上部署3个以上能验证系统效能的大规模典型应用。

验证系统的Linpack效率大于60%，HPCG测试、Graph500测试、深度学习类测试的性能达到世界先进水平。基于对所研制的验证系统的测试与模拟，提出E级系统的方案，证明其能效比可以达到30GFlops/W以上，互连、存储系统的性能可以与计算系统匹配。验证系统与E级系统方案将为最终E级机研制团队的 — 6 —

遴选提供依据。鼓励优势单位强强合作，提升核心技术原创水平。所研制的验证系统要落实用户或在国家高性能计算环境安装部署，得到实际使用并得到用户配套资金。

实施年限：不超过2年

支持项目数：拟支持不同技术路线和架构的1～3台系统 2.高性能计算应用软件研发

2.1 适应于百亿亿次级计算的可计算物理建模与新型计算方法（基础前沿类）

研究内容：针对典型应用领域中不适应于E级计算的、我国重大行业应用普遍采用的四类左右的物理模型和计算方法，开展创新的可计算物理建模与计算方法研究，提出适应于E级计算的可计算物理建模和新型计算方法理论，并进行数值模拟典型验证。

考核指标：梳理并凝练形成依赖于E级计算的若干共性基础研究问题，发现制约E级计算的四类左右的物理建模和计算方法瓶颈并提出相应的解决方案，探索建立适应于E级计算的可计算

物理建模和新型计算方法理论。利用所提出的可计算物理建模和新型计算方法，借助于E级计算开展数值模拟研究，获得国际领先的基础研究成果，培养高水平基础研究人才。

实施年限：不超过5年拟支持项目数：1—2项

2.2 重大行业应用高性能数值装置原型系统研制及应用示范（重大共性关键技术与应用示范类）

研究内容：围绕飞行器设计与优化、全球气候变化等应用领域，基于现有研究基础和自主研发的高性能应用软件，突破其中的多物理、多尺度耦合技术瓶颈，构建高性能数值装置原型系统并进行典型验证，通过十亿亿次量级的高性能数值模拟，获得一批匹配于物理装置的重要的虚拟装置数值模拟成果。

（1）飞行器数值装置原型系统—数值飞行器。研制自主知识产权的空气动力学、结构强度力学分析两套应用软件，研制考虑结构弹性的气动力载荷分析、气动弹性分析以及它们之间的多 — 8 —

物理、多尺度的流—固耦合和多学科精细化综合优化软件系统。研究飞行器气动力学以及飞行器空气动力、飞行力学与结构动力学之间包括载荷传递的流固耦合计算、工程实用多体分离特种计算、飞机升阻力精确计算等高精度高效率计算方法，研究精确的跨音速气动弹性计算方法和十万量级设计变量的流固耦合综合优化算法，研究百万处理器核量级的并行计算技术。通过十亿亿次量级的高性能数值模拟，原型系统可以相对准确地开展大型飞行器总体结构强度分析，模拟气动力学以及气体与飞行器结构固体之间的流固耦合现象，获得一批匹配于飞行器物理装置的重要的虚拟装置数值模拟成果。

（2）全球气候预测与地球环境数值装置原型系统—数值地球系统。研制自主知识产权的大气模式应用软件、海洋模式应用软件、陆面模式应用软件、海冰模式应用软件和多类不同物理化学过程及其相互非线性耦合的大型应用软件系统；研究多个模式的高分辨率数值计算方法、多个模式之间的高精度多物理耦合算

法和百万CPU核量级的并行计算技术。通过十亿亿次量级的高性能数值模拟，原型系统可以相对准确地模拟全球气候变化中典型气候现象和地球环境中典型气候事件的发生，获得一批匹配于地球气候环境变化的重要的虚拟装置数值模拟成果。

考核指标：

（1）数值飞行器原型系统的全机流场数值模拟可实现60万核规模以上并行计算，复杂部件局部流场的高精度高分辨率数值模拟可实现百万核规模以上并行计算，以万核级为基准的并行效率达到30%以上，升力预测精度3%、阻力预测精度5%以内。可进行非线性结构振动与非线性流动耦合模拟，网格规模达到百亿量级，并行规模达到60万核以上，以万核级为基准的并行效率不低于30%，形成非线性气动弹性研究的完整体系，大展弦比飞机变形后升力特性预测精度5%以内，颤振速度预测精度10%以内，达到国际先进水平。多体分离系统模拟网格规模达到数十亿量级，可实现百万规模处理器核并行，以万核级为基准的并行效率不低 — 10 —

于30%，模拟结果与试验趋势一致。气动力和结构载荷分析考虑结构变形影响，实现反向耦合，载荷计算精度在5%。可进行十万设计变量的气动力、气动弹性、载荷和结构等多学科精细模拟优化，以万核级为基准的60万核效率达到30%以上。

（2）数值地球原型系统实现对热带气候系统（包括对赤道辐合带、厄尔尼诺等）较准确的模拟，以解决目前国内外耦合模式中普遍存在的虚假赤道双辐合带以及厄尔尼诺强度及周期失准的问题，提供更为准确的台风数目年际变化预估。实现在统一热力学和动力学理论框架下，以碳、氮、磷循环为重点的生物地球化学过程模型，为陆地生态系统温室气体排放、水体富营养化、气候变化对陆地生态系统的反馈机制等提供量化模拟结果。全球大气模式的网格分辨率小于1/4°，全球海洋模式的水平网格分辨率小于1/12°。性能可扩展至100万核以上，并行效率达到30%，整体模拟速度达到5模拟年/天。有效完成全球超高分辨率100年以上的数值模拟，提供更加合理的东亚地区气候模拟结果并发布。

实施年限：不超过5年

拟支持项目数：1—2项，数值飞行器项目要求产学研结合申报有关说明：其他经费（包括地方财政经费、单位出资及社会渠道资金等）与中央财政经费比例不低于1：1。

2.3 重大行业高性能应用软件系统研制及应用示范（共性关键技术与应用示范类）

研究内容：围绕复杂电磁环境、大型流体机械节能优化设计、复杂工程与重大装备设计、海洋环境数值模拟、能源勘探等重大行业应用，研制适应于E级计算的行业共享的应用软件系统并通过典型应用进行示范验证，获得一批具有重要显示度的数值模拟成果。选择以下一种重大行业应用软件系统进行研发。

（1）复杂电磁环境高性能应用软件系统。围绕复杂电磁环境领域重大行业应用在高性能计算电磁学及多物理等方面对E级计算的迫切需求，建立涵盖器件（至纳米尺度）、平台（至数万波长）和区域（至数千平方公里）三个层次的高性能电磁数值模拟 — 12 —

应用软件系统，实现对工程应用中复杂电磁多物理现象的E级数值模拟，相对准确地预测大型舰船及编队、飞行器编队以及新一代无线通信系统中的复杂电磁环境效应，支撑信息化平台及综合电子信息系统的电磁及多物理设计、预测与评估，显著提升它们在复杂电磁环境中的适应能力。

（2）大型流体机械节能优化设计能力型高性能计算应用软件系统。针对压缩机、鼓风机、泵及水轮机、风力机等大型流体机械的设计优化问题，研究多重旋转坐标系下流体机械非定常流动的高效高精度基础并行算法、新型十亿亿次及百亿亿次计算系统上流体并行软件的可扩展性方法、大型流体机械多参数并行优化设计技术等；研制适合于轴流、离心及混流式多级流体机械非定常流动的能力型高性能并行应用软件；通过十亿亿次量级的高性能数值模拟，完成10级以上大型流体机械非定常流动并行计算，设计工况下的流量、压比、效率预测精度在1%以内，调节工况下的预测精度在2%以内，为大型流体机械优化设计与安全

可靠控制提供可靠的计算数据，为开发流体机械大规模、高精度、大规模工程仿真提供有效计算工具。

（3）复杂工程与装备设计工程力学高性能应用软件系统。围绕大型装备制造、大型土木工程、大型水利工程等复杂工程系统的高分辨率数值模拟对E级工程力学计算的迫切需求，研制涵盖静力学分析、模态分析、冲击分析、材料损伤与破坏分析、非连续性分析等的高性能工程力学数值模拟应用软件系统，通过十亿亿次量级的高性能数值模拟，实现国家重大科技专项中复杂工程装备系统的典型力学响应行为分析，实现我国典型大型土木工程和大型水利工程抗重大自然灾害和全生命周期中抗疲劳损伤的力学综合性能评估，获得与实验一致的模拟结果。数值模拟的分辨率和计算规模与国际同类系统相当。

（4）海洋环境高性能数值模拟应用软件。发展我国的浪流耦合理论、区域及近海海洋模式和预报保障服务，研制西太平洋、北印度洋和南海高分辨率、多运动形态耦合的数值预报模式应用 — 14 —

软件，具备日变化和海洋内波分辨能力，远海达到5公里分辨率，近海海域达到1公里分辨能力。研制近海海陆一体（干湿网格）的浪—潮—流—内波—风暴潮耦合的高分辨率数值模式和应用软件，近海达到公里分辨率，近岸达到百米分辨率。

考核指标：选择上述某个重大行业应用，研制成功高性能应用软件系统并进行典型应用示范验证。软件系统部署于国家高性能计算环境的超级计算机，通过高效率的十亿亿次量级及以上规模的数值模拟，获得一批重要的有显示度的数值模拟成果，充分展示高性能计算对国家重要行业自主创新的支撑能力。以万核为基准的并行效率在60万处理器核规模达到30%，数值模拟的分标率和精度达到国际同类软件水平。

实施年限：不超过5年

拟支持项目数：1—3项，要求产学研结合申报

有关说明：其他经费（包括地方财政经费、单位出资及社会渠道资金等）与中央财政经费比例不低于1：1。

2.4 科学研究高性能应用软件系统研制及应用示范（重大共性关键技术与应用示范类）

研究内容：围绕材料科学、生物医药、科学发现等重大科学研究领域，梳理科学研究对E级高性能计算的典型需求，研制适应于E级计算的科学研究典型应用软件系统并进行应用示范验证，获得一批重要的数值模拟和科学发现成果。选择以下一种应用软件系统进行研发。

（1）材料科学应用软件系统：围绕我国材料科学领域对高通量E级计算的需求，研发自主知识产权的涵盖第一性原理、微观分子动力学和宏观动力学演化的应用软件系统，实现对能源、信息、制造等领域新型材料的创新设计和物性研究的E级数值模拟，获得具有显示度的数值模拟成果。

（2）生物医药应用软件系统：围绕我国个性化医疗发展所需的医药设计和药物筛选等对E级计算的迫切需求，研发涵盖分子动力学和药物筛选数据处理的应用软件系统，实现对个性化药 — 16 —

物设计与筛选全过程的典型E级数值模拟，获得具有显示度的数值模拟成果。

（3）科学发现高性能应用软件系统：围绕我国科学家开展的重大前沿基础研究对E级计算的迫切需求，研发高性能数值模拟应用软件系统，涵盖约4个左右学科方向的基础科学问题，实现对相应典型复杂物理现象的E级数值模拟，获得具有显示度的数值模拟成果。

考核指标：从上述材料科学、生物医药、科学发现等重大基础研究领域中，选择并研制成功1个高性能应用软件系统并进行典型应用示范验证，部署于国家高性能计算环境的超级计算机，通过高效率的十亿亿次量级及以上规模的典型示范数值模拟，获得一批重要的具有显示度的E级数值模拟和科学发现成果，充分展示E级计算对基础研究的支撑能力。以万核为基准的并行效率在60万处理器核规模达到30%，数值模拟的分标率和精度达到国际同类软件水平。通过数值模拟获得的基础研究成果在国际上

形成影响力，达到国际先进水平。

实施年限：不超过5年拟支持项目数：1—2项

有关说明：其他经费（包括地方财政经费、单位出资及社会渠道资金等）与中央财政经费比例不低于1：1。

2.5 E级高性能应用软件编程框架研制及应用示范（重大共性关键技术类）

研究内容：围绕重大行业应用和基础科学研究，凝练E级应用软件快速研发对高性能计算的共性需求，在现有研究基础之上，研制应用软件编程框架体系，必须同时涵盖下面五个编程框架：

（1）结构网格编程框架研制及应用示范：围绕我国重大行业结构网格应用软件快速研发的高性能计算共性需求，在现有研究基础之上，研制结构网格应用软件编程框架，用于在E级高性能计算机系统上支持至少20个高效使用百万量级CPU核的应用软件系统的快速研发以及大规模数值模拟。

（2）非结构网格编程框架研制及应用示范：围绕我国重大行业非结构网格应用软件快速研发的高性能计算共性需求，在现有研究基础之上，研制非结构网格应用软件编程框架，用于在E级高性能计算机系统上支持至少10个高效使用百万量级CPU核的应用软件系统的快速研发以及大规模数值模拟。

（3）无结构组合几何计算编程框架研制及应用示范：围绕我国重大行业无网格组合几何计算应用软件快速研发的高性能计算共性需求，在现有研究基础之上，研制无网格组合几何计算应用软件编程框架，用于在E级高性能计算机系统上支持至少4个高效使用百万量级CPU核的应用软件系统的快速研发以及大规模数值模拟。

（4）有限元计算编程框架研制及应用示范：围绕我国重大行业有限元计算应用软件快速研发的高性能计算共性需求，在现有研究基础之上，研制有限元计算应用软件编程框架，用于在E级高性能计算机系统上支持至少4个高效使用百万量级CPU核的

应用软件系统的快速研发以及大规模数值模拟。

（5）非数值图计算编程框架研制及应用示范：围绕我国重大行业大数据处理等应用软件快速研发的高性能计算共性需求，在现有研究基础之上，研制非数值图计算应用软件编程框架，用于在E级高性能计算机系统上支持至少2个高效使用百万量级CPU核的应用软件系统的快速研发以及大规模非数值应用。

考核指标：凝练我国重大行业应用E级应用软件快速研发对高性能计算的共性需求，研制形成跨结构网格、非结构网格、无网格组合几何计算、有限元、非数值图计算的应用软件编程框架体系，在E级高性能计算机系统上支持至少40个高效使用百万量级CPU核的应用软件系统的快速研发以及大规模模拟，网格规模达千亿、粒子数规模达到万亿、自由度规模达数万亿，200万处理器核并行效率达到30%以上，使我国的高性能计算应用编程框架的研发和实际应用达到国际领先水平。

系统2018年完成在E级计算机验证系统和两台国产100PF — 20 —

机上的部署，并对专项支持的应用软件开发团队开放源码。

实施年限：不超过5年拟支持项目数：1—2项

有关说明：其他经费（包括地方财政经费、单位出资及社会渠道资金等）与中央财政经费比例不低于1：1。

3.高性能计算环境研发

3.1 国家高性能计算环境服务化机制与支撑体系研究（一期）（重大共性关键技术类）

研究内容：研究国家高性能计算环境计算服务化的新机制和支撑技术体系，支持环境服务化模式运行，构建具有基础设施形态、服务化模式运行的国家高性能计算环境。研究内容包括：

（1）资源准入和分级标准

量化网络服务水平和集群计算服务水平，定义资源评价综合指标及综合指标的计算方法、资源服务质量级别和分级标准，作为资源定价收费的基本依据。发展与标准相适应、支持服务水平

量化的软件系统，支持和引导用户合理使用资源，形成全局统筹的资源布局。

（2）环境资源提升

在量化服务的基础上，整合环境各结点的计算、存储与软件资源，实现资源的服务化封装，提升环境资源能力与服务水平。

（3）基于应用的全局资源优化调度

根据应用程序特性和历史运维数据，从理论和实际两个角度分析和确定适合应用程序的集群、队列以及计算规模，结合传统的基于计算规模和运行时间的作业调度方法，形成第三种基于应用特性的全局资源优化调度。结合应用软件本身的特征，分析主流应用软件在不同体系结构、不同能力的资源中的性能特征，作为作业调度的依据。定义队列综合指数，综合排队时间、运行时间、应用类型、计算规模等众多参数，发展系统优化调度的核心算法。

（4）支持多种模式运营的国家高性能计算环境运行管理支 — 22 —

撑平台

研发支持服务化运营的资源管理、用户管理、安全管理、计费管理等管理功能，形成支持环境运行的管理支撑平台，研发支持服务与资源一体的环境监控系统、环境资源优化配置系统等。

（5）具有基础设施形态的国家高性能计算环境构建建立具有基础设施形态的国家高性能计算环境，节点数14个以上，初步建立服务化运行模式；实现可满足不同客户需求的使用环境；建立国家高性能计算环境安全体系，支持各类高性能计算应用。

（6）超级计算中心运行评价体系

超级计算中心的稳定运行，是提供计算服务的前提和保障。针对提供公共计算服务的超级计算中心，根据用户数量、机时使用情况、用户培训以及超级计算应用效果等指标，建立科学合理的超级计算中心和环境的综合评价体系。

考核指标：完成能初步支持服务化运营的国家高性能计算环

境运行管理支撑平台，建立具有基础设施形态的国家高性能计算环境（一期），节点数14个以上，初步实现以服务化模式运行。完成环境的资源升级，聚合的计算资源200PF以上，存储资源200PB以上，部署500个以上的应用软件和工具软件，用户数达到5000以上。完成超级计算应用综合评价体系，定期发布评价结果。

实施年限：不超过2年拟支持项目数：1项

有关说明：其他经费（包括地方财政经费、单位出资及社会渠道资金等）与中央财政经费比例不低于1：1。

3.2 基于国家高性能计算环境的服务系统研发（重大共性关键技术与应用示范类）

研究内容：依托国家高性能计算环境，建立行业集成业务平台、领域应用服务社区和高性能计算教育实践平台。促进环境的应用，取得应用实效。研究内容包括：

（1）行业集成业务平台

根据以下重要行业的应用需求和应用基础，建立2个左右行业集成业务平台，例如，石油地震勘探行业应用平台、基于高性能计算的集成电路电子设计自动化（EDA）平台、复杂产品优化设计平台、工程力学设计优化平台等，以灵活的业务流程技术、高性能计算技术和可视化技术，支持相关行业新型业务的发展。

（2）领域应用服务社区

在“十二五”863重大项目应用社区研发基础上，进一步深化应用社区的研发，建立2个有广泛应用需求和较大用户群的应用服务社区，例如，创新工业产品优化设计、新药研发与个性化医疗、计算化学与生物信息、数字媒体、面向中小企业的数值模拟与计算环境等，提供计算服务和解决方案，为计算服务业的建立积累经验。

（3）高性能计算教育实践平台（一期）

面向大学生和研究生教育，建立高性能计算实践平台，为大

学生和研究生教育提供免费机时，形成高性能计算实践环境，培养学生的计算技能，促进高水平人才培养，为高性能计算应用的普及与提高奠定人才基础。

考核指标：研发成功2个行业业务集成平台、2个应用服务社区和1个高性能计算教育实践平台（一期）。每个行业业务集成平台集成50个以上应用软件，服务于200个以上用户；每个应用服务社区提供50种以上应用服务，服务于500个以上用户；教育实践平台服务推广到1000个以上大学生或研究生用户，每年提供2000万CPU核小时免费机时。

实施年限：行业集成业务平台和领域应用服务社区不超过5年，高性能计算教育实践平台不超过2年

拟支持项目数：1—2项行业集成业务平台，1—2项领域应用服务社区，1—2项高性能计算教育实践平台。行业集成业务平台项目要求产学研结合申报

有关说明：行业集成业务平台和应用服务社区项目要求其他 — 26 —

微软崭露高性能计算心篇3

盖茨当年能赏光出席SC大会和微软当时一项野心勃勃的产品发布计划有关。这个产品就是微软针对高性能计算领域内的集群系统所推出的操作系统WindowsCompute C1uster Server 2003(以下简称WCCS 2003)。盖茨的身体力行为WCCS 2003在2006年的正式亮相做了最有效的预热。

两年过去了，WCCS 2003一直表现得不温不火，但是，越来越多的迹象表明，微软其实在WCCS 2003身上寄予了很多厚望，并且也为此煞费苦心。

2007年3月，高性能计算领域内的老牌厂商SGI宣布，开始销售基于WCCS 2003的Altix XE集群系统，这也是SGI首次在Altlx系列中使用微软的操作系统，这之前，SGI一直是Linux和Unlx的拥趸；7月，微软与惠普(www.hp.com.cn)的“水平组合”面向企业和中端市场，推出了极具灵活性和高可用性的超级计算集群，由此扩展了双方所签署的面向高性能计算市场的全球销售和营销协议。

最新的例子出现在2007年11月底，微软和曙光签署了合作备忘录，双方将基于微软WCCS产品，针对高性能计算领域在市场、技术、渠道、销售层面进行合作，同时建立“曙光一微软软件技术测试实验室”，共同培训软件技术人员并定制行业解决方案。曙光多年来一直是国内高性能计算领域内的标兵，能被微软选中几乎是一种必然。根据合作协议，双方很快就会推出基于WCCS 2003的机群产品曙光4000W，并准备针对4000W联手研发适用于各垂直行业的解决方案。

这是微软觊觎已久的一大块市场，从某种角度讲，WCCS也是微软打开这块市场的钥匙。在2007年11月底发布的那份TOP500榜单仍是L1nux的天下，有381台超级计算机采用了L1nux，基于微软WCCS 2003的只有6台，苹果的Mac OS X系统有2台。IBM(www.ibm.com.cn)的两台“蓝色基因”超级计算机仍牢牢占据着排行榜的前两位，就像IBM对于企业市场的控制力一样。微软面前看似困难重重，但这些都不是问题的关键。

微软很早就已经明确表示过，其进入高性能计算市场的目标之一就是要为中小型用户带来更便宜和更易用的超级计算机，而传承自Windows的使用习惯无疑是微软手中的杀手锏之一。“对于普通的非计算机专业用户，如需要进行计算的生物学家，Linux集群则不太友好。”康奈尔大学计’算机科学教授Ron Elber的观点就是一个典型的例子。

性能计算篇4

JavaScript作为当下最流行的脚本语言之一,广泛应用于PC及手机端浏览器开发。作为一种开源的、不断升级的新的编程语言,其中包括其计算性能日益优化。JavaScript的作用在1995年诞生时只是处理一些服务器验证操作,这是因为当时的服务器语言Perl等必须在服务器端才能对用户提交的表单进行验证,JavaScript很好地解决了这个问题,并在客户端处理[1]。目前,JavaScript的功能强大,不仅能处理数据验证、事件响应,还支持用户交互、复杂计算以及lamda匿名等。

JavaScript的计算功能虽然强大,但以往主要是在服务器端使用,可以像C语言一样处理大量数据,但在客户端本地的测试对比研究较少。一方面是因为JavaScript的“主战场”在服务器端;另一方面在于它的竞争对手C++、Java、MATLAB等先入为主,人们几乎忽略了JavaS-cript的强大计算性能[2]。

本文在研究JavaScript计算能力的基础上,与几款主流编程语言、浏览器进行对比,找出JavaScript计算方面的不足与优势。

1 主流程序设计语言计算性能理论分析

1.1 JavaScript

JavaScript中的复杂计算主要在function函数表达式内进行,它和众多程序语言一样,也支持递归、栈、闭包、对象等算法核心内容,计算都在<javascript>标签内的function()执行。

具体程序执行步骤为:客户端浏览器打开网页文件,从上而下逐行读取并显示其中的HTML/脚本代码,根据解析的HTML标签完成相应的动作;当遇到<javascript>标签时,自动导入相关js库,然后逐行处理function函数[3];每一段完整代码都经过词法分析、语法分析,然后生成语法树。在此过程中,如果有语法错误,就无法生成语义树,并立即报错,停止解释。

JavaScript的数据类型分为6种:Undefined、Null、Boolean、Number、String、Object,其中可以参加计算的只有数值类型(Number)。由于ECMAScript不具有严格类型,对于一些变量需要进行类型判断。比如检测变量t是否为数值类,可以用alert(typeof(t))表示,结果返回number即为数值。在JavaScript中,整数、浮点数值使用IEEE754格式来表示[4]。它能保存的数值范围为5e-324至1.7976931348623157e+308,如果具体数值超出上述范围,将会返回无穷大(Infinity)。

1.2 C++

C语言属于结构化的中级程序设计语言,它巧妙地把高级语言的数据结构和函数语句与汇编语言的直接、实用结合起来。而且它的应用范围十分广泛,不仅包括简单游戏、二三维图形以及强大的计算能力,还可以应用到嵌入式系统和单片机开发当中。

在C语言当中,数值精度由数据类型控制。由于位数限制,float有效数字的精度只有6~7位10进制,double类型得精度为14位。虽然printf(“%30.20f”,0.3)的计算机输出为0.30000001192092896000,但后面的小数1192092896000没有实际意义,它是按照格式要求由转换运算产生的,并不是错误[5]。

C语言几乎由汇编语言编写,理论上汇编语言速度最快,但是由于某些编译器存在代码优化功能,在实际编写中,速度并不一定优于C语言。

1.3 JAVA

Java中数值类分为整型和浮点型,具体包括double、float、int、long、byte、short六种类型。每一类型取值范围都不一样(见表1)。如果直接使用浮点数计算,System.out.println(0.01+0.05)的结果为:0.060000000000000005,数据精度为实际数据位数后16位。

Java的基本数据类型并不能完整反映小数。如果需要精确计算,必须采用BigDecimal[6]。

1.4 MATLAB

MATLAB包含的数据类型很多,例如元胞、结构、逻辑、字符串、数值、类等,数值类的计算结果被保存在ans变量中[7]。在实际计算中,如果没有指定类型,将默认为双精度型(double),其它数值类型还有单精度型、无符号整数、有符号整数等,此外MATLAB还支持复数,用i或j表示。如果在MATLAB中计算1除以3的结果,即a=1/3,并设置计算精度为8位小数,则会显示为0.33333333;而计算a=a*3的结果是1。这证明了MATLAB在数据实际运算中不论输出格式怎样都会保持变量精度。[8]如果想对数据精度进行设置,可以使用digit(n)和vpa(S,n)来实现,其中n就是要保留的有效位数,S表示数值变量。

2 实验对比分析

2.1 与主流编程语言对比

利用常用的编程软件对比测试计算精度和运行时间。测试核心代码为一个编程程序中非常基础和常用的for循环;测试函数为一个二次函数。为提高数据量的可参考性,进行迭代108次。

JavaScript测试代码如下:

C程序的测试代码如下:

Java语言采用Eclipse环境编写代码,测试数据如下:

MATLAB测试代码如下:

经过对比分析,可以表示计算能力的运算时间和结果精度如表1所示。

在同一计算机上对比计算结果和运行时间,可以看出:JavaScript的计算速度最快,并且计算精度最高;C++与Java的运行时间相差不大,但Java的计算结果精度很低;MATLAB运行最慢,计算精度比Java高。

2.2 主流浏览器间的对比

由于不同浏览器采用的内核不同,直接导致数据运算结果有一定差异,比如Firefox采用gecko核心,IE浏览器系trident核心,Google的浏览器Chrome采用的是webkit等。测试平台均为以JavaScript为计算脚本的当下最流行的几款浏览器客户端软件,版本号为最新,其中Dreamweaver为Web前端开发常用的客户端软件,结果如表2所示。

在同一计算机上对比计算结果和运行时间,可以看出:所有以JavaScript为脚本语言的平台计算精度一致,但是计算时间有差异,Dreamweaver的计算速度最慢,比其它平台慢得多;Firefox、360、Opera、Chrome的运行时间都在100~110ms左右,相较而言,IE的运行时间较慢,在190~200ms之间。

3 结语

JavaScript作为出色的Web前端脚本语言,并非作为编程语言而开发,仅仅是解释执行语言。但在一定的精度和复杂度计算范围内,它仍然可以和C++、Java等主流编程语言相媲美。JavaScript作为一个初等编程语言,仍然有很大的发展空间,其计算能力未来可以借由类库或插件予以提升。后续研究将从以下几方面展开:①编译环境对结果的影响。对于同一语言,不同的编译环境存在着不同的核心算法和代码优化功能,这都会影响具体代码的执行情况。例如JavaScript的解释执行环境包括各类浏览器和editplus、Dreamweaver等软件,其中Dreamweaver在同一计算机上就比处理其它数据速度慢得多;②CPU、内存配置等的影响。较大的内存空间很明显可以实现对较大数据量代码的支持,有效避免卡顿现象;③特殊函数、外部插件对数据精度的影响。此外,文中已经说明Java自身默认处理数据精度并不理想,需要利用BigDecimal提高数据精度。JavaScript在调用外部library方法时也比使用内部函数方法的运行速度慢,需进一步研究。

参考文献

[1]DAVID A PATTERSON,JOHN L.HENNESSY.计算机组成与设计:硬件/软件接口[M].北京:机械工业出版社,2011:135.

[2]NICHOLAS C.ZAHAS.JavaScript高级程序设计[M].北京:人民邮电出版社,2012:689-696.

[3]LOIANE GRONER.学习JavaScript数据结构与算法[M].北京:人民邮电出版社,2015:19-32.

[4]ADAM FREEMAN.HTML5权威指南[M].北京:人民邮电出版社,2014:86.

[5]郑莉,董渊,何江舟.C++语言程序设计[M].北京:清华大学出版社,2010:44.

[6]郎波.Java语言程序设计[M].北京:清华大学出版社,2005:60.

[7]司守奎,孙玺菁.数学建模算法与应用[M].北京:国防工业出版社.2015:90-92.

高性能并行计算体验之高校方案篇5

----百元体验百万节点高性能并行计算之高校方案

一、活动内容

经过近一年酝酿，2011年第四季度元计算公司为推进自身制定的整合中国计算力量，打造产业研发应用联盟的横向发展策略正式推出了元社区计划。作为该项计划的一个重要组成部分，也作为一项配合元社区的市场推广活动，元计算面向中国高校全体师生推出旨在扩大产品应用范围和客户群体的优惠体验活动，即“校园方案”。

本次活动期限暂定半年，从2011年11月1日起至2012年4月30日止。在此期间，凡是工作关系隶属于高等院校的教授、副教授、讲师、青年学者或在读本科、硕士、博士研究生，均可向元计算公司提出pFEPG软件租赁试用申请。提出申请后，经公司审核，如申请者的研究领域和教学科研活动在许可范围内，可以以3.6万元的价格获得目前市场销售价格50万元的“并行有限元程序自动生成器”pFEPG软件（校园版）一年期限（限百万节点计算规模）的使用授权（相当于每天100元，故称为“百元体验高校方案”）。此活动开展时间有限，申请者须在2012年4月30日前提交申请方为有效。

二、活动背景

元计算公司是目前国内最大的拥有自主知识产权的通用CAE软件供应商，也是在中国数值计算领域享有盛誉的自主品牌。其核心产品pFEPG至今已经有二十七年的发展历史。pFEPG是目前世界范围内唯一的并行有限元自动生成系统，它不仅是一个功能覆盖了结构、固体、流体、电磁、传热、材料等多个学科数十项计算领域的通用CAE软件，更是一个性能优异的有限元程序开发设计平台。工业用户可以直接应用pFEPG公式库技术，简单方便的完成复杂的多物理场耦合计算和各类常规计算；科研用户则可以利用pFEPG设定的有限元语言，以一种类似于数学公式书写的自然方式，直接写出微分方程表达式和算法表达式，从而自动的生成可并行的有限元计算源程序。因此对于有高性能计算需求的用户而言，其不必关心并行计算的复杂机理，不必关心底层源代码，只需把主要精力投放在求解问题本身的物理方程设定，参数配置和算法选择上，就可以高效的完成计算，从而大大缩短编程时间和

调试过程。根据我们对用户多年的反馈信息统计，使用pFEPG平台进行计算研发的工作量以代码编码量和累计研发时间为统计指标，均减少一个数量级以上。因此该平台软件非常适合于研究型群体的使用，非常适合于高校科研人员将自己在某一领域多年的科研成果直接转化为CAE实用技术，并推广到更多生产企业进行实际应用。

为了更好的帮助科技研究者以pFEPG软件为载体实现技术封装和转化，为了提供给广大的科技工作者一个共用的市场营销服务环境，也为了给更多的生产企业建立一个寻求CAE咨询的市场，元计算公司正式推出了元社区活动，这一活动的目的主旨即为围绕软件算核心产品体系搭建CAE界科研-应用一体化平台。近期元社区网站正式上线，标志该活动正式起步。元计算科技发展有限公司希冀通过这一平台，展示高校师生在各个领域的科研成果并为高校老师创造更多的经济回报。

“校园方案”是元社区系列活动中的一个重要内容。元计算科技发展有限公司本着合作、共赢的态度为高校老师提供pFEPG软件体验服务，并在元社区上线之际推出优惠活动，以便让更多的中国CAE高端技术群体和基层群体认识和了解pFEPG软件，并推动国内自主知识产权软件在各个行业的发展，也让更多的国内企业用户体验到科研成果带来的经济价值。

三、活动细则

1、校园推广活动申请者范围：全国高等院校在职教师职工以及在读本科、硕士、博士研究生。

2、申请时限：2011年11月1日至2012年4月30日

3、试用方案：凡申请符合条件者，可以以3.6万元的价格获得元计算公司提供的“并行有限元自动生成器pFEPG”一年期（限百万节点计算规模）的使用授权。具体授权时限以采购合同生效时间点或双方协议时间点为准。该价格不含有pFEPG环境集成的前后端处理模块GID。用户如有需求，可另行付费或采用GID试用版软件。

4、此次活动中所提供的pFEPG软件为校园版，对并行并发数量等性能有所限制，详细情况可咨询元计算市场部。

5、所有有效申请用户所得到的pFEPG软件（校园版）仅能用于教学、科研、培训等活动，不得从事商业有关应用。

6、对于没有并行环境的用户，元计算公司可以为用户搭建不多于4台台式机的并行计算环境。此项目技术服务需另外付费（费用为1万元）。

7、鼓励用户公开发表利用pFEPG完成的研究工作和论文，鼓励用户申报基于pFEPG二次开发的应用软件的软件著作权，鼓励用户申报有关专利，也欢迎用户与元计算公司洽谈技术转让或联合开发等事宜。所有本次活动体验用户均视为正版软件用户，可以参与元计算每年举办的用户年会和评奖等活动。

8、用户在使用期限内需要提供2个分析案例，或者一篇公开发表的论文。

9、如有公开发表的论文或者专著，需在其中标示“pFEPG”或“元计算”等字样。

10、基于pFEPG开发的软件中应在明显位置标示元计算公司的企业图标和网站链接。

11、试用期满欲购买正版pFEPG软件的用户可享受进一步的优惠和服务。

四、技术服务

1、为保证体验用户尽快掌握pFEPG软件使用和操作，元计算公司建议用户参加每两个月一次为期三天的免费基础培训或付费高级培训。元计算培训活动为全国范围内巡回培训，用户可咨询元计算市场部获得最新的培训安排和计划。本次校园活动的参与用户可获得所有与正版用户相同待遇，可以参加高级培训并享受最低价格优惠。

2、提供日常电话、邮件等售后服务，期限为软件有效期内。

3、参加高级培训可以获得往届高级培训视频资料、讲义等资料。

4、体验用户可以免费获得其研究领域的其他pFEPG相关论文，并将在元计算网址公布文章列表。

5、如有用户要求在其指定地点进行点对点培训，元计算可以增加安排定点基础培训，培训时长三天。此类培训不限制人数，但需要增加总培训费用1万元，培训场所由客户提供。

此活动最终解释权归元计算科技发展有限公司

联系方式：

浪潮高性能计算用心良苦篇6

2005年12月，浪潮高性能计算创新奖励基金管理委员会在京正式发布征集成果，对获奖项目、获奖机构或人员颁发奖励证书和奖金，同时发布2006年“浪潮高性能计算创新奖励基金”成果征集公告。

据IDC统计，中国的高性能计算市场年增长率达到20%～30%。近年来，高性能服务器的市场随着需求而迅猛增长：2003年，中国服务器市场上高性能服务器的销售量已经达到2.325万台；2004年高性能服务器的市场销售量有增无减，销售额却占据了整个服务器市场销售额的50%以上。而一直以来，这一市场基本上被国际厂商所垄断。

国产服务器厂商浪潮认为，中国的政府、服务器厂商以及相关的科研院所必须承担起高性能自主化和产业化的重任。浪潮服务器技术总监胡雷钧说，开放架构在高性能服务器领域的应用，使得国内厂商拥有与国外厂商同等的技术“起跑线”，将会为中国本土高性能服务器产业的兴起提供重要的发展契机。

据了解，“浪潮高性能计算创新奖励基金”，是国家“863计划”计算机软硬件技术主题专家组与浪潮集团联合设立的一项长期的社会奖励基金。该奖励基金主要面向国内高性能计算机和商用高性能服务器系统的研究与开发领域，旨在鼓励国内在高性能领域的科技创新和技术成果转化，推动国内高性能计算领域的研究、开发和产业化。胡雷钧说，这是浪潮回报社会的一种方式。

胡雷钧介绍，高性能计算从市场应用角度大致分为两个部分：高性能科学计算（HPC）和高性能商用计算（HPS）。前者对服务器的计算性能提出了很高要求，主要应用在科学研究、地质勘探等领域; 后者则要求服务器具有强大的事务处理能力，在金融、证券、电力、税务等行业有着广泛的应用。高性能商用计算占到整个高性能计算市场份额的95%。

胡雷钧认为，国产高性能要实现产业化，需要着眼于占市场份额绝大部分的高性能商用计算市场，发展具有强大事务处理能力的高性能系统。这其中，实现应用的突破和创新才是创新的关键，高性能产业的发展重点应该是商用高端应用，围绕商用高端应用，重点发展高性能体系结构、操作系统与应用软件的应用价值。

我国高性能产业经过多年的发展，已经取得了长足的进步。据不完全统计，863项目在高性能计算领域已经鉴定的成果近400项，这些成果中已应用的成果有230多项，已形成产品并取得明显效益的有80多项。

但是，胡雷钧介绍，与国际先进水平相比较，我国高性能产业还存在较大差距，无论技术、应用，还是发展模式上都有待进一步提升。

要实现高性能应用的产业化，就需要建立完善的产业化转换机制，使最新的研究成果能够最迅速地转化为可以应用的产品。为此，我国在上个世纪80年代初便开始推动建立“产学研”工程。

Hadoop计算性能的研究篇7

目前，国内外对Hadoop[1]的MapReduce框架[以下简称MR]的数据处理性能有了相关研究。例如《7 Tips for Improving MapReduce Performance》[2]，对改善MR的计算性能提出了多个建议；《基于Hadoop平台的海量数据处理研究及应用》[3]给出了MR配置参数优化的方案；《Optimizing joins in a map-reduce environment》[4]也给出了MR应用编程优化的思路，重点研究减少不必要的Reducer的数量。但以上研究只提出了思路，缺少相应的验证策略，且没有具体测试数据。

本文中，作者搭建一个小型Hadoop集群，并以处理200GB日志文件为例，统计出具体的MR编程优化和配置参数优化的测试数据，说明这两种优化策略的实际效果，给Hadoop计算性能的优化提供参考。

1 MapReduce并行计算

本章节主要介绍MR框架[5]，及MR数据并行处理的流程[6]。

MR是Hadoop中的核心技术，MR框架实现了海量数据的分布式并行计算。MR借鉴函数式编程方式，向程序员提供了简明的编程接口，即Map函数和Reduce函数。程序员只需简单的编写这两个函数就可以实现分布式并行化的数据处理，并且无需关注底层的系统细节。其中Map函数负责把大量的数据进行分解处理，Reduce函数负责把多个数据处理结果进行合并。

数据的处理开始于map task[以下简称Mapper]的运行，Mapper按照程序员编写的Map函数中的代码逻辑处理被分割成固定大小的split文件，同时MR框架提供一个Partitioner接口用来对Mapper结果进行分区，它以key hash的方式均衡的决定Mapper的输出数据最终应该交由哪个reduce task[以下简称Reducer]处理。接着就是MR的shuffle过程：Mapper将产生的结果先写到它的环形缓冲区Buffer中，然后MR会对Buffer中的数据进行排序[sort]，如果程序中或配置文件中指定了Combiner，则该Combiner会对排序后的数据再进行一次合并[combine]，以减小数据大小和减少溢写[spill write]文件的数量。当Buffer被使用的比例达到了它的阈值，则spill write线程启动并将数据到磁盘。如果溢写文件过多，shuffle阶段会有一个溢写文件的合并[merge]过程，最终生成一个中间文件等待某个Reducer处理，至此Mapper完成任务。Reducer会从Mappers所在的Task Trackers的磁盘上（如果Mapper的结果较小则会从Mapper的Buffer上）拉取中间数据到内存或磁盘，并再次将这些数据进行merge，最终形成Reducer要处理的文件，至此MR的shuffle完成。接着就是Reducer开始执行，并将最终的结果写到HDFS上。MR数据并行处理的流程如图1。

2 实验和研究过程

本章节主要包括测试研究的3个过程：首先是Hadoop集群的硬件配置；其次是根据海量日志的数据特征进行建模，设计测试策略和过程；最后则是对测试得出的数据进行分析统计，得出研究结果。

2.1 环境搭建

本小节中，将介绍搭建整个Hadoop集群环境所需的硬件配置和软件使用情况。

Hadoop集群基于Master/Slaver模式[7]，本实验中由一台物理服务器作为Master，用于整个集群命名空间管理[NameNode]和JobTracker的执行，另外，由3台物理服务器作为Slaver，用于数据存储[DataNode]和TaskTracker的执行。Master采用主流双路四核CPU、10GB内存、4块SATA硬盘；Slaver采用主流双路四核CPU、8GB内存，5块SATA硬盘；采用百兆交换机用于节点互联和数据交换。物理服务器的操作系统均为Linux Redhat Fedora，操作系统上搭载1.0.0版本的Hadoop。

2.2 实验设计

本小节主要介绍实验的设计思路，在实验设计阶段会涉及两块内容：一是根据日志文件的数据格式和业务需求进行计算建模；二是根据计算模型进行合理的业务编码，即实现优化的MR编程。同时，进行Hadoop配置参数的优化，最后给出MR计算性能提高百分比计算公式。日志文件的数据格式如表1。

UId：用户ID;functionVlu：功能值；musicId：歌曲ID;onTime：上线时间；offTime：下线时间；playTime：每首歌曲播放时长；playATime：所有歌曲播放总时长；onLen：在线总时长；playSum：播放歌曲总数；playUSum：播放不同歌曲总数。其中由functionVlu来区分UId对应的是musicId/playtime还是onTime/offTime。得出的用户转付费率[User pay Rate]计算模型如下：

当计算模型构建完成，就可以根据计算模型的特点完成日志文件分析计算的MR应用编程，高效的编码方式和风格[8]会对同一数据源的计算时间产生不同影响，本实验的目的就是尽量压缩Hadoop的MR阶段的计算时间。MR的任务执行主要集中在文件的读写和数值计算，所以从编写优化的MR的角度来说，优化即是减少不必要的IO次数和内存使用。分析MR框架源码，MR的shuffle阶段是最佳的优化时期[9,10]：减少运行MR程序的JVM实例的Java Heap和Java Stack[11]所占用的内存，以把更多地内存用在shuffle阶段，增加Mapper和Reducer的Buffer大小，使spill write阶段的sort和combine在内存中就可完成，以减少sort的IO次数。

本实验中Hadoop配置参数的调优涉及Job＿01和Job＿02的MR方面，根据日志文件的大小，使用Configuration实例分别对Mapper和Reducer的配置参数进行调优，。由于Job＿01处理的是原始的大文件和数据的累加计算，所以可以对其shuffle阶段内存大小进行调优，而Job＿02处理的文件是Job＿01处理之后的结果，文件数量和大小被大大缩减，并且主要的计算集中在User Pay Rate的计算和Top10000的排序。所以，调优主要集中在shuffle阶段和Reducer的内存方面。

优化MR编程计算性能测试采用优化前的结果和优化后的结果进行对比的方法，分别m次测试优化前和优化后整个作业耗时，并分别求出平均值，计算出计算性能提高的百分比，性能提高百分比=（表示性能调优前第i次测试结果，表示性能调优后第j次测试结果）。在优化MR配置参数的计算性能测试中，每次测试针对Job＿01和Job＿02只修改一项参数配置项并且取其不同的值，其余配置参数默认，得出测试优化前和优化后整个作业耗时，性能提高百分比=。

2.3 结果分析

本小节会根据上一小节实验设计的思路，运行MR程序，并进行MR计算性能的调优测试，根据最后的测试结果分析性能调优对整个作业耗时的影响。首先是优化MR编码层面上的计算性能的测试，测试结果如图2。

从测试结果的图表中可以看出，在优化MR编程之后，整个MR的计算性能有一定的提高，计算性能的提高百分比==10.70%。

在根据优化MR编程的基础上，优化MR配置参数的测试会根据不同配置参数修改它不同的取值，找出符合本业务计算模型的配置参数的值，配置参数全部采用默认值的测试结果如表格2。

后面的测试所使用的JVM的Heap的大小均由参数mapred.child.java.opts设置为-Xmx1024m，然后进行测试，不同配置参数调优的测试结果如表格3。

从表格＿3种可以看出根据MR作业特征的不同，和Hadoop集群规模大小，采用合适的MR配置参数可达到一定的性能提升，其中对参数m＿fct和m＿pralCp参数的调优对MR就算性能的改善有明显效果。对本实验来说参与MR计算的数据量较大，Mapper和Reducer的Buffer大小修改对计算性能的影响较小。

3 结论

本篇论文中，由实验所需搭建了一个小型Hadoop计算平台，根据业务的计算模型进行了一系列MR计算性能的调优测试，并得到了相应的测试数据。从中可以得出调优对整个作业运行耗时的影响，同时由于业务特征的不同，对不同参数的调优也会产生不同的性能改善效果。在今后的工作学习中，对涉及到的Hadoop性能调优，应该从自身特有的需求出发，把握整个数据处理的流程和细节，并根据物理服务器群的整体物理性能，找到一个合适的优化方案。

本论文研究的内容只涉及到MR计算性能改善这一点，所以还有不足之处。常见Hadoop的调优方案还有：Linux文件系统参数的调优、HDFS配置参数的调优、作业调度算法调优等，这些将是下一步的研究内容。

摘要：作为Apache开源项目的 Hadoop,凭借着它的两大核心技术:HDFS和Map Reduce,常被应用于海量数据的分布式存储和高并发计算,以发掘海量数据中隐藏的商业价值。本文通过在海量日志文件处理的过程中,对Hadoop的计算性能进行调优,主要涉及Map Reduce应用编程的优化和Map Reduce配置参数优化两个方面。最后,通过对实验数据的分析总结,给出Hadoop计算性能优化的参考。

关键词：Hadoop,并行计算,计算性能,海量数据

参考文献

[1]Apache.Hadoop[EB/OL].http://hadoop.apache.org/,2006.

[2]7 Tips for Improving Map Reduce Performance[EB/OL].http://blog.cloudera.com/blog/2009/12/7-tipsfor-improving-mapreduce-performance/.

[3]姜峰.基于Hadoop平台的海量数据处理研究及应用[D].北京:北京邮电大学,2013.

[4]Afrati FN,Ullman JD.Optimizing joins in a MapReduce environment.In:Manolescu I,Spaccapietra S,Teubner J,Kitsuregawa M,Léger A,Naumann F,Ailamaki A,Ozcan F,eds.Proc.of the EDBT[M].Lausanne:ACM Press,2010:99-110.

[5]Chuck Lam.Hadoop实战[M].北京:人民邮电出版社,2011:52-84

[6]Map Reduce Patterns,Algorithms,and Use Cases[EB/OL].http://www.infoq.com/news/2012/02/Map Reduce Patterns.

[7]Tom White.Hadoop权威指南[M].第2版,北京:清华大学出版社,2010:259-291.

[8]Joshua Kerievsky.重构与模式.第1版,北京:人民邮电出版社,2006:17-26.

[9]Wegener D,Mock M,Adranale D,et al.ToolkitBased High-performance Data Mining of Large Data on Map Reduce Clusters.In:Saygin Y,Yu JX,Kargupta H,Wang W,Ranka S,Yu PS,Wu XD,eds.Proc.of the ICDM Workshop[M].Washington:IEEE Computer Society,2009:296-301.

[10]Zhang SB,Han JZ,Liu ZY,et al.Accelerating Map Reduce with Distributed Memory Cache.In:Huang XX,ed.Proc.of the ICPADS[M].Shenzhen:IEEE Press,2009:472-478.

性能计算篇8

计算机的硬件系统中, 主要包括主板、CPU、芯片组、内存等部件。

1.1 主板硬件。

主板硬件是组成计算机系统的主要部分, 计算机的主板在计算机中就相当于人类的大脑, 是指挥计算机各个部件有序执行功能的部件。计算机中的主板硬件是计算机系统功能能够顺利运行的保障, 也有利于对计算机系统的日常维护工作的进行。主板硬件在各种计算机中并不是通用的, 而显示器、声卡、键盘、鼠标等在各种计算机系统中基本可以通用。主板芯片包括两种, 分别为数字芯片以及模拟芯片。其中数字芯片在主板硬件中占主要部分。

1.2 CPU。

CPU是计算机系统的中央处理器, 与计算机的主板一样, 也是计算机的核心部件, 在计算机系统中是最高级的执行单位。CPU在计算机系统中负责着整个系统对指令的执行, 负责系统中所发出的数学运算指令或是逻辑运算指令, 还可以对数据进行存储和传送, 另外, 还可以控制计算机系统对内或是对外的输入与输出。CPU负责计算机的指令的执行以及对数据的处理, 同时也直接关系到计算机对指令执行和数据处理的速度。不同性能的CPU的执行功能和处理数据的速度就不同。

1.3 芯片组。

芯片组在计算机系统中就表现为一块集成的电路板, 上面布满了元件。所以芯片组上集合了计算机内部的元件、功能和接脚比较多的芯片。上世纪的计算机系统中的主板硬件是由很多TTL芯片和LSI芯片组成的, 故而在一块大的主板上有上百个芯片元件, 这也导致其生产过程非常繁琐, 耗时多并且成本比较高。近年来, 在计算机的生产过程中, 将以前的上百个芯片元件都进行浓缩, 使之成为五块较大的芯片组以及几块TTL芯片组成的小主板。这种生产方式会将很多个芯片电路都放置于一个空间非常狭窄的芯片中, 所以一旦对材质和技术的掌握程度不足, 就会使得芯片组运行不稳定, 出现高频干扰和特性匹配等问题。

1.4 内存。

内存是一个用来存储的部件, 主要存储CPU和一些外围设备。对于计算机的存储系统而言, 内存的存储分为两种, 分别为永久性和临时性。所谓永久性, 就是将一些数据存储在内存空间中, 如果不进行人为的删除是一直存在的。所谓临时性, 就是在系统进行数据运算或逻辑运算时, 有一些数据临时存放在内存空间中, 在运行完毕之后就自动删除。计算机内存的大小决定着存储数据的功能和作用, 同时也决定着系统中数据传输的速度。

2 计算机硬件组成的介绍

中央处理器 (CPU) 内存访问的时间和速度都与CPU的规格和型号相关联。比如ROM, 其27010-20和27010-15两种不同的型号, 其传输数据的速度就不相同。RAM传输数据的速度相比于ROM而言是比较快的, 且RAM也存在不同的型号, 比如411000-7和411000-6这两种型号也具有不同的传输速度。

计算机的内存也可以分为以下几类:

2.1 常规内存。

常规内存在内存分布表中位置最靠前, 其位地址为000000H———109FFFFH, 即0KB到640KB的地址, 其容量为640KB。其位置靠前且是DOS管理的内存区, 故而其为低DOS内存。

2.2 高位内存。

高位内存相对于低DOS内存, 是比较高位的位置, 其位于常规内存的上一层。高位内存是在640KB———1024KB的位置。

2.3 高端内存区。

高端内存区是高位内存的上一层, 其内存容量只有64KB, 其地址为100000H———10FFEFH, 位于1024KB———1088KB, 在CPU寻址时, 是采用段地址偏移量的方式来寻址的, 并且高端内存区寻址的最大逻辑内存空间为10FFEFH。

2.4 EMB。

EMB即为扩展内存, 是对计算机系统内部的内存进行扩展部件。扩展内存就是1MB上方的内存空间, 其位地址为100000H———, 且由CPU的寻址能力来决定扩展内存的大小。

3 硬件与性能的关系

硬件的性能是由硬件的几个指标综合衡量的, 并不只是根据硬件的运行速度等单一衡量标准来衡量。以光驱为例, 并非是CD-ROM光驱的运行速度快就代表光驱的性能好, 因为CD-ROM光驱的运行速度是由光区内的驱动电机转速决定的, 其运行速度快只能说明驱动电气的转速较快, 并不能衡量CD-ROM光驱的性能。对CD-ROM的性能进行综合衡量, 需要从以下三个方面来进行综合评定。

其一, 数据传输速率。无论是计算机内的哪一个硬件, 都需要进行数据的传输, 所以数据的传输速率是衡量CD-ROM光驱的基本指标。所谓数据传输速率, 就是在1S内, CD-ROM能够读取的最大数据量。其单速的CD-ROM光驱数据传输速率为150KBps, 倍速的CD-ROM光驱数据传输速率为300KBps, 四倍速的CD-ROM光驱数据传输速率为600KBps, 八倍速的CD-ROM光驱数据传输速率为1200KBps。

其二, 平均访问时间。平均访问时间也称为平均寻道时间, 是CD-ROM光驱在读取数据时, 激光头的位置移动到指定位置并读取此位置数据所需的时间, 这也就反应了CD-ROM光驱的运行速度。其三, CPU使用率。CPU使用率是指CD-ROM光驱在一定的数据传输速率下占用CPU的时间。

所以对CD-ROM光驱的性能需要综合以上三个评定指标来进行衡量, 而其品牌、格式等因素都应该在以上三个元素之后进行考虑。同理, 计算机中的其他硬件的性能也都应该是在多个指标的共同评定下来衡量。

4 硬件对计算机使用的影响

由于3D显示卡相比于2D显示卡而言, 图像生成的速度比较慢, 所以对3D显示卡的技术指标主要有三个, 分别为AGP纹理、三角形生成数量、像素填充率和纹理贴图量。其中, 在系统内存在64MB容量以上, 由系统内存弥补显卡处理纹理贴图需要的显存容量就称为AGP纹理。而每一秒中可以生成或处理的三角形数量就是三角形的生成数量, 这一指标就体现出3D模型的分辨率大小。对于3D显示卡而言, 像素填充率就影响着3D显卡运行的显示速度。

结束语

对于计算机而言, 计算机的硬件的参数会直接影响到计算机系统的运行。而随着时间的推移, 人们对计算机的使用性能要求越来越高, 所以需要给计算机配置比较合适的硬件来提升计算机的使用性能。

参考文献

[1]杨佐勇.计算机硬件性能对计算机使用的影响[J].计算机光盘软件与应用, 2012 (3) :88-92.

沥青-集料黏附性能简化计算模型篇9

1 数字图像的采集

在自然光线下使用数码相机采集沥青-集料黏附性能试验试样, 进行图像处理时易出现下列问题: (1) 难以区分深色集料与集料上裹覆沥青之间的边界 (图1黄色部分) ; (2) 在水中的沥青会产生光的反射产生亮斑 (图1蓝色部分) ; (3) 侧向光对试样照射产生的阴影会被误划分为集料部分 (图1红色部分) 。这些问题都会导致试验结果产生误差。

为解决上述问题, 引入了光的反射及成像原理[2]。相对于沥青, 集料表面光感粗糙, 表面的变化在波长上比沥青大几个数量级。在散射的自然光照射条件下无论是沥青表面镜面反射还是集料表面漫反射, 二者的反射光线都是杂乱无章, 如图2所示。因此获取的图片上, 沥青与集料的亮度差异较小, 计算机难以准确区分。但如果采用小光谱带宽并具有定向性的照明光源, 粗糙的集料表面发生的漫反射的反射光线会发散到各个方向, 而光滑的沥青表面发生的镜面反射的光线都是朝同一个方向反射, 此种情况下沥青与集料的反射率差异较大, 选取合适的角度采集图像, 能够成功将沥青与集料区别开。

基于上述理论, 采用定向光源, 设计了一种自动图像采集系统[3]。采集到的黏附试验试样图像上有三种不同的颜色, 即黑色 (沥青面积) 、红色 (集料面积) 、橙色 (背景部分) 。采用Image Pro-plus软件计算出不同颜色区域的面积, 就可得到集料表面剩余的沥青面积占整个集料表面的百分比即沥青-集料黏附性能。

2 数字图像处理

2.1 数字图像采集误差

由于数码相机获得的照片是二维平面图形, 在自动测量系统中拍照成像时最能反映真实颜色的面是与镜头平行的面。而裹附沥青的集料是一个三维实体, 这就可能造成人眼能够观察到的集料侧面上裹附的沥青不能真实地呈现在图像上。如图3所示, (a) 为从集料正上方采集的图像, 从图像可以看出集料的四周均未裹附沥青, (b) 为从集料侧面采集的图像, 从图像可以看出集料的侧面仍裹附沥青。在成像过程中, 考虑光线的强度、色彩的对比度, 需要从试样的正上方采集图像;在这种情况下使用Image Pro-plus软件对图片上的黑色部分 (沥青) 进行勾选时, 在图像上选出的沥青部分少于真实的沥青部分, 这样会产生较大的误差。

樊亮等人[4]用图像分析法进行沥青剥落面积定量化研究时也发现类似的问题, 他建议使用平面型的集料进行分析。但扁平状的集料不宜作为筑路材料;且路面实际使用的集料大多都为立体型集料, 在图像采集过程中为保证集料摆放平稳, 也容易使得集料表面较扁平的一面朝下放置。为解决二维图像不能够完全表达三维物体的真实情况的问题, 本文提出一个简化模型及修正系数, 以减少数据处理误差。

2.2 模型的选择

考虑试样的实际情况以及为了计算简便, 将所有摆放的集料试样简化等效为一个四棱台体。简化模型的俯视和立面图如图4所示, 其中黑色部分为与镜头平行的集料表面部分, 此部分集料表面裹附的沥青可很好地呈现在数字图像中;红色部分为集料的侧面, 其表面裹附的沥青由于拍摄角度问题在图像中难以呈现。理论上根据软件分析得到的沥青面积与集料面积的比值就可得到集料表面沥青残留率, 但由于光线的问题, 无法获取图3中红色部分 (即集料侧面的) 上的沥青。因此引入一个修正系数ki, 将观测到的集料总面积SAi=ai2转换为集料有效面积

随着黏附性试验时间的增加, 每隔一段时间, 试样被取出拍照以计算沥青的残留率。在每次在摆放过程中, 集料的底面可能会略有不同, 造成不同时段集料总面积SAi及有效面积S'Ai略有变化。不论试样何时取出, 其体积V不变;为计算简便, 假设等效的正棱台体高度h不变。

已知正棱台体体积V为

将修正系数ki代入式 (1) 得

式中, m为集料的总质量 (g) ;ρ为集料的表观密度 (g/cm3) ;PAi为i时段集料的像素点数与整个图片的像素点数之比;PBi为i时段沥青的像素点数与整个图片的像素点数之比;Ri为i时段集料表面的沥青残留率 (%) 。

对于0 h的黏附性试样, 集料表面完全由沥青所覆盖, 由软件从照片中分析出的沥青与集料的总面积比值即为。此时集料的有效面积内全部为沥青, 沥青残留率R0为100%, 。根据公式 (2) , 可获得假设模型的体积及高度。当黏附性试验进展i h, 使用图像处理软件从试样的数字图像中可算得PAi、PBi, 通过采集图片中固定长度参照物的像素值, 可获得SAi及ai, 根据公式 (1) 可求得对应i小时的a'i, 根据式 (2) 、式 (3) 从而推算出ki及Ri。

2.3 模型在黏附性试验中的运用

黏附性试验采用一种玄武岩, 取三组平行试样, 其中一组试样所用的集料质量m=102.33 g, 表观密度ρ=2.921 g/cm3。在黏附性试验开始时 (0 h) 以及以后的每0.5 h (0.5 h, 1.0 h, 1.5 h, 2.0 h, 2.5 h) 这6个时间点试样进行图像采集。

以2.5 h沥青在集料表面残留率计算为例, 利用Image Pro-plus软件对0 h以及2.5 h采集的试样图片进行处理, 获得图像处理数据见表1。根据0 h采集图像处理数据可以计算出该时段集料总面积SA0与有效面积S'A0的比值k0=3.098。由式 (1) 、式 (2) 可得简化等效的四棱台体高度h=0.768 cm。由于假设四棱台体高度随时间不发生变化, 因此依据0 h算得的高度h, 2.5 h采集图像处理数据获得SA2.5=76.71 cm2及a2.5=8.759 cm, 以及式 (1) 、式 (2) 可得a'2.5=4.526 cm, k2.5=3.745, 最终可算得2.5 h集料表面的沥青残留率R2.5=61.85%。

按照上述的方法, 获得不同时段集料表面沥青残留度平均值见表2。从结果可以看出, 通过简化模型的计算, 减少了图像处理带来的误差, 并能较好区分不同时段沥青-集料黏附性能。

3 结论

为减少人为观测对黏附性试验结果造成的主观误差, 引入数字图像处理技术。但由于物体成像的缺陷, 造成集料侧表面沥青不易反映在试验结果内。因此将集料简化为一四棱台体, 引入一修正系数, 只考虑四棱台体上底面的沥青残留量, 即与相机平行集料表面的残留沥青。通过这种简化模型计算方法, 能快速计算出不同时段沥青-集料粘附性能, 有效地减小了由于集料侧面表面沥青不能在图像上反映所带来的误差。

参考文献

[1] 袁峻, 董文姣, 钱武彬, 等.基于超声波的沥青-集料黏附性试验方法研究.科学技术与工程, 2013;13 (5) :1388—1391Yuan Jun, Dong Wenjiao, Qian Wubin, et al.Research on test method of asphalt-aggregate adhesion based on ultrasonic.Science Technology and Engineering, 2013;13 (5) :1388—1391

[2] 黄冰峰.物体表面反射特性测定方法的研究.武汉:华中科技大学, 2007Huang Bingfeng.Research on methods of measuring reflection characteristic of surface.Wuhan:Huazhong University of Science and Technology, 2007

[3] 袁峻, 董文姣, 陈佳俊, 等.沥青与集料之间黏附性的自动测量系统.中国专利:ZL 2013 2 0272756.2, 2013-10-30Yuan Jun, Dong Wenjiao, Chen Jiajun, et al.An automatic measurement system of affinity between bitumen and aggregate.China Patent:ZL 2013 2 0272756.2, 2013-10-30

学校计算机网络性能的优化篇10

现今社会, 信息技术飞速发展, 每个人的生活都已经离不开网络, 特别是院校都建立了各自的局域网。网络视频教学、网上购物、网络交易、网络办公等变得流行。网络管理员只有深入地了解网络的使用情况和性能瓶颈、可能存在的网络安全问题以及各种网络性能和安全措施, 才能使网络以最佳状态运行。网络性能优化的目的是减少网络系统的瓶颈, 设法提高网络系统的运行效率。对于不同的网络硬件和软件环境, 可以存在不同的优化方法和内容。

1 学校计算机网络的构成

学校计算机网络一般由以下两大部分组成。

(1) 计算机。这是学校计算机网络的主体。计算机可分为服务器、工作站两大部分, 服务器是一台高性能计算机, 用于网络管理、运行应用程序、处理各网络工作站成员的信息请示等。根据作用不同, 学校网络服务器可分为代理服务器、校园网服务器、教学服务器等。工作站也称客户机, 是接入学校网络最多的用户使用设备, 在典型的客户机/服务器网络中, 用户通过客户机登录进入网络后, 再使用网络中各种共享资源的, 同时, 用户也可以通过客户机与其他用户进行相互通信, 客户机性能一般低于服务器。学校客户机一般分为学生用机和教职工用机。

(2) 数据通信链路。用于数据传输的双绞线、同轴电缆、光缆以及为了有效而正确可靠地传输数据所必须的各种通信控制设备, 如网卡、交换机、路由器、防火墙等。它们构成了计算机与通信设备、计算机与计算机之间的数据通信链路。计算机网络本质是一种数据通信系统, 各种网络应用都是在数据通信的基础上实现的。因此, 网络的性能与数据通信链路的结构和速度是密切相关。

2 计算机的优化

我们在使用电脑过程中, 安装好系统时感觉电脑运行速度比较快, 使用一段时间后, 就会觉得电脑运行速度变得慢了。保持系统可靠、安全、高效地运行, 必须使用电脑系统处于最优化状态。所以, 优化电脑, 让电脑性能更佳, 效率更好已经是一种时代的潮流, 成为现代人的追求。

2.1 内存的优化

内存是操作系统中的重要资源, 不仅操作系统的运行需要它, 而且各种应用程序和服务都需要调用它才能使用。从应用的角度来看, 内存使用不合理是引起各种系统问题的重要原因, 是需要用户和管理员着重考虑的优化对象。

2.1.1 合理使用内存

在内存一定的情况下, 合理地使用内存可以提高计算机网络的性能。这要求管理员必须对系统中的内存使用情况非常了解, 对于那些不再需要的功能、应用程序或服务应及时关闭, 以便释放内存给其他应用程序和服务。另外, 管理员还可以通过系统设置来决定内存的主要优化对象。服务器的主要优化对象应该是后台服务, 而客户机的主要优化对象应该是前台应用程序

要选择内存优化的主要对象, 可执行下面的操作步骤:1打开“控制面板”窗口, 双击“系统”图标, 打开“系统属性”对话框。2单击“高级”标签, 单击“性能”选项中的“设置”按钮, 打开“系统属性”对话框。3单击“高级”标签, 单击“内存使用”选项中, 客户机选择“应用程序”;服务器选择“系统缓存”单选按钮;4单击“确定”按钮。

2.1.2 设置虚拟内存

所谓虚拟内存, 就是系统把硬盘空间当作额外的内存来使用。因为通过使用磁盘空间, 操作系统给进程分配比实际可用内存更多的内存。虚拟内存通常称为页面文件。在系统安装过程中创建的虚拟内存页面的默认大小是计算机上RAM容量大小的1.5倍。

2.2 CPU的优化

对于CPU优化主要考虑CPU的速度、缓存技术和多处理器技术。从整个网络考虑, 对于CPU的优化除了速度问题, 还需要考虑缓存和多处理器支持技术, 特别是服务器多处理器支持对于网络的整体性能的提高非常重要。

2.2.1 缓存技术

目前使用的CPU都具有一个所谓的二级缓冲存储器 (二级缓存) , 主要用来保存CPU最近使用过的数据, 为一级缓存传送数据提供方便。CPU访问缓存的速度远远快于访问RAM的速度。用户在选购CPU时, 特别是服务器, 一定要选择具有大缓存的CPU。

2.2.2 多处理器支持

多处理器技术就是在一台计算机系统中安装多个CPU, 并协同处理数据的方法。大家都知道, 一个CPU一次只能执行一条指令, 多个CPU的使用必将提高数据处理速度。不过, 要实现多处理器技术需要支持多处理器安装的主板和操作系统, 所以在选购服务器, 考虑选择多处理器的服务器。

2.2.3 硬盘的优化

现在的硬盘容量越来越大、速度越来越高, 就是说盘片的密度越来越高, 转速越来越快了, 这使本来就十分娇贵的硬盘更加脆弱了。通过系统对硬盘进行一些优化, 不仅可以大幅度地提高硬盘的性能, 而且对于延长硬盘的使用寿命也有一定的效果。

(1) 打开硬盘的DMA传输模式

打开硬盘的DMA (直接存储器存取) 传输模式不仅能提高传输速率 (读写硬盘时一般不会先响上一阵子了) , 而且还会降低硬盘读写时对CPU时间的占用。整个系统的效率也就得以提高了。

(2) 设置适当的磁盘缓存

磁盘缓存的大小会直接影响几乎所有软件 (系统软件或应用软件) 的运行速度和性能。在默认状态下, 是由WINDOWS自己管理的, 它通常很保守, 不启用磁盘缓存, 因此硬盘性能不能得到充分的发挥。所以我们可以自己动手来设置磁盘缓存, 以提高硬盘性能。操作方法是: (1) 打开注册表编辑器 (单击“开始”菜单中的“运行”, 输入regedit并单击“确定”按钮) (2) 寻找“HKEY_LOCAL_MACHINE/SYSTEM/CurrentControlSet/Control/SessionManager/MemoryManagement”项下的“IoPageLockLimit”值, 如果没有, 就建立该值。操作方如下:1展开各项直到Memory Management项;2在MemoryManagement项上单击鼠标右键, 从快捷菜单选择“新建/DWORD值” (此时, 在Memory Management项中建立了一个名为“新值 #1”的DWORD类型的值) , 将“新值 #1”改为“IoPageLockLimit”; (3) 打开“IoPageLockLimit”的快捷菜单, 并从中选择“修改” (打开“编辑DWORD值”对话框) ; (4) 在“编辑DWORD值”对话框中, 选中“十进制”单选按钮, 并在“数值数据”输入框中输入磁盘缓存的大小 (单位为KB) , 为推荐设置值为8000000 (即128MB) ; (5) 单击“确定”按钮。设置完成后重新启动电脑。经过这样的设置, 再进行磁盘读写比较频繁的操作时, 您可以感到硬盘灯的闪动频率比以前明显下降了 (即硬盘读写的频率降低) , 比如, 使用BT下载的时候大文件时, 会有较为明显的感觉。

(3) 合理划分和使用硬盘分区

我们都知道硬盘是以一个整圆环为一个磁道, 一个磁道上有若干个扇区, 所以我们不难看出, 越靠外的磁道上的单个扇区其体积越大, 换句话就是其密度越小, 由于硬盘是机械传动, 所以磁头对其的寻找、读、写速度也就越快, 分区的分布也是从外圈向内圈的, 所以C盘相对于D盘等要靠外, 从机械的传动方面看, 就能理解为什么我们感觉C盘比D、E等分区要快的原因。明白了上面的知识, 我们就能合理使用硬盘了!以一块容量为500GB的新硬盘为例进行说明:把C盘 (系统盘) 分为30GB-50GB (据操作系统而定) , 把D盘 (程序盘) 调成100GB, 把E盘 (文件盘) 设为100GB, 把F盘 (娱乐盘) 设为100GB, 把G盘 (备份盘) 设为150GB。对于学生机, 把操作系统及常用的应用软件装在C盘上。对于服务器来说, 操作系统安装在C盘上, 应用程序安装在D盘。

(4) 系统的优化

安装好系统后, 首先使用360安全卫士对系统进行一系列的优化处理。比如系统漏洞的修复;木马病毒的扫描清除;桌面菜单优化;文件系统优化;网络系统优化;开机速度优化;系统安全优化;后台服务优化;注册表清理;垃圾文件清理等。其次关闭不必要的插件和启动项。最后, 对于学生用机, 关闭系统和软件的更新功能, 否则网络一开放所有电脑同一时间进行更新, 系统出现假死, 网络出现卡爆。学生机一般设置自动还原, 更新没有意义。

(5) 安装还原精灵。保护硬盘免受病毒侵害, 重新恢复删除或覆盖的文件, 彻底清除安装失败的程序, 并避免由于系统死机带来的数据丢失及磁盘碎片太多等问题。对于学生用机, 除学生资料盘外, 其它硬盘分区设置为自动还原功能, 这样每次启动电脑后, 还电脑一个全新的系统。

3 数据通信链路的优化

3.1 网卡的优化

网卡性能的调整和优化对一个网络来说也是非常重要的, 不仅涉及到网络数据的进出问题, 而且关系到整个网络的服务、设备和布线等网络构成问题。选择高性能的网卡和驱动程序, 并配置好网络服务和协议, 可以大大提高网络的传输速率和稳定性。对于工作站, 应选择10Mb/s或100Mb/s的网卡, 对于服务器应选择100Mb/s或1000Mb/s的网卡。如果经济条件允许, 可以选择一些专门为服务器设计的网卡, 它们能够最大限度地降低对服务器CPU的占用率, 优化服务器的性能。系统默认的驱动程序都是些简化程序, 而且版本比较低, 只能驱动网卡, 不能保证网卡发挥最佳性能。建议为网卡安装专门的驱动程序或最新的驱动程序。服务和协议的设置, 在为网卡设置服务组件时, 根据情况选择要使用的网络组件, 不可一味地将所有的网络组件都添加到系统中, 否则会严重影响网络的性能。因为这些网络组件在系统启动时都会自动加载, 不但占用大量的系统资源, 而且会对网络的正常通信产生干扰。

3.2 共享Internet上网的优化

路由器共享Internet上网, 对于家庭和几个员工的单位来说是最好的选择, 但对于学校来说, 是不可取的。因为的网络教学中都是以班级为单位的, 上网的内容绝大部分是一样的, 所以采用代理服务器共享Internet上网是最佳选择。代理服务器软件 (proxy sever software) 安装在Internet网络节点上, 它可以极大地、极有效地缓存Internet网上资源, 这样就可以大大提高访问速度, 尤其是对那些冗长、庞大的主页, 更立杆见影, 效率倍增, 同时也减少出口负载, 减少了出口流量, 降低了成本, 提高了经济效益。

3.3 网络拓朴结构的优化

不少网络用户及管理员, 在增加节点时, 总是图方便, 加上一个几口的交换机或者路由器来解决问题。这个办公室加一个交换机, 那个办公室加一路由器, 使得网络中的链路变得越来越庞大和复杂, 从而降低了网络的性能。

总之, 只有对学校计算机网络的性能进行优化, 才能使网络的性能发挥到最大程度, 使网络以最佳状态运行。

摘要：随着计算机网络的发展, 学校使用计算机网络进行教学和办公也变得越来越普遍。如何优化学校计算机网络性能, 保证网络能够可靠、安全、高效地运行, 是网络管理员普遍关注的一个问题。本文主要从学校计算机网络的构成出发, 讲述了网络性能优化的一些做法, 希望对读者有所裨益。

关键词：计算机网络,性能,优化

参考文献

[1]局域网组网技术与实训/张蒲生编著, —北京:清华大学出版社, 2006.9

企业计算机网络性能的优化篇11

关键词：计算机网络；性能优化；优化技术；优化手段

中图分类号：TP393.0 文献标识码：A 文章编号：1674-7712 （2013） 24-0000-01

随着网络技术的不断发展，企业中对网络性能的要求也越来越高，然而当前的网络带宽不足，延时较大，冗余性小等都对网络的性能造成了一定的局限性。企业规模和企业现代化发展的需要，对网络性能提出了一定的要求。企业中网络数据量的增长速度越来越快，这就迫切需要改进企业计算机的网络性能。

一、网络性能优化技术

（一）QOS路由策略

QOS是通过对丢包率、专用宽带的改进，延迟的控制，来为网络提供更高优先服务的能力。主要的目的在于对Internet应用提供服务区分和性能保证，属于一种网络的优化机制。服务区分是指利用不同的服务来满足不同的应用需求。性能保证是指对影响网络质量的因素：宽带抖动、丢失、延迟等进行改进。

（二）HSRP

HSRP全称是Hot Standby Routing Protocol，中文名称为热备份路由协议。热备份路由协议的主要作用是对数台路由器进行备份。当路由器处于工作不正常状态的时候，可以利用候补的路由器将当前使用的路由器进行替换，这个过程往往不影响人们的正常使用。因此，热备份路由协议能够解决默认路由出现问题，具有容错备份的功能，对保证网络服务的正常使用具有重要的作用。

（三）SDH

SDH全称Synehronous Digital Hierarchy，中文名称为同步数字体系。中文同步数字体系的主要作用是对接口码型、复用方式、传输速度等级、数字信号的帧结构进行规定。中文同步数字体系可以应用于微波、卫星传输，对于宽带大，传输速度快的网络也普遍适用，可以很好的促进网络的管理功能。

二、网络优化手段

（一）数据流传输中优先级设计

在企业网络中，根据重要程度和保密要求的不同，可以对数据流进行不同的优先级设置。对于烟草企业来说，财务服务器和资金管理服务器是比较重要的，因为烟草企业往往涉及到的资金金额巨大，必须引起高度的重视，同时涉及到企业的机密，因此应该设置最高的优先级。针对生产经营和行政应用系统方面的数据流优先级的设置可以稍微低一点，这样保证资金和财务数据流的实时性。

（二）优化服务器的硬盘设置

在网络时代，对于烟草企业来说也会经常使用网络进行文件的访问和材料的打印，因为网络性能的原因可能会出现不正常的情况。企业内部局域网服务器硬盘配置的好坏是影响网络性能的一个关键因素。通常在设置局域网服务器硬盘时应该考虑以下因素：硬盘的容量应该尽可能的大，转速应该尽可能的快。服务器的硬盘接口最好是SCSI型的。该接口是通过并行传输模式来接收和发送数据的。可以适当的给服务器安装硬盘阵列卡，提升安全性和读写性。不要将低速设备与硬盘公用。

（三）优化接地要求

企业计算机网络往往都采用内部网络，就是局域网，局域网的信号往往都是弱信号，如果网络设备的接入有问题或者操作不当，就会导致网络不通的现象，尤其是一些网络转接设备，涉及到远程线路，接地要求不合格，就会造成数据包丢失等问题。因此在优化接地要求对于网络设备的使用是非常重要的。

（四）优化网卡的使用

在企业中，内部机器之间经常会进行通讯，内部机器之间无法通讯也是最容易发生的故障，这些故障往往与网卡有关。如网卡经受不了大数据的冲击而报废，网卡老化无法被计算机正常识别，网卡的网络线接触不良，网络没有正确安装等问题都会导致网卡无法正常使用，内部网络之间不能访问。为了预防这种事件的发生，在选购网卡的时候，首先要了解各种网卡的性能，如果是安装在服务器的网卡就需要购买质量较好的网卡，只有经过多次比较分析，才能让网卡得到合理的利用。

（五）优化“桥”式设备的使用

用于同一网段的网络设备就是“桥”式设备，用于不同区段的网络设备是路由器。一套微波联网设备，连接之后，上网调试，提示网段号不正确，将网段号修改后，提示消失，说明这套设备属于桥式设备。正确区分桥式设备和路由设备，优化桥式设备的使用，对于网络参数的设置方面是非常重要的。

（六）优化交换机的设置

在企业局域网中，交换机是一种重要的数据交换设备。改善网络中的数据传输性能，交换机设置的好坏是非常关键的。如果在服务器上安装了型号为Intel 100 MEISA的网卡，交换机的端口配置为100M全双工，此时一切情况正常，然而当遇到大流量的数据传输时，网络速度就会变得非常缓慢，因为这款网卡并不支持全双工。将交换机的端口改为半双工以后，就不会出现这些问题了。因此在进行网络设备的参数设置时，应该根据工作站或者服务器上的网络参数，尽可能确保每个设备都可以匹配的运作。

（七）优化线路的连接

在企业内部，计算机之间的网络连接都是使用双绞线来进行连接的，然而并不是简单的连接就可以实现局域网内部网络的通信，必须按照一定的规则，优化线路的连接才能够保证网络性能的优化。如果相距100米以上的两台计算机使用双绞线进行连接，是不可能接通的，必须利用一些中转设备。因此企业计算机网络性能的好坏与线路的连接也有非常大的关系，必须优化计算机之间线路的连接。

三、结束语

本文主要介绍了企业计算机网络性能的优化，通过对网络性能优化技术和网络优化手段的介绍，展示企业计算机网络性能的一些方法。

参考文献：

[1]翟鸿雁.广域网网络应用及业务性能优化的探析[J].硅谷，2011（04）.

[2]宋亚辉，李在铭.局域网络时钟同步技术综述[J].仪器仪表学报，2009（52）.

[3]陈鹏，吴跃，曾家智，龚海刚.网络层数据传输新方式研究[J].计算机应用，2009.

失速翼型气动性能及噪声特性计算篇12

在翼型表面过渡流动模拟计算工作中,计算结果多数不理想。David Hartwanger等[4]使用X-Foil和ANSYS CFX 2D分析了NREL S809翼型,采用高级湍流过渡模型,总体结果较吻合,在最大升力和失速流动时结果失真。Vance Dippold[5]研究了不同的近壁面流动模型,发现二方程湍流模型在预测稳定流动时效果不错,当流动出现反向压力梯度时SST模型预测结果更准确。S. Sarada等[6]采用K-E模型对二维和三维NACA 64618翼型计算分析,发现失速条件下三维NACA翼型预测结果合理。

采用内外域相结合的网格划分方法,利用K-w SST模型和S-A湍流模型预测NACA0063翼型流动,特别是层流到湍流过渡状态,并与风洞实验数据比对,验证方法的可行性并预测失速特性。

1 数学模型

1. 1 流体计算模型

翼型流动模拟是求解质量守恒和动量守恒方程。有限体积方法将流动控制方程离散为代数方程求解。湍流流动模拟使用K-w SST模型和S-A模型预测边界层过渡。

控制方程

式( 1) 中u1,u2,u3流体速度,ρ为密度,p为压力,μ为黏性系数,τxx,τyy,τzz为法向应力。

剪切应力

1. 2 噪声计算模型

噪声计算采用FW-H[6]计算模型,控制方程为

式( 5) 中,ui为x方向流体速度分量,un为流体速度表面法向分量,vi为x方向面速度分量,vn为法向面速度分量,p为远场声压,a为远场声速,Tij、pij分别为希尔和压应力张量,H( f) 为亥维赛函数,δ( f) 为狄拉克δ函数。

2 网格生成及无关性检验

计算翼型攻角α = - 15° ~ 18° ,由于计算攻角范围较大,在计算不同攻角下的流动时常规的方法是改变来流方向设置,此方法只能在小攻角变化且远场边界足够大时可行。而针对单个计算攻角划分网格,工作量巨大且繁琐。为减小工作量,节省时间,网格划分采用script脚本语言批处理划分。计算求解同样采用批处理计算。

几何模型如图1所示。为便于计算,同时保证翼型表面流动重点区域网格一致,计算域分内部计算域和外部计算域,内部计算域为圆形,当攻角改变时,旋转内部计算域,内外域之间按交界面处理。内部计算域要足够大,减小网格变化对流动的影响,本例中取10倍弦长。由图3压力云图可以看出,交界面处内域和外域无压力波动,说明划分方法可行。

流体流过翼型表面,小攻角时,边界层的分离在后缘开始,随着攻角的增加,分离点前移,发生失速。如果边界层从翼型前缘开始,整个边界层分离几乎同时发生,湍流运动加剧。k-w SST模型和S-A模型对壁面边界层处的流动模拟需要高分辨率的网格。具体CFD计算中需要子边界层的Yplus小于5。求解计算需要检验网格的无关性,以减小由于网格因素对计算结果的影响。

攻角8度时实验升力系数Cl= 1. 282,表1可以看出,网格数在49 120时满足无关性要求。

3 边界条件

查阅文献,并结合本实例,经计算确定外流场边界为20倍弦长。入口速度为v = 44. 5 m/s,雷诺数3×106,常温下空气密度ρ = 1. 225 kg /m3,黏性系数μ = 1. 789 4×10-5kg / ms。网格采用全六面体结构化网格。

4 模拟结果分析

表2为两种湍流模型计算及实验的升力系数和阻力系数。通过比较不同攻角下升力系数和阻力系数,发现k-w模型预测结果与实验值相近,特别是在失速发生时。

图4、图5为升力系数和阻力系数随攻角的变化。可以看出,升力系数在攻角 - 12° ~ 18°范围内, k-w SST模型计算结果与实验值相吻合,特别是发生失速时,吻合度较高。而阻力系数较升力系数,模拟结果与实验值偏差较大。由图6升阻比随攻角变化曲线也可以看出,k-w SST模型计算结果较S-A模型相比,更接近实验值。

图7( a) 、( b) 为8°攻角时翼型的速度图和压力图。最大速度发生在前缘上表面,最大速度为69. 2 m / s,相对应的最大压力发生在前缘下表面,达到1 230. 7 Pa。

图7( c) 、( d) 为发生失速后,翼型表面的速度向量和压力轮廓图。可以看出,失速时翼型前缘最大速度达到100 m/s,在翼型尾缘形成漩涡。失速发生后,翼型前缘下表面最大压力扩散,范围增大。

图8为基于FW-H声学模型计算得到的翼型噪声功率图。由图可以看出,大攻角时噪声功率高,产生噪声的区域大。由图8( c) 、( d) 比较看出,大攻角时,产生噪声的源点更接近前缘点。图9为翼型表面噪声功率曲线图,由图中可以看出,大攻角时, 接近翼型前缘和尾缘的噪声功率高,相反,翼型中间表面噪声功率反而小。

5 结论

采用商用CFD软件模拟翼型NACA0063的不可压缩流动模拟,提出了内外域批处理划分网格计算的新方法。利用此方法,采用k-w SST模型和S-A模型,预测翼型表面的升力系数和阻力系数,并与风洞实验数据对比,发现k-w SST模型在预测流动升力和阻力系数,特别是层流到湍流的过渡区,更接近实际值。

参考文献

[1] 马林静,陈江,杜刚,等.风力机翼型气动特性数值模拟.太阳能学报,2010;(02):203—209Ma Linjing,Chen Jiang,Du Gang,et al.Numerical simulation of aerodynammic performance for wind turbine airfoils.Acta Energiae Solaris Sinca,2010;(02):203—209

[2] 张鹏,叶舟.小攻角下翼型边界层分离对数值模拟结果的影响研究.能源研究与信息,2009;(04):240—244Zhang Peng,Ye Zhou.Influence of boundary-layer separation of aerofoil under small angle of attack on the numerical simulation.Energy Research and Information,2009;(04):240—244

[3] Abbott I H.Theory of wing section,including a summary of airfoil data.Dover Book on Physics,1995

[4] Hartwanger D,Dr Andrej H.3 D modeling of a wind turbine using CFD.NAFEMS Conference,United Kingdom,2008

[5] Dippold V,III.Investigation of wall function and turbulence model performance within the wind code.43rd AIAA Aerospace Sciences Meeting and Exhibit,Reno,Nevada,2005

【性能计算】推荐阅读：

调度性能07-15

气动性能07-15

电梯性能07-17

高原性能07-20

吸音性能07-22

空间性能10-13

>> 查看更多相关文档