安全ID

2024-08-22

安全ID(共9篇)

安全ID 篇1

根据近日发布的一项研究, 谷歌的安卓操作系统可能存在安全漏洞, 这将使得黑客可以冒充被信任的应用程序并潜在的窃取你的手机或平板电脑信息。本质问题在于安卓检查——或者确切来说是不检查——某些应用程序真实性的方式, 因此这一漏洞也获得了一个醒目的名字——“假ID”, 做公司移动数据保护的隐形公司Bluebox Security这样说道。

验证身份是在线网络最重要的问题之一, 登陆某银行账户的人是否就是账户所有者?总部位于旧金山的Bluebox公司主要是帮助公司保护移动设备上的数据, 公司员工也在调查和理解Bluebox所基于的移动操作系统构架, 公司首席技术官杰夫·佛利斯塔尔 (Jeff Forristal) 这样表示。

每一个安卓应用程序都有自己的数字签名, 本质上来说就是一张ID卡。例如Adobe系统在安卓系统上有一个特殊的签名, 所有Adobe的程序都有基于这一签名的ID。Bluebox公司发现, 当一个应用程序闪射一个Adobe ID, 安卓并不会与Adobe核查这是否是真实的ID。这意味着一个恶意用户可以基于Adobe的签名创造一个恶意软件并植入你的系统。

这个问题并不只是Adobe系统特有, 黑客可以创造一个恶意应用程序冒充谷歌钱包, 然后获得付款和财务数据。相同的问题也出现在某些设备上的管理软件, 这使得黑客可以完全控制整个系统。

“本质上来说, 我们发现了一种制造虚假ID的方法, ”佛利斯塔尔这样说道。“很多黑客都能够创造假ID卡, 但问题是他们创造的是哪一种虚假ID卡?”这一缺陷会影响安卓2.1以上系统, 尽管最新的系统4.4或者称Kit Kat已经修复了这一漏洞, 因为这个系统与Adobe相关, 据Bluebox表示。从2012年至2013年, 大约14亿新的设备装有安卓操作系统, 据市场研究机构Gartner公司表示。Gartner估计今年将有11.7亿个安卓设备。

安卓系统的这一弱点展示了安全研究人员和谷歌是如何处理软件或者程序里发现的漏洞。它还暗示了处理影响安卓系统的弱点的复杂性, 因为修复需要的不仅仅是谷歌的相关调整, 它还涉及不同的软件开发者和设备制造商。

据佛利斯塔尔表示, Bluebox在三月下旬完成了这项调研并于3月31日将漏洞递交给谷歌。安卓安全小组在4月开发了修复的方法并将补丁交给供应商, 在Bluebox发布它们的发现之前, 供应商有90天的时间实施这一修复。Bluebox已经测试了市场里6300多个产品里的40个安卓设备。Bluebox计划在下周美国拉斯维加斯召开的“黑帽”安全技术大会上讨论他们的发现。

(消息来源:网易科技)

安全ID 篇2

《致命ID》是一部探讨分裂人格者心理的电影。影片从一开始就表现了不同人格之间的关系和厮杀,最后真正邪恶的人格是那个孩子的设定,情理之中,又是意料之外,仔细回味,不难发现motel剧情部分写照着一个分裂人格内心的世界。

在剧情的开端,男孩自我告白式的颂诗、剪报上那被丢弃在汽车旅馆的孩童、诗的内容暗示母亲是为妓女,种种迹象表明了一种心理分析人格不健全发展最重要的因素 ――童年生活的阴影。一场暴风雨,穿插式的叙事方式,暗示着某种分裂、紧张、无逻辑的想象,是导演赋予分裂人格的间接诠释。分裂人格者正进行的实验剧场表演,不停地冒出新芽,没有逻辑似的时间与空间,气氛是雷电交加,大雨滂沱的夜晚。罪犯被诊断出拥有十种人格却不自知,而故事就是那十个人格所化身的人物,至于人的出生日期都一样,那是因为那些人全都是他的人格,不是真实的人。这不经意相聚的十个角色实际上是人格分裂者兀自的妄想。

影片一开始一大段对人格分裂症病情描述、对罪犯童年母亲是妓女的交代也是不容忽视的。心理分析学家认为人格分裂者会有三种病态的倾向:其一是恋母情结,其二是恋尸性格,其三是自我迷恋。因母亲身为妓女,将他关在汽车旅馆的记忆,于是幻想出一个汽车旅馆的场景,一个巴黎的妓女,十分厌恶妓女的假旅馆老板。恋尸性格的隐喻出现在那看似诡异的钥匙不停伴随尸体,其它分裂出来的人格有些代表懦弱、有些意味自尊心强、有些是劣根性、有的则是理性般的自我反省能力。他有时回想起母亲,偶尔爱恋着他,用警探的人格说着“我没去过巴黎”试图勾引着母亲,却被拒绝;有时她决定置母亲死地,便故意让她遭到横祸;片中警察说自己有时会失去意识,大概就是转换成光头胖子的另一个人格去了;而他在弥留之际说的“我一直都在想你”可能就是恋母情节的体现吧; “婊子没有第二次机会”,随着罪犯那阴冷的笑容凸现,那种不寒而栗恰如其分让观众再度回味那个杀人场地,与其说这位人格分裂症的罪犯依靠幻想在进行自我摧毁,不如说他真正想处理掉的正是妓女母亲这一角色!许多的剧情都是一个人格分裂者的心理层面形象化,一但我们一一审视,便能体验许多的暗示与隐喻。

现实中,他蕴藏十个分裂的人格,每当换了眼神、换了面容,也就无法认识另一个自己。他的心理医师试图治疗他,引导他自我知觉并自行整合人格。于是他在自己的幻想场景中挣扎、净化过多的人格,以讨伐罪恶般一一杀之。剧中每死了一个人就少了一种人格。最后一个活着的人,就是光头胖子的最终人格。所有的凶杀案都在光头胖子脑中进行,而凶杀案的目的是为了消灭多余的人格。医生是希望他能保留住最好的人格把坏的去除掉,没想到最后剩下的人格却是真正邪恶的人格,把试图治疗他的心理医生给杀了。

在充满人格分裂的幻想场域,如惊悚片般的剧情正上演,不间断离奇的谋杀,直让人错以为是场骇人的杀戮。一旦我们领悟剧情不过象征着心理状态,便可了解许多剧情的转折,许多不合逻辑的地方其实是最深刻描绘内心交战的过程。真正让这部电影跳出条条框框,带来一场骗局的正是尸体消失的一段情节,巧妙的暗示了这场骗局不过是多重人格并发症的病人所幻想出来的一切。人的思考总是无逻辑地跳跃,尤以分裂人格者,或许他不停的想要逃离锁链,但他走了一圈却回到了MOTEL被捕,他的理性战胜了某个自己。如此我们了解到《致命ID》是一部探讨分裂人格者心理层面的电影。

安全ID 篇3

这两款机型外观一样,是名副其实的迷你一体机,体积仅比路由器大一点。外形简单大方,非常纤薄,蓝光驱动位于主机的侧面,可以将之挂在液晶电视或显示器的背面。

这两款新品在硬件方面更是不含糊,包括1.8GHz的Atom D525 CPU,GPU采用了“次时代ION”方案,使用NV GT218图形核心,2G DDR2-800内存,Nvidia的下一代ION芯片组图形平台,HDMI接口,六合一读卡器,802.11n WIFI,eSATA,USB2.0/3.0接口一应俱全,拥有2条SODIMM内存插槽,使用90W AC电源供电。

其中ID33和ID34区别就在于,Zbox HD-ID34配备了2GB容量的RAM内存和250GB容量的HDD硬盘,而ID33留下一个空的2.5英寸硬盘位用户可以进行扩展。此款蓝光一体机采用吸入式蓝光光驱。

ID排版经验总结 篇4

一、常用技巧

1.考虑分图层操作,做叠加效果,类似PS。2.多用快捷键,事半功倍。3.用黑箭头调整照片露出的范围。

4.有时可考虑做一精致页眉打动人。创建页眉复制后,标号会逐页增加。5.要排几列,需提前画好栏间距。6.水平镜像可使画面美观。7.对齐操作要常用。

8.从图片上吸取排版的颜色很方便,容易产生呼应。9.图形的叠加,创造出不同的效果。10.做精致的小图标。

11.活用渐变达不同效果(颜色,类型,方向,透明度),在作用对象上(色块,字体)。12.把大商标的名字打出来。

13.可先画色块调整好后再导入图片,方便调整。14.照片加上黑底白边效果大不同,增加了参差感。15.多用路径查找器创建新样式。(增加,减去,交叉)

16。试着把生活中一些有趣的样式加入排版中。(做有意义的图形)17.阴影可用效果,羽化,复制透明度做,比较来选。18.给画面的背景图片增加羽化,透明度。19.吸管也可吸取格式!

20.图片透明度比相同的图层透明度更低些。21有联网按钮可用

22在变换中找切变成平行四边形 23别忘了圆润精致的角选项

24描点删除成半圆,用白色箭头调整。25shift+alt 直接移动复制

26钢笔描点再删除,巧妙利用背景创造效果(2010)

二、字体选项

1.镂空透色字的创作,也可试着把图片贴入字体内部。2.渐变字体(方向,与背景协调)

3.效果内发光亮色,外发光暗色。锁住光明,效果好。3.经常用大小,颜色,描边,强化效果。4.倾斜的,有方向的字体运动感强。5善用有色文字表达情感。6.英汉相加型的字体可以考虑~ 7.把文字转路径后,可调整文字的样子。8.字体旁也可加一些修饰图形(圆,方,三角,星星)9.方正大标宋简英文很美

三、照片处理

1.可用路径选项剪切人物图像。2.照片背后加一张底图,突出层次感。

3。画好图形,剪切,贴入,让照片成为任意图形。4.文字绕拍,需手动文本框观看效果。

四、快捷键

ctrl+黑箭头=不等比放大

五、注意项

排版色调灰中透亮,黑白加一色,否则极易乱掉。L型构图

Z字图片构图(大连XXX)边框打边式排版 人物动作的指引性 学会适当留白

排版一般程序:

1.根据需求,定下要放哪些内容上去,用什么样的形式,在纸上画好草图。2.打好排版的边框(各种参考线,很节省时间)3.排版原则: 色调灰中透亮: 形状灵活不死板; 字体大小变化,重点突出;方便读者快速获得信息和体会到氛围; 4.西部微调。

安全ID 篇5

External assistance in terms of ID projects plays a very important role in Papua New Guinea's(PNG)development,both in financial terms and in some ways more importantly in helping PNG to address some of the major challenges the country faces towards its socio-economic development.

External support by various countries through grant-financed assistance predominate PNG's total external assistance with Australia as the largest donor.Among PNG's other development partners,the European Union(EU)is another important grant provider.Japan and New Zealand also play important roles.The People's Republic of China is an emerging development partner for PNG.

According to the 2006,June ADB report–Country Strategy and Program(PNG 2006–2010),The People's Republic of China is one of the top five major development partners in PNG.Most of the donor aids are in line with the PNG Government's Medium Term Development Strategy(MTDS 2005–2010)and the Millennium Development Goals of United Nations.

Under the ID construction projects,construction industry also benefits from the donor funding under project grants,concessional loans,technical assistance and others.Construction sector under the country's GDP by economic sector is one of the main engine rooms for the growth of the country's GDP.These projects contributed a lot to the country's economy and development,especially in terms of infrastructure projects like new hospitals,aid post,bridges,roads,educational buildings and others.

Figure 1 show the Construction industry share of the composition of GDP,highlighted at around 10 percent of the total GDP as of 2008.Hence,construction industry is one of the top three economic sectors contributing towards the total country's GDP break-up.This shows that this study is of significant importance towards the construction sector.

2 Understanding International Development:ID Projects

ID projects are also known as aid or donor funded projects and area sub-sector of project management like other areas such as information technology,education,construction and engineering,telecommunications,manufacturing,and the service industries,e.g.,legal,insurance,and finance(Austin,2000).The success of an ID project which is its long-term impact on the prosperity and development of the local population depends on how well it is prepared,and the policies behind its design.(Diallo and Thuillier,2005).

Literature review into classification of ID projects helps us to define such projects from other projects.As some researchers noted in their research work;ID projects differ from industrial or commercial projects.The objectives of ID projects by definition,concern poverty alleviation and improvement of living standards,environment and basic human rights protection,assistance for victims of natural or people caused disasters,capacity building and development of basic physical and social infrastructures(Khang and Moe,2008).Although there are some'hard elements'within ID projects,these projects are frequently concerned with'soft issues'like social or human development(Crawford and Pollack,2004).The soft objectives of ID projects are usually much less visible and measurable compared to industrial or commercial projects.The intangibility of ID project objectives and deliverables raise a special challenge in managing and evaluating projects that require adaptation of the existing project management body of knowledge(Khang and Moe,2008).

One important characteristic of most ID projects is the complex web of the many stakeholders involved(Youker,1999).Industrial and commercial projects usually have two key stakeholders,the client,who pays for the project and as a result benefits from its deliverables,and the contractor or implementing unit,who is paid for managing the project to achieve the desired results.ID projects,in contrast,commonly involve three separate key stakeholders,namely the funding agency that pays for but does not directly use project output,the implementing unit,and the target beneficiaries who benefit from project output but usually do not pay for the project.

3 Formal Analysis ID Projects

There are variations in project management knowledge and practices between industries,countries and application areas(Crawford,2001).Within project management literature,the most frequently addressed industry is construction(Betts and Lansley,(1995);Crawford,Pollack and England,(2006);Evaristo and van Fenema,(1999).Recently,ID projects are gaining more importance among project professionals due to their nature and contribution to developing countries.The Project Management Institution(www.PMI.org)identifies that most ID projects face time and cost overrun and require major costly re-engineering.

The process of the ID project is complex because there are many parties involved.Typically this includes the lender or donor,the Ministry of Finance of the host country,the client,stakeholders,a project management or coordination unit and a multitude of contractors who carry out physical implementation of most components and activities of the project.Overall performance of the ID project depends largely on these parties which are from different cultures and have different objectives within the project.The client is a sectoral ministry or institution of the host country.They are the official representative of all beneficiaries,participate in the project assessment phase,and need to closely monitor the project implementation process.

Like other projects,ID projects have a project life cycle.According to Broughton(1996),ID project cycle is the preferred vehicle for the delivery of foreign aid to developing or newly emerging economies.Youker(2003)identified two generic project life cycles for ID projects;one from the point of view of the host country and the other from the point of view of the donors.The key difference of the life cycles is the'financing phase from the host countries'point of view.The host country needs to attract project financing from donor agencies.

4 ID Projects Barriers

The operating environment and culture of the host country also make ID projects different from traditional business projects and make traditional project management tools in the developed world less appropriate(Blunt and Jones,1992).

Since the case study discusses ID pitfalls,literature reviews into project risks,barriers,project failures and various issues were being noted.Particularly,literature review into various regions in the developing countries.For example,international project success requires mastering numerous challenges in a complex context.Implementing projects in different countries,with their unique legal and political environment,security issues,economic factors,and infrastructure limitations and requirements increases complexity far beyond that of projects executed in domestic settings(Freedman and Katz,2007).

Geographic distances,language barriers,and cross-cultura gaps that are typical of an international project environment introduce further management challenges to the project teams executing the project deliveries.The future of project managemen involves an ever increasing number of projects that require the cooperation of geographically and culturally diverse teams(Freedman and Katz,2007)

5 ID Projects Evaluation and Limitations

As noted in the literature review,many of the ID projects are evaluated based on the concept of triple constraint–projec scope,time and cost.This becomes the measuring tool agains the backdrop of quality project.(PMI PMBOK,2004,p.8)These are the common dimensions of success factors mentioned by project management professional bodies and the research community.

Moreover,it is encouraging that research focus on project evaluation is increasing as highlighted by Crawford,Pollack and England,(2006).Recently,Kwat and Anbari(2009)discussed that research interest in the areas of performance/earned value management increased more than 100%in 2000s.

ID project performance is not well studied in project management literature.Their performance can only be sourced from the donor itself through its evaluation criteria.The performance evaluations of ID projects are as important as for other projects However,the evaluation criteria are slightly different from other projects because of the nature of ID projects.For example,Liu and Walker(1998)discusses about the relationship of performance–success–satisfaction which leads to(project)goal attainment of participants.

The concept of triple constraint are the common dimensions of success factors mentioned by project management professiona bodies and the research community but this'measuring tool'can not only be considered given the nature of ID projects in some respect.Diallo and Thuilleir(2004)first outlined a comprehensive set of evaluation criteria that includes satisfaction of beneficiaries,conformation of goods and services produced,achievement of project objectives,completion of the project in time and within budget,receiving a high national profile and receiving a good reputation among principal donors.Although the study was based in African countries,the findings can be of use to ID projects of other developing countries around the world.

5.1 Research Method:qualitative approach

The paper analyzes and evaluates an ID project delivery and its pitfalls under the Chinese Government funded projects through qualitative research method.Qualitative data was conducted,presented and discussed to provide an insight into major challenges in the implementation of ID project of such scale.

Qualitative research method was used to analyze project Hence,the case studies evaluate the scope of the project which focus on the actual contract documents and its delivery processes and as covered by;

1)Conditions of contract documents,

Which then,lead to arrangement and agreement set by project parties to define certain roles and responsibilities as per

2)A signed Service Contract,Memorandum of Understanding(MoU)and Terms of References(ToR)as agreed by various project parties for better economic advantages to all project parties during the project delivery process.

Data Collection:

Primary research data and information were collected through on-site discussions and interviews during and after the project completion.To further aid the acquisition of the subject knowledge,on-site observation and participation during the execution stage on those particular projects were also done by the author itself.The author at that time was working under the host country project team(Client's Representative)on sites that manage and oversaw the implementation of the projects.

5.2 Case Study:bilateral relationship

5.2.1 ID Project:case study

1)The PRC donor funded ID Project

The Chinese funded projects under this aid funding package consist of'The three China-aided Engineering Projects in PNG'.This include the construction of the Student dormitory and Teachers Houses at Vudal University,an island province of PNG,Mathematics and Computer Science Building at PNG University of Technology(case study),Lae City and the Renovation of the Government House in Port Moresby.

The China aided project to PNG was executed by the Chinese base contractor via the Ministry of Commerce(P.R.C).It was under Document No.2008-533 of Department of Aid to Foreign Countries,Ministry of Commerce(P.R.C),'Regulation for Construction Management of Complete Foreign-aid Projects'.The lists of documents consist of(i)Bidding Documents,composing of Notice of Invitation to tender,Performance bank Guarantee(Format),General Contract(Draft),Implementation Contract(Format),Bank Guarantee for Defects Liability Period(Format),Design Investigation Report&Drawings,Bill of Quantities(BoQ),List of Major Equipments&materials and Technical Specification,Construction Management Plan and Proposed Work Programme for China aided Project(Format)(ii)Contract documents and(iii)Chinese Construction Specifications and Standards.

Guangdong Foreign Construction Company Ltd(GDFC)won the bid to execute those projects in PNG.All the tender documents,architectural and construction drawing documents,specifications were done in China.The bidding process and the award of the winning tender were all done in China.Only,the execution stage was done in PNG with close consultation between The Economic and Commercial Counselors'Office of the Embassy of P.R.China in PNG,the various government representatives in PNG and the client.

2)Client's Representative on Site

In the context of this case study,the term Client's Representative generally refers to on-site project office that has made special staffing and'ring fencing'arrangements to manage the projects more effectively and to communicate with the contractor and all concern stakeholders.

Under this particular project,'special arrangement'with a Memorandum of Understanding(MOU)between the funding representative and PNG University of Technology as the recipient and/on behalf of the PNG Government were made.The project office under and as part of PNG University of Technology was set up purposely to work with the donor agency,contractor on site and the Government representatives during project implementation.

The Chinese funded project referred to the project team on site as"PNG site Representative of Recipient".The basic roles and responsibilities were almost the same on site as in traditional construction projects with special roles as per the Conditions of Contract,a signed Service Contract,MOU and TOR stated accordingly to the project parties.

5.2.2 Analysis of the Results:quatative approach

1)Client's Representative as PNG site Representative o Recipient.(PRC Project)

The China aided project to PNG implemented by the Chinese base contractor and the Ministry of Commerce(P.R.C)was under Document No.2008-533 of Department of Aid to Foreign Countries,Ministry of Commerce(P.R.C),'Regulation for Construction Management of Complete Foreign-aid Projects'.

an Economic&Technical Cooperation Agreements,an exchange of letter on China aided projects in PNG was signed between the two Governments.This then led to a Chinese design company carrying out feasibility studies and design work.Review and approval on design work were based on Chinese construction specification and standards by PNG government representatives.Prequalification and public bid invitation was done which was followed by Issuance of letter of acceptance for bid award and a signed General Contract with the Chinese contractor all under the Department of Aid to Foreign countries via the Chinese Ministry of Commerce.

With that,the Chinese contractor signed an Implementation Contract on China Aided Project with PNG Government(Department of National Planning&Monitoring)on behalf of the Chinese Government.This then led to Chinese Contractor signing a MoU for project implementation with the PNG recipients.Hence PNG University of Technology was one of the recipients of the three construction projects and set up a project team as PNG site Representative of Recipient"(client's representative)to oversee the project based on the signed MoU.

The only roles and responsibilities to be carried out by PNG site Representative of Recipient(client's representative)on site was based on the signed MoU-Article 5–1 Responsibilities o PNG side has stipulated in Implementation Contract of Three China Aided Project in PNG.

5-1 Responsibilities of the PNG Side

5-1-1 To provide the construction site for the project to the Chinese side free of charge and settle the land use permit formalities approved by the Papua New Guinea Land Authorities.

5-1-2 To remove local residents and demolish any obstacles on and/or underground within the building line.

5-1-3 Be responsible for the leveling of the construction site within the building line,achieving the elevation stipulated in the design.Be responsible for all the engineering projects connected outside the building line.

5-1-4 To obtain the authorization and permits for the implementation of the project from the government departments concerned.

5-1-5 Be responsible for the connecting of water,electricity and communication etc.to the place designated by both sides within the building line.

5-1-6 To exempt all the equipments and materials for the project and the living necessities of Chinese technicians(including means of transportation)from any duties or taxes,etc.

5-1-7 To appoint site representative(s)to assist the Chinese side in organizing the construction and settling technical problems during the construction period and to assist the Chinese side with the recruitment,dismissal,and in dealing with dispute death or casualties of the local employees.

5-1-8 To assist the Chinese side in locally purchasing bricks,tiles,sand,rocks,timber,oils,fuels and other local materials necessary for the project.

5-1-9 To assist the Chinese side with the customs clearance and consignment,storage and transportation to the worksite o those building materials,construction machinery and equipmen and daily necessity,medicine,office facilities and appliances for labor protection necessary for the Chinese personnel during their work in Papua New Guinea that are provided by the Chinese side upon their arrival at the port.

5-1-10 To undertake the entry/exit formalities,and to obtain the residence permits for the Chinese personnel in Papua New Guinea during the execution of the Contract.

5-1-11 To provide sites for stacking construction materials and waste,and provide the borrow and spoil sites for the projec construction.

5-1-12 Be responsible for the arrangement of security.to safeguard the safety of the Chinese personnel and the equipmen and materials on the construction site.

5-1-13 To provide adequate accommodation and office space and communication facilities to the Chinese personnel for residence and administration use.

5-1-14 Be responsible for the safety,accommodation,duty allowances and related allowances for all PNG site representatives as stipulated under the PNG Public Services'Rules and General Order.

5-1-15 To provide site office for the PNG site representatives.

All the expenses arising from the items above shall be borne by the PNG side.

5.3 Qualitative Findings:results and pitfalls

During the implementation stage of the project on site,certain pitfalls under the signed MoU were encountered between the Chinese Contractor on site and the PNG site Representative o Recipient.In particular;

Pitfall Case 1:The Chinese construction Specifications and Standards used by the contractor and the only role stated in the MoU,Responsibilities of the PNG side,article 5-1 especially clause 5-1-4 and 5-1-7 respectively during the execution,monitoring/controlling and closing phase on the project site.'Certificate of Occupancy'for the building was not recommended from few PNG regulatory bodies upon request from the PNG site Representative of Recipient for inspection.Hence,their argumen was that the Chinese contractor used Chinese specification and standards which does not conform to PNG standards and regulations.Government had to intervene which in some ways does no truly reflect the delivery of a project in compliance with loca standards and regulation.For example,the Chinese contractor used the Chinese standards for the installation of electrica wirings within the building which does not comply with PNG standards and regulations.As indicated by one of the PNG regulatory bodies,it poise danger to the end users.

Pitfall Case 2:Upon request from the PNG site Representative of Recipient for few design changes as seen appropriate and practical on site.Under such arrangement,the Chinese contractor had to seek approval from the Chinese design team and other appropriate representatives in China.This sometimes being experienced as time consuming and causes delay in work resulting in extra cost borne by both project parties.

6 Recommendation and Conclusion

Close consultation with various stakeholders in drafting service contracts,MoU and ToR,with continuous feedbacks from stakeholders can provide a comprehensive understanding to avoid such pitfalls.By identifying and highlighting such pitfalls and their impacts can remind various ID project teams both on-site and not on-site to have a better understanding of the consequences experienced on site.If not considered with care,can hinder progress and reduce economic advantages.

一类决策树ID3改进算法探究 篇6

关键词:决策树,ID3,分类属性,信息熵

0 引言

决策树是一种重要的数据挖掘技术,是从机器学习领域发展而来的一种函数逼近分类方法[1,2,3,4,5,6,7,8,9]。随着人工智能研究的深入,对决策树算法进行改进,尤其是经典决策树算法ID3改进,成为研究热点[10,11,12,13,14]。

1 ID3算法及其基本概念

1.1 ID3算法

ID3具体算法如下[15]。

输入:ID3(Examples,Target_attri,Attri),Examples即训练样例集,Target_attri是决策树要预测的目标属性,Attri是除去目标属性之外供学习的决策树测试的属性列表。

输出:一棵能正确分类给定Examples的决策树Root。

(1)创建树的Root结点

(2)如果Examples都为正例,则返回label= + 的单结点树Root

(3)如果Examples都为反例,返回label= - 的单结点树Root

(4)如果Attri为空,返回单结点树Root,label= Ex-amples中最普遍的Target_attri值。否则,执行(5)。

(5)A ← Attri中分类Examples能力最好的属性;Root的决策属性 ← A;对于A的每个可能值vi:

在Root下加一个新的分支对应测试A = vi;

②令Examplesvi为Examples中满足A属性值为vi的子集;

③如果Examplesvi为空,则在此新分支下加一个叶子结点,结点的label= Examples中最普遍的Target_at-tri值;否则,在此新分支下加一个子树ID3 (Examplesvi,Target_attri,Attri- |A|)。

(6)结束。

(7)返回Root。

在算法(1)处所描述的分类能力最好的属性为具有最高信息增益的属性。

1.2 信息熵与信息增益

确定分类能力最好的属性需要用到ID3算法中规定的信息熵和信息增益。

(1)信息熵。ID3算法认为,对于一个拥有n个反例和p个正例的样例集合S而言,能对其进行正确分类的决策树的信息量为:

若以属性A作为当前样例集S的根,并设A有v个值v1,v2,…,vv,并将S分为对应的v个子集S1,S2,…,Sv,且某子集Si中含有Pi个正例和Ni个反例,规定Si的信息熵为:

规定以属性A为根进行分类的信息熵为:

(2)信息增益。ID3中规定,信息增益最大的属性A可评为分类最好属性,其定义式为:

综合式(1)~式(4),可以推知在当前样例集下,属性A的信息增益最大时,其信息熵E(A)最小。

2 一类ID3改进算法

在众多ID3改进算法中,比较典型的有两种,主要对前述公式中比较复杂的对数函数进行简化。

2.1 用等价无穷小进行代换

文献[16]根据等价无穷小理论,利用当x很小时公式ln(1+x)≈x,作如下化简:

在忽略常数的情况下,有:

文献[16]中,通过使用(省略常系数2)计算每个属性的“平均熵”,并选出其值最小的属性作为决策树的目标属性。

2.2 展开到2阶麦克劳林展开公式

文献[17]利用在x→0时,ln(1+x)在x0=1处的2阶麦克劳林展开公式x-x2/2,并在认定的条件下给出公式:

忽略常系数,给出某个属性的信息增益的简化式。

可知以上两种改进算法给出的信息增益简化式完全一致,皆为。

3 对改进算法的讨论

3.1 利用等价无穷小改进算法讨论

文献[16]通过将对数运算简化为简单的加减乘除运算以提高算法效率,然而其存在如下几个问题:

(1)只有当x足够小时,公式ln(1+x)≈x才合理,但在一个样例集及其子集中,很难保证正例pi或反例ni与正反例之和的比值足够小,因此式(5)与式(6)一般都不成立。从另一个角度看,式(5)与式(6)的简化结果也较粗略。

例如,设一个样例子集中正例pi=70、反例ni=30,则,显然不能断定式(5)与式(6)成立或合理。

(2)式(5)与式(6)不可能同时成立。假设一个样例集或一个样例子集中正例pi与正反例之和pi+ni的比值足够小,趋近于0,则显然有反例ni与正反例之和的比值接近于1;反之亦然。因此,式(5)与式(6)不可能同时成立,或者说结果较粗略,当然在此基础上得出的式(7)则更加粗略。

3.2 2阶麦克劳林展开公式改进算法讨论

从原理来看,展开到2阶麦克劳林展开公式改进算法与利用等价无穷小改进算法完全一致,都希望利用简单的加减乘除运算替代相对比较复杂的对数运算,从而提高算法效率。但展开到2阶麦克劳林展开公式改进算法存在以下问题有待商榷。

(1)此算法中ln(1+x)在x0=1处的2阶麦克劳林展开公式x-x2/2,其假定条件为,难以成立。对于ID3算法而言,一个子集中只有正例和反例,假设正例的比例极低,满足,显然不会有;反之亦然。

(2)进一步,假设能够满足这一前提条件,将在x0=1处展开的2阶麦克劳林公式在很多情况下也非常粗糙,因此无法保证。

例如,设一个样例子集中正例pi=1、反例ni=9999,则,显然这两个式子的结果相差甚远。

4 结语

安全ID 篇7

随着物联网的蓬勃发展,RFID技术在很多行业被广泛地应用[1,2,3]。RFID技术利用无线射频方式在阅读器和应答器(标签)之间进行非接触双向数据传输来达到目标识别与数据交换的目的[4,5,6,7]。然而,阅读器和应答器之间的无线通信信道是共享的,当多个标签同时响应一个阅读器时,造成阅读器不能识别标签,产生标签碰撞。“防碰撞算法”就是解决碰撞的一种有效算法[8]。

现有的防碰撞算法主要分为概率性防碰撞算法和确定性防碰撞算法。概率性防碰撞算法有“ALOHA算法”,湖南大学尹君、何怡刚等在ALOHA算法的基础上,提出一种基于分组动态帧时隙的防碰撞算法,将时隙利用率提高80%以上[9]。确定性防碰撞算法有“二进制树搜索算法”、“IPA算法”(Identification Prediction Algorithm)等,东华大学樊文静、张姗姗等提出一种基于后退式二进制搜索算法的改进算法IRBS[10]。西南交通大学李世煜、冯全源提出了分层深度搜索树型RFID 防碰撞算法[11]。然而,当标签数量庞大时,概率性算法吞吐率低,算法性能急剧下降;确定性算法虽然可以保证标签全部被识别,但花费时间较长。

本文在跳跃式动态树形防碰撞算法(JDS)的基础上,提出一种基于减少ID冗余位和动态传输数据思想的RIPA算法(精简IPA算法),通过大量的仿真实验,从阅读器问询和标签应答过程进行比较与分析,证明RIPA算法取得更优的性能。

1 相关原理

1.1 JDS算法

JDS[6]算法的搜索过程是当标签发生碰撞时,阅读器采取向前搜索策略,直至遇到一个可以识别的标签为止;同时再采取后退方式,返回上一碰撞节点,继续搜索直至识别完阅读器工作区域的所有标签。主要步骤如下:(1) 阅读器发送Request(Null,N)命令(N为标签ID长度),要求区域内所有标签应答;(2) 检测有无碰撞发生,若有把最高碰撞位置0,高于该位的数值不变,可得IDN-1-x的值(x为碰撞最高位的下标),由此得到下一次查询命令所需的参数;(3) 若无碰撞,则识别单个标签,处理完后回跳到父节点,得到下一次查询命令所需的参数;(4) 重复进行请求与检测过程,直到执行Request(Null,N)命令无碰撞发生时结束。JDS算法充分利用了返回式搜索和动态二进制搜索的优点,采用向前向后搜索,提高了系统性能。

1.2 IPA算法

IPA算法[12,13]引入了NcbNcN1和Nr四个量并结合查询树QT(Query-Tree)算法实现对RFID标签的识别。其本质是利用标签ID中“1”的个数来预测标签ID。该算法将标签ID分为计数域和位域,计数域为位域中“1”的个数,如图1所示。阅读器向标签发送的REQUESET命令中以计数域为前缀,接收到命令的标签与自身的计数域比较,若相同则回应。

在IPA算法中,阅读器要存储的信息有计数域Ncb(即标签“1”比特的个数),碰撞比特数Nc,被识别的“1”比特的个数N1,未被识别的“1”比特的个数Nr。容易知道,未识别的“1”个数Nr=Ncb-N1,阅读器分析Nr的值来判断标签能否被识别,有以下几种情况:

(1) Nr=0:标签ID中所有比特均被识别,数据没有碰撞。这种情况下NcbNcN1、Nr的值无需计算,标签可以直接被识别。

(2) Nr =1:标签ID中未识别的“1”比特数为1,根据标签的唯一性,每个标签ID的碰撞位Nc中必然有且只有一个“1”,而其余位均为“0”。可能的情况有Nc个,因此阅读器可以同时识别Nc个标签。

(3) Nr=Nc-1: 标签ID中未识别的“0”比特数为1,每个标签ID的碰撞位Nc中必然有且只有一个“0”,而其余位均为“1”。可能的情况有Nc个,因此阅读器可识别Nc个标签。

(4) 当Nr不满足以上三种情况, 说明阅读器仍然没有足够的信息可以识别标签, 采取QT算法进行识别。

2 RIPA算法

2.1 RIPA算法思想

(1) 当只有一个标签进行应答的情况下,即无碰撞发生,可以直接识别标签,无需计算NcbNcN1和Nr四个值。

(2) 采用JDS算法取代QT算法,在搜索标签的过程中,不仅可以避免重复的搜索路径,而且采用动态传输阅读器与标签之间数据的方法降低通信量。

(3) 阅读器和电子标签之间每次发送的都是整个序列号的信息,含有大量冗余信息,精简IPA算法通过减少寻呼中信息冗余位,从而降低传输时延和能耗。

2.2 RIPA算法相关指令

为了实际实现该算法,需要一组能由电子标签处理的指令。

锁定指令—REQUEST(UID,m):UID代表阅读器在第一次寻呼之后,根据译码结果所得到的下一次寻呼的序列号。UID的取值约定为:阅读器在判断出数据发生碰撞的准确比特位置之后,把碰撞位置“1”,未碰撞位置“0”,并将未碰撞位中“1”的个数计入到标记位中,组成新的锁定寻呼指令的序列号。阅读器在发送这个寻呼指令之后,电子标签的响应为:自己ID中的数据位与接收到阅读器发出的序列号进行比较,将阅读器发出的UID位中值为“1”所对应的比特位进行锁定,并把自己的计数位与序列号的计数位相减,得到新的计数位值,在之后的防碰撞处理中,参与数据发送和比较的仅仅是这几个被锁定的比特位及其计数位。

激活指令—ACTIVE:处于准备状态的标签接收到此指令后,比较自己新的计数位是否与count-bits相等,如果是则响应,否则继续处于准备状态。本文采用REQUEST(count-bits)来实现ACTIVE指令的功能。

被选择(序列号)指令—SELECT(UID):具有相同序列号的标签将以此作为执行读写命令的切入开关,即选择这个标签。具有其他序列号的电子标签只对REQUEST命令应答。

读写数据指令—READ-DATA:选中的标签将数据发送给阅读器,与阅读器进行读写通信。

进入静默状态指令—UNSELECT:取消一个事先选中的标签,标签进入无声状态,不应答REQUEST命令。

2.3 RIPA算法工作流程

RIPA精简IPA算法的防碰撞处理流程如图2所示。

以标签的ID长度为8位,阅读器作用范围内有5个标签为例,如表1所示。

具体流程如下:

(1) 对区域内5个标签发送指令REQUEST(11111111),所有ID值小于或等于(11111111)的标签对此命令作出应答, 所有应答标签将自己的ID 码反馈回去。

(2) 阅读器检测收到的信号,若没有信号,表示阅读器周围没有标签,转到步骤(1),否则转到步骤(3)。

(3) 阅读器对所有电子标签作出的应答信号进行译码,根据译码结果判断是否有碰撞发生,5个标签出现碰撞,可解码为XXX10XX1,转到步骤(4)。

(4) 阅读器根据步骤(3)中的译码结果判断碰撞发生的比特位,将其置“1”,未发生碰撞的比特位置“0”,并将未发生碰撞的比特位中“1”的个数记录,可得下次指令为(11100110,010)。阅读器发送REQUEST(11100110,010)指令,5个标签分别将自己ID的D1 、D2 、D5 、D6 、D7 三位锁定,并将各自的计数位减去010,即标签的新ID为011 10101、010 10010、011 01011、010 11000、000 00000。

(5) 阅读器发送REQUEST(0),则计数位与0相等的标签对此命令作出应答,标签5响应,无碰撞发生,无需进行NcbNcN1和Nr四个值的计算,可直接识别标签。再发送UNSELECT命令,使标签进入无声状态,不再响应阅读器发出的指令。

(6) 阅读器发送指令REQUEST(1),无标签应答。

(7) 阅读器发送指令REQUEST(2),标签2和标签4响应,阅读器检测到碰撞为“1X0X0”,此时统计Ncb=2、Nc=2、N1=1、Nr=1,所以可以直接识别出两个标签(标签2:10010,标签4:11000),进一步处理后,使标签进入无声状态,不再响应阅读器发出的指令。

(8) 阅读器发送指令REQUEST(3),标签1和标签3响应,阅读器检测到碰撞为“XXXX1”,统计Ncb=3、Nc=4、N1=1、Nr=2,此时阅读器没有足够的信息识别标签。于是采用JDS算法,阅读器根据碰撞数据,知道最高位为D5,将最高位置0,发送指令REQUEST(0,5)。收到指令REQUEST(0,5)后,标签3响应,无碰撞发生,识别标签3。

(9) 因为采用了JDS算法,阅读采用回跳策略,发送REQUEST(1,5)指令,标签1响应,无碰撞,识别标签1,发送UNSELECT命令,使标签进入无声状态,不再响应阅读器发出的指令。

(10) 所有电子标签均被识别,精简IPA算法识别过程结束。

2.4 RIPA算法特点分析

本文所提出的RIPA算法主要有以下几个特点:

(1) 精简ID。阅读器在发送命令后,对所有标签作出的应答信号进行译码,根据译码结果判断是否有碰撞发生。若有碰撞发生,阅读器将这几个碰撞的比特位置“1”,未发生碰撞的比特位置“0”,并将未发生碰撞的比特位中“1”的个数记录为m。接着阅读器发送REQUEST(UID,m)指令,标签在接到此命令之后将UID与自己的ID进行比较,将发生碰撞的比特位锁定,计数位记录减去m值的数值。在标签识别之前,将所有标签不相同的信息进行锁定,后期的识别过程只针对这些发生碰撞的信息进行,大大减少通信冗余,达到精简ID的目的。

(2) 压缩统计处理过程。阅读器发送REQUEST(count-bits),则计数位与count-bits值相等的标签对此命令作出应答,将自己锁定位发送给阅读器,阅读器判断是否有碰撞发生。如果没有碰撞发生,则直接获得该标签的ID号,无需对标签ID的NcbNcN1、Nr进行统计处理。当阅读器范围内只有一个标签应答时,传统IPA算法会先对标签进行计算处理后在识别标签,降低了阅读速率。

(3) 跳跃式动态树搜索。阅读器在通过统计计算后,仍然无法识别标签时,采用跳跃式动态树搜索,即将碰撞发生的最高位X置“0”,高于该位的值不变,低于该位的值舍去,直至顺利读取某个标签为止。处理完后采取回跳策略,返回到上一次发生碰撞的节点,识别此节点的另外一个分枝,这样不断重复操作,直到将标签全部识别。跳跃式动态树搜索避免了路径的重复,提高了识别速率。

3 RIPA算法仿真及分析

随机选取8位标签ID,对JDS、IPA和RIPA三种算法进行仿真,其中,RIPA为本文提出的精简IPA(Reduced_IPA,简称RIPA)。按照每个算法流程编写C程序,以选择随机或者有序的标签ID,仿真标签的识别过程。分别统计了阅读器问询和标签应答的总次数和总比特数,结果如图3、图4、图5和图6所示。

精简IPA算法在阅读器问询过程和标签应答过程中都明显优于JDS算法和IPA算法,随着标签数量的增多,精简IPA算法优势越加明显,如表2和表3所示。

可见,随着标签数量的增多,JDS算法阅读器问询和标签应答的总次数和总比特数呈直线上升,因为JDS算法只是对冗余的传输数据进行处理,减少了数据传输量,而识别过程没有任何的优化。IPA算法虽然大大降低了阅读器问询的总次数和总比特数,但却大大增加了标签应答的总比特数,这是由于IPA算法在一次问询的过程中,可能同时识别多个标签,从而大大减少了阅读器问询量,这是其优势所在;但IPA算法额外增加了计数位,这些比特位不属于标签的实际信息,在标签应答时,都全部返回阅读器,造成大量的信息传输。而且随着标签ID长度的增加,这种无用的信息传输量也将增大。

为了进一步验证RIPA算法的性能,我们又进行了随机和有序的16位的标签ID的识别仿真实验。

如图7、图8、图9和图10所示为仿真实验结果,RIPA算法识别有序标签ID的性能远高于识别随机标签的性能。这是由于有序标签中非碰撞位较多,将非碰撞位省去,可以减少大量冗余,并加快了识别速率。这个特点非常适用于大量识别同类物品的场合。如在仓储过程中,可以给不同商品添加商品代码,在识别同类商品的过程中,不但不影响阅读速率,还可以迅速发觉是否有非同类商品混杂的问题。

4 结 语

针对传统的标签数量庞大场合下存在的碰撞问题,本文首先研究了IPA算法的编码方式和基本原理,在分析IPA算法不足的基础上,引入了JDS算法,提出了RIPA算法。并通过实验证明了本算法相较于其他算法在阅读器问询次数、比特数和标签应答次数、比特数等方面具有较高的优越性,较大幅度改进了RFID标签的识别精度,提高了RFID系统多标签同时识别的性能。

安全ID 篇8

长期以来, 人们对短期负荷预测作了大量的研究, 传统的预测方法如时间序列法、多元线性回归法等[4,5], 算法比较简单、成熟;但属线性模型。现在正在研究的预测如支持向量机[6]、神经网络法[7—9]、决策树法等, 在实际中取得了较好的效果。文献[10]介绍了决策树在短期负荷预测中的应用;文献[11]结合决策树和专家系统建立了预测模型;文献[12]综合考虑了气温、湿度等气象信息及星期因素对日特征负荷的影响, 建立了决策树模型。

短期负荷预测领域虽然有了丰硕的研究成果, 但由于影响因素众多, 负荷受相关因素影响的规律不断变化, 不同地区变化规律不尽相同, 且随着分布式电源的并网, 机器学习效率急剧降低, 出现过拟合、泛化能力弱、精度低等缺陷。

本文结合决策树ID3算法, 从算法本身偏向多值属性、影响因素越多越容易发生误判两个方面进行分析, 提出改进措施, 对负荷影响规律明确、影响程度大的因素指定其在决策树的位置, 利用信息熵降计算各影响因素的相似度, 对相似历史日进行排序, 识别主导负荷变化的影响因素, 从而有效提高算法的适应性, 提高负荷预测准确率。

1 ID3算法及误判分析

决策树是以实例为基础的归纳学习算法, 从决策树根节点到叶子节点的一条路径形成一条分类规则[13]。在各种决策树学习算法中, Quinlan提出的ID3算法最具影响[14,15], 该算法是以信息论为基础, 以信息熵和信息增益度为衡量标准, 从而实现对数据的归纳分类。基本原理如下:

设S是n个数据样本的集合, 将样本集划分为m个不同的类Ci (i=1, 2, …, m) , 每个类Ci含有ni个样本, 则S划分为m个类的信息熵或期望信息为:

式 (1) 中, pi=ni/n, 为S中的样本属于第i类Ci的概率。

Sv是S中属性A的值为v的样本子集, 即Sv={s∈S|A (s) =v}, 选择A导致的信息熵为

式 (2) 中, E (Sv) 为Sv中的样本划分到各个类的信息熵。

A相对S的信息增益Gain (S, A) 为

由于影响负荷的因素众多, 且ID3算法偏向于多值属性, 决策树节点可能把负荷并不相似的历史日划分到了同一片树叶下, 从而导致误判。

1.1 属性多值引起的误判分析

影响负荷的主要因素有日类型 (如正常日和特殊日) 、气象数据 (如气温、气压、湿度等) 。ID3算法适合处理离散属性值, 在生成负荷预测模型前需要对属性进行离散化处理, 日类型有正常日和特殊日, 无需离散;温度、湿度、气压等气象信息进行离散化处理, 离散后的组数越多, 属性值越多。而ID3算法偏向多值属性, 采用ID3算法自动形成决策树时越容易发生误判。举例说明:

待预测日为5月1日, 在采用ID3算法自动生成决策树, 由于气象因素离散值较多, ID3算法会将气象因素置于决策树顶层, 忽略日类型因素, 将相似日选为4月30日, 实际上, 特殊日与正常日的负荷特征差异很大, 所以应该选择上一年的5月1日为相似日。

1.2 多影响因素引起的误判分析

上层节点对应的属性A已定, 对应的样本数据为S, 则其信息熵E (S) 也应为定值;若属性A有n个值, Si是属性A第i个值的样本子集, 下层节点的信息熵为应:

式中, , Wj为Si中的属于样本S的每一类的样本子集。

将式 (2) 代入式 (1) , 得

当n值越大时, ∣Si∣越小, 分两种情况讨论 (-npj) lg2 (pj) 的值变化趋势:

情况1:pj取值区间为 (0, 2- (1/ln2) ], (-npj) lg2 (pj) 为pj的单增函数, E (S, A) 随pj减小而减小, 则属性A的信息熵增益Gain (S, A) 随之越大;

情况2:pj取值区间为[2- (1/ln2) , 1], (-npj) lg2 (pj) 为pj的单减函数, E (S, A) 随pj减小而增大, 则属性A的信息熵增益Gain (S, A) 随之减小。

以上说明:当影响负荷预测的因素越多, 若样本子集所包含样本各类的数量比减少, 该影响因素的信息增益也就越大, ID3算法将会选择该因素作为决策树上层节点。那么, 若该因素不是影响负荷预测的主要因素, 那么将会发生误判。

同时, 决策树采用自上而下的递归方式, 上层节点决定着下层分支和节点的选择, 所以, 越靠近上层的节点对分类规则的影响越大。在短期负荷预测时, 对负荷预测越重要的影响因素应越靠近决策树的上层。

2 ID3优化算法基本模型

短期负荷预测一般分为三个阶段:一是生成决策树模型;二是利用决策树选取相似日;三是利用相似日数据进行加权、外推待预测日负荷。

2.1 决策树生成模型

由于越重要的影响因素越应靠近决策树的上层, 上层节点的错误会影响预测精度, 为了防止决策树上层节点发生误判, 本文根据实际情况指定对负荷影响规律比较明确、影响程度大的因素, 指定为决策树的前数层。

如图1所示, 基于ID3优化算法的决策树建模思路如下:

第一层节点:因为特殊日负荷变化规律与正常日明显不同, 所以需要特殊考虑, 若采取ID3自动生成, 日类型属性值只有两个, 而ID3偏向于多值属性, 随着节点增多, 误判的可能性越大, 所以该层指定为日类型, 将特殊日和正常日作为决策树的第二层。

第二层节点:该层是正常日和特殊日的下节点, 需分别考虑。预测日为正常日时, 月份不同, 气候状况相差很大, 整个社会的用电特征也有很大不同, 所以该层也进行指定, 比如在中国大部分地区, 一、二月份低温季节, 如湿冷天气, 湿度和温度较低, 会有大量的空调负荷启动。五月份气温逐渐升高, 负荷水平呈现出一个逐步上升的趋势, 九月份气温逐渐降低, 负荷水平呈现出一个逐步下降的趋势。因此, 正常日下层指定为月份。特殊日指国家法定的重大节日或假日, 一般有春节、十一、中秋、元旦等, 每个节日的所在季节不同, 负荷也呈不同特点, 所以分别将每个节日作为特殊日下层节点。

第三层节点:因为双休日负荷要低于工作日, 且负荷曲线形状不同, 所以, 月份下的节点分为日类型;节日下的节点将气象信息进行离散化, 采用ID3算法自动生成。

第四层节点:采用ID3算法自动生成。

2.2 相似日选取模型

决策树学习算法只注意到属性的选取, 而把属性取值置于次要位置。本文将信息熵作为属性的取值, 利用信息熵计算各个影响因素的相似度, 得出综合相似度, 并根据综合相似度大小对相似历史日排序, 利用历史日负荷进行加权、外推来预测待预测日负荷。

2.2.1 主要影响因素的相似度计算

划入决策树同一叶节点的数据为同一类数据, 这类数据可能不止一个。利用已建成的决策树, 选择相似的历史日, 分别计算所选历史日和待预测日每个主要因素的信息熵。将信息熵作为属性的取值, 利用信息熵计算相似度。

设有M个影响因素, N个历史日, 待预测日的第m个影响因素的信息熵为Em.p (S) , 第n个历史日的第m个影响因素的信息熵为Em.n (S) , m=1,

fmn代表第n个历史日的第m个影响因素与待预测日的相似度, 始终不大于1。

针对每种因素, 分别计算各历史日与待预测日的相似度, 获得相似度矩阵:

2.2.2 综合相似度计算

将历史日各因素的相似度相乘, 即:

该式有以下优点:

1) 与影响因素的顺序无关;调整各影响因素的顺序, 不影响综合相似度的值。由于改进决策树算法人为指定了数层, 可以避免自动形成决策树造成误判, 越重要的因素越靠近决策树顶层, 相当于改变了影响因素的排序, 综合相似度采用累乘方式, 能够有效避免因排序所带来的误差。

2) 可解决各因素的权重设定问题。调整各因素的权重值, 不影响历史日排序, 在参数自适应过程中, 能够减少自适应参数的数量, 减少计算量。

3) 可简便识别主导因素。主导因素即影响负荷的主要因素;不同的条件下, 影响负荷变化的主要因素不同, 一般存在1~2个主导因素。成熟的短期负荷预测算法应能识别各种条件下影响负荷变化的主导因素, 确保选取的相似日真正与待预测日相似。利用式 (8) 可简便识别主导因素, 判别方法如下:

当越小, 说明该因素越重要。

2.3 短期负荷预测

在进行短期负荷预测时, 需要考虑权重取值及历史日与待预测日之间的比率关系:

1) 由于各历史日与待预测日的相似程度不同, 根据各历史日的负荷数据寻找规律时, 为了防止历史日与待预测日的相似程度很低, 在各历史日排序后获得权重系数:

式 (12) 中, i表示该历史日在所有历史日与待预测日的排序中排在第i位;α为平滑系数, 是 (0, 1) 区间内的实数。

利用式 (12) , 指定平滑系数, 将历史日的负荷曲线按照一定的权重系数加权平均, 相似度高的历史日负荷曲线权重系数大, 权重系数随相似程度的排序呈指数衰减。当历史日相似程度很低时, 权重也较小, 有效防止在这样的历史日中找出的规律不符合待预测日所体现出来的规律。

2) 计算各个历史日与待预测日之间的比率关系。例如, 待预测日为春节, 根据春节前n天的历史数据, 可得出今年负荷较去年同期的负荷平均增长情况, 利用此平均增长率可得出待预测日比该去年春节的负荷应高出的百分数。

3 工程应用

本算法应用于预测我国北部地区的某城市负荷, 采用96点预测法, 对2006—2012年的负荷进行了预测, 平均准确率都超过了96.5%。其中, 对2008年12月份的负荷进行预测, 每日的准确率如表2所示, 该月份的平均准确率达到97.89%。

以2008年8月7日 (正常日) 为待预测日, 预测精度为98.6%, 负荷预测曲线与实际曲线如图2所示。

以10月1日 (特殊日) 为待预测日, 预测精度为98.6%, 负荷预测曲线与实际曲线如图3所示。

为了体现本算法的优越性, 与自动形成决策树的精度进行比较, 如图4所示, 若采用自动形成决策树预测值, 误差较大;若采用ID3优化算法之后, 预测准确率可达99.8%。

4 结束语

ID3算法在构件库中的应用 篇9

随着计算机技术的快速发展, 各行业中积累了大量数据, 如何在这些数据资源的背后找出大量隐藏的知识信息, 已成为各商业领域广泛关注的问题。基于这种背景, 数据挖掘技术应运而生。数据挖掘技术主要有决策树方法、神经网络方法、统计学方法、粗糙方法和可视化技术等[1], 这些数据挖掘技术从不同角度对大量历史数据进行知识挖掘。由于常用于分类和预测的决策树方法具有速度快、精度高、生成模型简单等优点, 在诸多的数据挖掘方法和技术中, 其受到了许多理论研究者的广泛关注[2]。

目前, 国际上最早具影响力的决策树方法是J.Ross.Quinlan等人于1986年提出的ID3算法。ID3算法的优点是:理论基础清晰、分类原理简单、学习能力强、适用于处理大规模的学习问题, 因此, ID3算法一直是数据挖掘领域中的一个极好典范[3]。由于国内研究人员对ID3算法的研究主要是算法的改进, 而对该算法的具体应用不多, 对构件库中的应用研究更少, 本文的工作弥补了这方面的不足。

2 ID3算法简介

ID3算法是数据挖掘技术中广为人知的一个重要算法, 它是决策树构造方法中用于分类预测的最为常用的具体实现方法, 其理论基础是由C.E.Shannon建立的信息论[4]。ID3算法将信息论中的信息增益作为选取最优属性的标准。

3 ID3算法在构件库中应用

3.1 构件样本数据集合的准备工作

要对大量数据进行数据挖掘和知识发现, 数据集成在数据挖掘流程中是非常重要的一个步骤。将ID3算法用于构件库中之前, 所需的集成数据需通过数据集成过程来完成。根据上海构件库中的构件信息, 建立模拟构件库, 其中包括用户对构件的反馈信息表和构件基本信息[5]。对于反馈信息表来说, 构件的很多复用用户对构件的各种评价信息是构件库管理者后期收集得到的, 因此保存的是构建管理者或复用者较为关注的构件属性, 而构件基本信息中的记录原本就保存在构件库中, 较为容易提取。参照上海构件库, 这里分别给出如表1和表2所示的用户反馈信息表和构件基本信息表。

对以上两个构件数据表进行集成处理, 初步整合成为构件模拟数据集, 然后对模拟数据集中的数据进行选取、预处理、转换、消除冗余和重复数据等一系列构件数据准备工作, 再通过将连续值进行离散化、筛选对数据挖掘有用的属性等操作, 最终得到如表3所示构件样本数据集合。

3.2 ID3算法的执行

本文采用C语言实现ID3优化算法, 并将集成处理后的构件样本数据集合作为ID3算法执行时的训练集。样本数据集合中包含的决策属性和分类属性等详细信息如表4所示。

利用ID3算法实现构件库分类和预测实例中, 计算每个决策属性的信息增益是实现ID3算法的关键步骤。执行ID3算法, 生成一棵如图1所示的决策树。

4 结语

本文通过ID3算法与构件库管理系统结合, 将决策树算法应用于构件库当中, 从生成的决策树中提取大量构件基本信息背后的知识规则, 进而可以辅助构件复用者方便准确快捷地做出理想复用决策。构件复用者平时所关注的影响构件复用的各种因素与通过ID3算法所提取的构件背后的信息相一致, 进而体现了决策树分类方法中ID3算法在构件库应用中的实用性和有效性。

摘要:随着人们对数据挖掘理论知识的不断研究和探讨, 数据挖掘技术和应用领域日趋成熟和广泛。在数据挖掘技术中, 决策树方法是用于分类和预测的重要方法之一。本文对决策树构造方法中最为常用的ID3算法进行分析和研究, 并将ID3算法在构件库中进行应用, 证明了决策树分类方法在构件库领域中的应用前景。

关键词:数据挖掘,ID3,构件库

参考文献

[1]杨会志.数据挖掘技术的主要方法及其发展方向[J].河北科技大学学报, 2000, 21 (3) :77-80.

[2]朱绍文, 胡宏银, 王泉德, 等.决策树采掘技术及发展趋势[J].计算机工程, 2000, 10, 26 (10) :1-3.

[3]朱玉全, 杨鹤标, 孙蕾.数据挖掘技术[M].南京:东南大学出版社, 2006, 11.

[4]陈文伟, 黄金才.数据仓库与数据挖掘[M].北京:人民邮电出版社, 2004, 1.

上一篇:青年职业成长下一篇:组合式空气处理机