计算机数据审计的探秘

2024-12-23|版权声明|我要投稿

计算机数据审计的探秘(通用6篇)

计算机数据审计的探秘 篇1

数据挖掘就是从大量的数据中发现知识,在这些随机的数据中提取隐含在其中人们不知道,且有用的知识。随着科技发展,一些被审计单位的应用系统中存有大量的电子数据,所以相关人员应选取合适的数据挖掘技术,在这些杂乱的数据中寻找有价值的审计信息,这是审计工作的重点。近年来,相关学者对数据挖掘的计算机审计方法进行探讨,总结如下。

一、计算机审计技术

计算机审计技术,是指通过计算机完成一系列审计工作的计算,从大体上讲,主要包括数据转换和验证。计算机审计的目的分析数据和整理数据,最终获得审计证据。审计的最重要步骤是数据分析,这个过程直接影响审计结构。

在计算机审计中,数据的分析方式是审计工作中最重要的步骤,审计人员应掌握数据的分析思路,并将自身的审计能力和水平发挥出来。从审计事业的角度来讲,能够给审计思路进行正确和深入的总结是体现计算机审计整体发展水平的重要内容。审计人员应从设定计算和限定条件的过程中,创新审计思路,由此判断审计单位经济活动的真实性和合法性,然后做出合理的判断。

二、基于数据挖掘的审计方法

随着计算机审计理论的不断发展和实践的不断完善,很多计算机审计方法被合理的融入到审计工作中,由于实际工作的需要和相关技术的发展,数据挖掘技术被尝试性地引入了审计过程当中。审计人员通过数据挖掘给审计工作的创新带来了新的突破,现将数据挖掘计算的计算机审计方法归纳如下,如图1所示。

数据挖掘技术能提供高效的方法,让审计人员在面对大量而复杂的审计数据时,拥有宽广的思路。数据挖掘技术在审计项目中主要有两大作用:一是在海量的数据中寻找有用的知识作为审计线索;二是直接找到孤立点。

计算机审计方法因为数据挖掘技术的应用而有所完善,并解决了很多计算机审计方法中的缺点。我国正处于“问题导向型”政府审计的环境中,计算机审计的目的是发现一些异常数据明确被审计单位的业务活动是否具有合法性和合规性。数据挖掘技术在计算机审计中,是为了找出一组异常和孤立的数据,由此获取知识丰富现有的审计知识,并完善业务逻辑等方面。

(一)查询式

在计算机审计方法中,最常被使用的是查询式。这种方法主要是审计人员将采集到的被审计单位的数据,在整理后存入审计人员的数据库,然后编写成SQL语句,进行灵活的查询,由此更加有效的利用数据挖掘技术进行查找和分析,并对记录进行累计、基数,综合计算其最大值和最小值,连接不同的表格,运用函数编写公式,从而生成疑点再进行核实。

这种审计方法的核心技术是掌握SQL语句,该方法的主要对象是关系数据库的二维表。该方法对审计人员的SQL语句的掌握能力要求较高,如何审计情况比较复杂,那么SQL语句也会变得复杂,步骤也较多。这种方法的图形数据很少,结果无法直观的体现出来。例如在以此农村信用社贷款的审计过程中,审计人员在将数据导入整理后,想在贷款数据表输入对应的查找条件,并对应写出转换后的SQL语句。

(二)验证式

这种审计方法需要审计人员先提出自己的假设,然后采用一定技术和方法进行验证和否定这个假设。这种假设到验证的分析方法在日常生活中很常见,在审计工作中,应充分分析这种审计方法的关键,并提出相关合理的假设,假设的提出与审计人员的职业判断有一定关系。例如在某大型酒厂销售的真实性审计中,酒厂标准的酒包装是每盒1瓶,每箱6瓶盒,每件6盒,所以可以得出1件=1箱=6瓶=6盒。由此审计人员能够得到假设,在酒厂进行销售期间,酒产品的数量和消耗的包装物数据应该有一定比例关系,然后在通过这一假设,验证酒厂销售收入情况是否真实。如果审计数据过于复杂,就无法简单的假设,那么可以使用多维分析技术进行准确的分析。

所以,审计人员运用数据挖掘分析和计算审计数据,并找出数据的规律和特点,然后通过相关方法,将这些数据整理成图形或报表展示出来,根据这些内容总结审计经验,建立审计经验库,或是得出新的审计经验,并对这种经验的合理性和准确性进行判断。审计人员应根据审计经验进行适当的更正,并推翻之前不够准确的审计经验,重新挖掘和分析,进行总结归纳,由此可以得出,数据挖掘技术的工作可能是一个不断重复的过程,并且是对目前计算机审计的一种补充。

三、结束语

通过上文对数据挖掘的计算机审计方法进行分析,可以得出,这种数据挖掘技术能够提高审计工作的效率,并为审计人员开阔审计思路。审计人员应加大挖掘的深度和广度,获取更加详尽的数据,在这个过程中,还要研究数据挖掘软件的各种需求,与审计实践相结合,脱离数据和软件的思路,重新从审计的角度,总结信息系统和数据的特点,开发专门的数据挖掘软件。由此更好的为审计工作服务,使审计结果更加准确和真实。

摘要:本文主要对数据挖掘的计算机审计方法进行分析,总结了计算机审计技术,并详细阐述了基于数据挖掘技术的计算机审计方法,其中主要方法有查询式和验证式两种,审计人员可以根据审计的实际情况科学选择,确保审计结果更加准确而真实,由此提高审计工作的工作效率。

关键词:数据挖掘,计算机,审计方法

参考文献

[1]洪天一.基于数据挖掘的计算机审计方法研究与实现[D].电子科技大学,2011(10):164-165

[2]杨录强.基于数据挖掘的计算机审计方法研究文献述评[J].中外企业家,2012(5):105-106

[3]王媛.基于数据仓库与数据挖掘技术的计算机审计模型及其应用研究[D].东北财经大学,2011(10):187-188

计算机数据审计的探秘 篇2

常用的计算机辅助审计技术可以分为两类: 一类是验证程序/ 系统的CAATs,即面向系统的CAATs;另一类是用于分析电子数据的CAATs,即面向数据的CAATs。 数据分析是计算机信息化审计的主要审计方法。 数据分析不仅是一种技术和方法,更是一种思维方式的运用和体现。 审计署绩效报告(2014 年度)明确推广“总体分析、发现疑点、分散核实、系统研究”的数字化审计方式,有效提高了审计质量和效率。

计算机辅助审计的数据分析技术, 主要是依据数据分析模型进行数据挖掘。 通过对业务系统数据进行采集、清洗、整理、分析,从而发现疑点和线索,在审计实践中,笔者探讨了计算机辅助审计常用的系统对账审计模型、 重号查找模型、 断号查找模型、班福(Benford)定律分析模型的应用,从中找到了审计的技巧和捷径, 现以卫生计生系统中的医院业务数据、 财务数据为背景,重点对这四种审计方法模型进行介绍。

1系统对账审计模型

由于医院财务系统与业务系统、 业务系统之间是相对独立的,财务数据与业务数据存放于不同的数据库表,二者并不完全一致,如放射登记系统和收费系统、病人自助缴费系统和收费系统之间的数据,这需要对业务系统之间的数据定期对账。 可是,在实际工作中, 存在财务数据与业务数据对某一具体指标的核对存在一定的难度,然而,通过建立系统对账审计模型,就能轻松地对不同系统之间的数据进行查验复核。

建立系统对账审计模型,即通过相关的业务数据表,通过各表主键联接从而得到审计所需的分析字段, 判断审计疑点是否存在, 这种系统对账审计模型最关键的是找准各表之间存在的关联字段。 在实际工作中,主要有SQL查询法和Excel函数查找法。

1.1 SQL查询法

假设在同一审计期间,门诊收入表(mzsr)有sj_no、name、收费项目、income_mz等字段, 病人自助系统有自助缴费记录表(zzjf),有mz_id,card_no、zzjfe等字段。 两表共同的关键字段是门诊号即sj_no和mz_id。

Select sj_no,mz_id,income_mz,zzjfe from mzsr,zzjf where sj_no=mz_id and income_mz<>zzjfe

1.2 Excel函数查找法

格式:INDEX(参数1,MATCH(参数2, 参数3,0))

门诊收费表有门诊号、姓名、收费项目、金额等字段,病人自助系统有自助缴费记录表,有门诊号,姓名、医保卡号或银行卡号、金额等字段。 两表共同的关键字段是“门诊号”。 参数1 为收费金额单元格范围引用,参数2 为当前表“门诊号”单元格,参数3 为门诊号单元格范围引用。 其中MATCH(参数2, 参数3,0)是返回当前表“门诊号”在需查找收费金额的收费表门诊号单元格范围引用的位置序号, INDEX(参数1,“找出的位置序号”)是返回需查找金额的收费表收费金额单元格范围引用相应单元格的数值(Value)。

如以门诊收费表为当前表, 自助缴费记录表为需查找缴费金额的表,没有找到表示门诊收费表有收费数据,自助缴费记录表没有收费数据,可能存在自助缴费失败,金额不一致也表示部分自助缴费失败。 主要技术是关联两表字段“门诊号”查找收费金额表,比较是否存在门诊收费表有收费数据,而自助缴费记录表没有收费数据,分析结果可能存在自助缴费失败,金额不一致也表示部分自助缴费失败。 并对查询结果与相应的财务数据核对,进一步判断审计疑点。

2建立重号查找模型

医院财务系统、 业务系统生成的数据, 有很多是连续型数据,如门诊收据号、住院收据号、记账凭证号、门诊号、住院号等。建立重号查找模型即按照连续型数据既不能重号也不能缺号的规定。 手工审计方式主要采用抽查的方式进行检查,在计算机辅助审计中,主要是采用SQL查询语句或Excel数据分析工具,可以对全部的连续型数据进行重号、 断号查验, 找出重号或断号后,再以纸质凭证进行查验。

2.1 SQL统计函数查询法

设门诊收入数据库表mzsr中有收据号sj_no为连续型数据, 利用SQL语句可找出表中重号的收据号, 其主要统计函数count(sj_no),执行SQL语句后, 数据记录数大于1 的结果就有可能存在重复的收据号;如果设立收据号条件大于1,就可以查询出重复收据的次数。

步骤一:查询重复收据号记录

select distinct sj_no,count(sj_no) from mzsr group by sj_no

步骤二:查询重复收据的次数

select sj_no,sl from (select sj_no,count (sj_no) as sl from mzsr group by sj_no) as chtable where sl > 1

2.2 Excel数据透视表法

在Excel环境下,查找重号最简单的方法是利用Excel提供的数据透视表向导功能生成数据透视表。 其操作过程如下:假设Sheet表名为 “重号”, A列为门诊收据号数据,A1 为 “门诊收据号”,通过“数据”菜单(Excel2003)下“数据透视表和数据透视图”可启动数据透视表向导功能, 在数据源区域对话框中输入 “重号! ¥A:¥A”,在布局对话框中,拖动字段 “门诊收据号”到 “行(R)”,同时拖动字段 “ 门诊收据号” 到 “ 行(D), 字段汇总方式设置为“计数”,汇总结果中大于1 的就是找出的门诊收据重号,与上述SQL语句中第一种结果完全相同。

3建立断号查找模型

所谓断号查询, 一般是指在一组或多组连续的流水号码中找出中间缺少的号码。 在审计过程中,建立断号查找模型的思路是:断号就是在当前数据库的流水号中不存在的号码,同时这些号码又可以理解成当前数据库流水号中某一个号码加1 后得不到的号码。 这里主要介绍SQL断号查找验证法和Excel断号查找验证法。

3.1 SQL断号查找验证法

假设有了上述门诊收据号数据库表, 下面SQL语句可找出表中断号的收据号。 本文测试表中断号为8、17—19, 得到结果“8—8”或 “17—19”。

SELECT sj_no1, (select min(sj_no)-1 from mzsr where sj_no>sj_no1) assj_no2 FROM (SELECT sj_no+1 AS sj_no1 FROM mzsr WHERE sj_no+1 not in (select sj_no from mzsr) and sj_no <(select max(sj_no) from mzsr)) AS dh。

3.2 Excel断号查找验证法

在Excel环境下,对断号筛选步骤如下:设A列为门诊收据号,数据从A2 开始,在B3 单元格输入公式:IF(A3-A2-1>=1,A2+1&"-"&A3-1,""),使用填充柄填充至所有收据号区域,即可找出单个断号或连续的几个断号, 本文测试表中断号为8、17—19,得到结果同SQL语句查询结果。

4班福(Benford)定律分析模型

Benford定律是指一个没有人为规则限制生成的一组数据数列,数列的首位数字n之和遵循lg(1+1 / n)的规律,数字1 出现的频率为lg(1+1 / 1)的绝对数30.103%,数字2 出现的频率为lg(1+1 / 2)的绝对数17.609%,等等。 因此,根据班福(Benford)定律“人们处理的数值数据中,首位出现较小数字的可能性比出现较大数字的可能性大”建立审计分析模型。 如,门诊收入、住院收入等利用SQL或Excel查询数字出现的频率, 从查询结果中会发现,如果有人为的故意则破坏了这个定律,审计人员必须以此为线索做深入调查,以获取证据。

4.1 SQL查询首位数字出现的频率

设门诊收入数据库表mzsr中有门诊收入字段income_mz,下面SQL语句可分析表中收入数据首位数字1-9 每个数字出现的频率。

select bfsz,count (bfsz) / (select count (income_mz) from mzsr)*100 as bfs from (select substing (income_mz,1,1) as bfsz from mzsr) as bf group by bfsz

上述语句可统计出数据系列首位数字1-9 每个数字出现的频率。

4.2 Excel运用COUNTA()函数功能

在Excel环境下, 设A列为门诊收入, 收入数据从A2 至A10 000,在B2 单元格输入公式:Ieft(A2,1),填充至B10 000;在C2 至C10 输入1-9,在D2 单元格输入公式:COUNTIF(SBS2:SB S10 000,C2), 填充至D10; 在D11 单元格输入公式:COUNTA(¥BS2:SBS10 000) ,在F2 单元格输入公式:D2 / SDS11,填充至F11。 则F2 至F10 为收入数据首位数字1-9 每个数字出现的频率。

以上探讨了卫生计生系统常用的几个数据分析模型, 增强了审计准确度,节约了审计时间,提高了审计工作效率。 SQL语句模型适合有数据库基础审计人员使用,Excel分析模型适合普通审计人员使用。 其中,系统对账模型属于验证业务数据真实性的审计分析方法,重号分析、断号分析、班福定律分析属于发现线索的审计分析方法, 大数据时代的审计将更是数据分析模型广泛使用的审计时代。

参考文献

[1]陈伟,张金城,QIU Ro-Bin.计算机辅助审计技术(CAATs)研究综述[J].计算机科学,2007(10):290-294.

计算机数据审计的探秘 篇3

一、国家审计员进行审计工作中面临的多方挑战要点分析

应该了解到, 当前审计部署工作如火如荼的进行着, 连动式大型审计项目逐渐拓展开来, 最为常见的包含了商业银行审计内容、海关审计内容和国家税收审计内容以及社保资金审计内容等, 借助设计方案正常合理实施, 行业发展现状和审计工作前进趋势才能如实掌握, 之后在此基础上充分发挥出现国家审计治理政策中的免疫系统功能。数据集中信息资源要素和共享模式要素二者尤为重要, 大型商业银行机构与部门实现了财务信息数据集中, 海关领域可进行了数据集中, 国税部门则实现了数据集中存储。

数据集中存储信息资源配置模式利于资源统一规划资源投医调度, 随之为实现全面、综合信息化目标而作出了强有力支撑, 但是大数据“四V”特征中, 变化环节则主要涵盖了数据存储变化内容、数据传输变化内容和数据分析变化内容以及数据处理变化内容等, 数据量不断增长, 其为归集操作和整理操作以及审计单位电子数据信息利用工作带来了多方调整, 主要成因即为数据高度集成, 老旧式审计小组以单位为主体进行审计模式执行, 但是无法发挥其原始效用, 所以作为国家审计人员, 应从实际角度出发, 借助大数据进行计算机审计质量提升和审计效率提升。

二、新时代下大数据在国家计算机审计员工作中的科学灵活化应用策略解析

(一) 全面修缮数据控制应用质量

在大数据环境下, 探讨提升数据控制质量显得尤为重要, 毕竟这将直接决定后续计算机审计工作实效性, 为了确保这部分数据质量和利用效率得以提升, 需要事先做好以下准备工作:

第一, 快速构筑起完善样式的电子数据存储应用系统, 针对内部数据收集、整合、传输等流程加以严格化监管认证, 保证其中检修和测试时机的精准性, 使得该类信息系统得以长期高效运行, 避免数据确认过程中出现任何纰漏基础上, 加以全方位校验评估, 避免以往安全威胁的重新介入。

第二, 立足于数据信息自身特性进行后台计算机审计工作形式对接处理, 维持数据收集的完整性。经过直接性数据收集模式操作之后, 尽管说内部工序流程衔接较为快速、便捷, 不过经常会面对系统性能干扰隐患, 所以对于一些被审计机构来讲, 大多数情况下不会沿用该类模式。而在被审计数据收集流程中, 也能够利用数据文件交换或是信息备份模式处理, 不过被审计机构完全有可能在其中进行数据更改, 使得数据信息至此失去应有的真实可靠性。

经过以上内容论证可以清晰判定, 在开展大数据信息手机事务环节中, 始终存在较大安全隐患, 所以需要针对数据质量加以细致化校验调试, 必要时直接结合法律武器督促被审计机构签订承诺书, 进一步掌控后期供应电子数据的真实、实效性。

(二) 快速搭建起专业化的大数据校验解析平台

审计结果评价, 主要是针对计算机审计结果进行综合性校验评估的行为模式, 因为计算机审计在提升审计质量前提下可以更好地节约注入成本, 因此需要借助审计评估体系进行审计工作实效改善。长此以往, 预设的审计工作内容得到更为合理地安排, 将工作重点予以明确化阐述之余, 更加大了对基层机构业务的监督力度, 使得以往频繁滋生的资源浪费问题得以顺利消除。归结来讲, 透过审计结构合理性评估体系构建, 能够针对关键性数据信息加以动态化跟踪校验, 使得预设的远程收集整理和责任负责机制推行指标得以有序衔接贯彻, 最后合理保障大数据控制应用质量。

(三) 长远数据规划, 侧重数据深度分析

较为正确的做法是, 作为国家审计人员, 应注重数据信息获取和数据建设以及数据合理运用, 深度加强审计信息资源结构体系创新, 审计机构则应制定相应标准, 循序渐进的实现不同类型审计机关审计管理目标, 达成数字化审计业务执行和现代化审计业务执行, 将国家审计数据规划工作做好, 全面掌握大数据存储知识和大数据分类知识以及大数据挖掘知识等, 而后也要做好快速调用工作和决策支撑工作等, 通过大数据处理资源的完美整合来进行大数据处理工作协调和数据分析机制协调, 构建审计云数据存储平台, 更好更优的为审计工作服务, 为社会服务, 实现真正意义上的审计数据分析精准化和审计数据分析深层化。

三、结语

综上所述, 经过我国信息技术飞速革新发展, 大数据开始引起愈来愈多行业领导的重视, 因此涉及这方面技术研究活动全面布置拓展。如公共平台和审计结构评价体系的构建, 使得数据控制质量和审计工作效率得以同步大幅度提升, 有关预设的计算机审计工作规范标准化控制目标就此顺利落实, 令计算机审计工作就此沿着标准长远化方向不断过渡扭转。

摘要:经过当前互联网、云计算等技术飞跃革新发展之后, 有关智能终端、应用型商店、视频监控等设备得以全方位普及沿用, 国际范围内的数据量更是大幅度增长, 如此大规模的数据已经成为当下时代发展的热点课题。与此同时, 更对审计职务形式提出愈加深刻的挑战, 计算机审计开始迎来全新发展机遇。由此, 笔者决定针对如今大数据对计算机审计工作实际影响细节加以深入探讨, 同时联合实际状况探讨出科学完善的计算机审计应用方案, 希望借此为相关审计主管和基层审计工作人员职务目标落实, 提供较为丰富妥善的指导性建议。

关键词:大数据,计算机审计,应用质量,推进措施

参考文献

[1]史国姣.计算机审计风险的成因及规避策略探讨[J].新经济, 2015, 13 (11) :166-175.

[2]李秋娟.浅析计算机审计实施的问题及对策[J].现代国企研究, 2015, 28 (02) :77-89.

[3]钟娅.如何利用大数据推进计算机审计[J].现代工业经济和信息化, 2015, 14 (12) :134-147.

计算机审计中数据处理新方法探讨 篇4

1 基于孤立点检测的数据处理方法探讨

1.1 孤立点检测的定义及原理

通常情况下,我们进行数据的处理时,往往会遇到数据源中有一定数量的异常值出现,它们和其他的数据是不同的,我们就把这样的数据称之为孤立点。孤立点就是在数据源中和其他数据不同的数据,它们会使得人们对这些数据进行怀疑,怀疑它们不是随机偏差得来的,它们可能是在不同的机制中产生的。孤立点也可能是由于度量或者在执行命令时由于出现错误而产生的数据。对于孤立点进行检测是进行数据挖掘的一个重要的方面,通过挖掘我们可以找出和其他的数据不同的对象,这些问题往往是被用于信用卡欺骗检测以及贷款的审批等等各项领域。孤立点检测就是由于在审计分析时,疑点数据往往表现为孤立点,所以,我们可以通过数据中的孤立点去达到审计的目的。

对于孤立点检测的数据处理方法的原理,我们可以总结如下:首先,就是把需要被审计的数据拿出来进行分析,选择使用孤立点的检测算法,把孤立点的检测算法的参数和孤立点识别的规定设置完成之后,就是要把需要被审计的数据输送到孤立点的检测系统中。数据的清理模块开始用算法程序对于需要被审计的数据进行适当的清理,它会把重复的数据以及错误的数据进行清理,这样就会提高孤立点检测的准确度。然后,孤立点模块就开始调用孤立点检测算法对数据进行检测,判断这些数据是不是孤立点。假使判断这些数据是孤立点,那么就会有审计的工作人员进行第二次判定,看一下它们是否可疑,因为并不是所有的孤立点都是真正意义上的孤立点的,有些可能是由数据的变异得来的;假使这些数据不被认为是孤立点,那么它将会被重新的导入到数据源中。

1.2 孤立点检测中的关键问题探讨

通过检测原理我们可以知道,规则集和算法库都是基于孤立点检测的数据处理的核心,规则集就是用来存放孤立点检测中的规则,我们对于规则集的实现可以有以下的两种方式:1)通过规则语言实现;2)通过在数据库中去创建一个数据表实现。在处理被审计电子数据的过程中,可以根据不同的情况去把规则集中的定义进行不同的修改,使得该系统具有不同的功能。算法库就是用来存放孤立点检测算法和清理算法的,许多的算法都存放在数据库中,可以根据不同的情况进行不同的选择。

1.3 对于孤立点检测方法的探讨

在孤立点检测的数据处理中,怎样去做好检测数据源中的孤立点是比较关键的一步,在我们的平时应用中,主要有以下几类:1基于分布的检测方法。基于分布的方法把已经给定的数据集一个分布的模型,之后可以根据这个模型对于数据集进行检测,假使和分布不相符,就可以认为它是一个孤立点。但是,这种方法是有一定的缺陷的,我们必须知道数据集的参数和分布参数等数据才可以进行检测。2)基于距离的检测方法。这种方法的原理是假如一个点和数据集的大部分的点都有一定的距离,那么这个点可能是被孤立的,称之为孤立点。和基于分布的方法相比较而言,这种检测的方法也是基于了分布的方法,当一个数据集不在任何的标准之内时,这种方法也是可以发现孤立点的。3)基于密度的检测方法。基于密度的孤立点的检测方法是在基于距离的基础上发展起来的,它是把两个数据点之间的距离与另一个给定的范围相结合,得到一个密度,之后再根据密度对于这个点进行判断。4)基于深度的检测方法。这种方法是把数据映射到n维的空间中去,并把它们都设定为一个深度,可以根据深度的不同去划分它们的范围,由于异常的数据存在较浅的层次中的,所以,我们可以把深度较浅的数据作为孤立点的可能对象进行研究。这种方法只是针对于二维空间和三维空间进行研究的,但是对于更多维的空间有一定的约束性。

2 基于数据匹配的审计处理方法的探讨

2.1 数据匹配技术

在审计数据的过程中,可能会出现多个相似的被审计的数据,这些数据是重复的,在我们的审计过程中,这些数据可能就是我们需要去查找的可疑的数据。例如,我们在审计时,有一些数据出现在了第一个数据中,那么它就不会再出现在第二个数据中。所谓数据的匹配技术就是指把从不同的数据中采集到的数据进行相应的匹配,我们从这些数据中去查找相似的数据。利用这一技术我们可以去发现舞弊的事件。在我国的数据匹配技术主要是应用在一些检测数据中的相似数据。但是,在审计中并没有得到广泛的应用。

2.2 数据匹配技术的原理

在数据的审计过程中,首先可以根据对被审计数据源的分析,把需要比较的两个数据进行整理,从中选取他们的公共字段,之后再应用清理算法技术对于两个数据进行数据的清理;做好记录,要使用比较模块从算法库中去调用比较相似的进行检测算法,当把字段选取完毕之后,让他们去执行数据之间的比较,可以根据事先定义的规则,把相似的数据检测出来。

3 可视化的数据审计技术的探讨

随着科学技术的不断完善,在进行数据的审计过程中,出现了一种可视化的数据处理技术。虽然原始的审计技术能有效的对电子数据进行审计,但是并不可以直接的去观看到处理的效果,而这种可视化的工具却可以提供直接而简洁的机制去表现出大量的审计信息,这些对于重要的数据定位是有一定的作用的。可视化的工具可以使得人们在审计时更加清楚的进行工作,它提供了多个窗口的可视化的图像,这有助于审计人员进行更直观的观察和处理,并从中获得审计结果,因此,可视化的数据审计工具是非常必要的。在计算机审计的处理过程中,它可以减少人们的工作强度,使得工作人员们的工作效率大大提高。应用可视化的数据审计方法就是根据一定的审计分析的模型,可以更加具体的把被审计的数据展现到工作人员的面前,使得工作人员更加清楚的进行数据的审计和分析。对于一些审计数据,首先可以根据自身的需要采取一定的方法进行数据建模,通过这些模型审计人员可以很清楚的看到数据中的可疑数据,然后,把这些数据提取出来,由专业的人员进行审计专业的再判断。可视化的数据审计技术是比较先进的,由于它可以把审计人员所关心的数据更加直观的表现在审计人员的面前,对于审计人员发现审计线索是很有帮助的。

4 基于数据规律的审计数据方法探讨

在审计的过程中,有时也会出现一些数值型的需要被审计的数据,这些数据可能是遵循了一定的规律,所以,在进行审计的过程中,我们对于这些数据是可以进行测试它们的数据分布的,通过寻找规律我们可以看一下它们是不是符合它们应该符合的一些规律,假使没有规律或者不符合规律,就说明这些数据中式含有可疑的数据的。另一方面,在审计的过程中,也可以根据这一数据出现的频率去观测和检验这一组数据是不是有所异常。之后,审计人员可以把不符合规律和出现异常的数据提取出来,进行进一步的检测,最终确定审计的线索。

摘要:在计算机的数据处理中,出现了许多的新方法,该文主要是针对几种新方法做了一些探讨。第一种是基于孤立点检测的数据处理方法,主要是介绍了它的定义和应用的原理,之后又对于它的关键技术和检测方法进行了研究;第二种是基于数据匹配的审计处理方法,主要介绍了它的处理方式和应用原理;第三种就是可视化的数据审计技术,这是一种相对先进的检测技术,主要对于它的工作性能进行了简单的介绍;最后一种就是基于数据规律的审计数据,简单的介绍了它的工作原理和方法。在计算机的数据处理中,我们还有许多的方法可以应用,只有在实际的工作中不断的积累经验,不断的提高自己的技术水平,才可以把审计工作做得更好。

关键词:计算机审计,数据处理,新方法

参考文献

[1]陈伟,陈耿,朱文明.基于业务规则的错误数据清理方法[J].计算机工程与应用,2005(14).

[2]张福广,李强.浅谈计算机审计[J].中国卫生经济,2007,19(11).

计算机数据审计的探秘 篇5

一、使用金算盘软件集团账套核算情况

我区自2007年起实行会计集中核算, 所有区级部门、街镇、学校的财务账由区财政国库集中收付核算中心统一核算, 使用的财务软件是重庆金算盘软件公司开发的金算盘8E/ER P系统 (以下简称金算盘8E) , 在具体核算时使用集团账套分部门核算, 分县级部门、街镇 (行政、总预算) 、学校四大块核算。金算盘8E的后台数据库为oracle, 版本号为9.21, 金算盘8E系统提供了两种备份方式, 一种是备份oracle格式, 其文件后缀名为dm p;另一种是备份为A ccess格式, 其文件后缀名为gdb。利用审计署金审工程服务网站下载的金算盘8E财务数据采集模板不能将财务数据采集到A O软件重建账套, 导致审计人员不能将财务数据倒入A O软件进行查询分析, 给审计查询分析设置了障碍。财务数据的采集成为能否成功推广应用A O软件的一个关键, 通过实践成功将该数据采集转换, 为我区利用计算机技术审计提供了条件。

二、采集数据存在的问题

审计人员对采集备份的access财务数据分析发现, 系统导出的access备份数据中有一张voucher表 (凭证主表) 仅有一条数据, 且导出的其他账套也存在同样的问题, 即一个账套一个会计年度仅能导出一条凭证记录, 导致该财务数据的采集不能应用金算盘8E财务数据采集模板。

三、采集数据的方法步骤

按照财务数据采集的方法之一, 从其后台数据库直接获取数据库数据来采集财务数据, 针对数据库数据采集财务数据必需获取的三张表, 即科目余额表、会计科目表和凭证表。采集三张表的方法步骤为:

一是在金算盘8E系统主菜单下选择“文件-数据导出-基础设置-账务-凭证-机构-编码”导出凭证表。

二是在金算盘8E系统主菜单下选择“文件-数据导出-基础设置-科目-机构-编码”导出会计科目表。

三是在金算盘8E系统主菜单下选择“文件-数据导出-财务管理-总分类账-账册报表-科目余额表-打印-选择输出类型 (一般选择为EX C EL) -输出文件”导出科目余额表。

需注意, 由于该系统设置是集团账下分单位核算, 采集导出的凭证表和会计科目表时要按该单位编码设置筛选, 进行数据分离, 导出该单位数据, 凭证表和会计科目表数据导出的格式文件为D A T文件, 选择EX C EL打开方式, 即可分析数据。

四、分析整理字段

(一) 整理采集的财务数据三张表

1.根据导出凭证表和会计科目表时随同导出的配置设置 (记事本) 分析表的字段含义。凭证表文件名为V oucher.dat, 共有37个字段, 其含义分别为字段1=期间、字段2=凭证日期、字段3=凭证字、字段4=凭证号、字段5=摘要、字段6=科目代码、字段7=货币代码、字段8=汇率、字段9=原币金额、字段10=借方金额、字段11=贷方金额、字段12=数量、字段13=单价、字段14=制单人、字段15=审核人、字段16=过账人、字段17=附单据数、字段18=是否已过账、字段19=模版、字段20=行号、字段21=单位 (实际为科目代码辅助码) 、字段22=部门、字段23=员工、字段24=统计、字段25=项目、字段26=付款方法、字段27=票据号、字段28=原币付款金额、字段29=凭证来源、字段30=冲销凭证的来源凭证、字段31=待打印、字段32=作废标志、字段33=错误标志、字段34=凭证册号、字段35=票据日期、字段36=来源机构、字段37=机构。

会计科目表的文件名为A ccount.dat, 共有22个字段, 其含义分别为字段1=科目代码、字段2=科目名称、字段3=科目类别、字段4=科目级次、字段5=借贷方向、字段6=数量单位、字段7=币别、字段8=科目全称、字段9=末级标志、字段10=科目性质、字段11=多币种核算标志、字段12=数量核算标志、字段13=单位核算标志、字段14=部门核算标志、字段15=员工核算标志、字段16=统计核算标志、字段17=统计核算标志、字段18=停用标志、字段19=现金流量标志、字段20=期末调汇标志、字段21=计算科目利息标志、字段22=辅助码。

科目余额表共有9个字段, 其含义分别为字段1=科目代码、字段2=科目名称、字段3=单位 (实际为科目代码辅助码) 、字段4=单位明细 (实际为科目明细) 、字段5=期初余额、字段6=借方发生额、字段7=贷方发生额、字段8=借贷方向、字段9=期末余额。

2.对三张财务数据表的必导字段赋值, 以便取舍字段, 该步操作可在EXCEL或access中完成, 同时删除不需用字段。科目余额表必导字段为科目编码、期初余额, 余额方向;会计科目表必导字段为科目编码、科目名称、余额方向;凭证表 (该方法采集的凭证表为单张凭证表) 必导字段为科目编码、摘要、凭证类型名称 (凭证表中为凭证字) 、凭证流水号 (该表中为凭证号) 、凭证日期、借方发生额、贷方发生额。

该步操作中需注意, 该账套是使用的集团账套, 导出的会计科目表是分县级部门、街镇 (行政、总预算) 、学校四大块的会计科目表, 可以对照该单位的科目余额表的科目情况删除不需用科目, 简化后面的操作;由于该财务软件系统在设置时采用了辅助账的核算方式, 对银行存款、暂付款 (应收账款) 、暂存款 (应付账款) 等的明细科目实际在科目余额表中字段3和凭证表中字段21中进行了反映和核算, 为此, 科目余额表中字段3=单位 (实际为科目代码辅助码) 与凭证表中字段21=单位 (实际为科目代码辅助码) 是一一对应的, 不能删除。

3.分析科目代码结构级次 (会计科目编码规则和科目长度) 后作合并字段处理。凭证表和科目余额表均有科目代码和科目代码辅助码 (即为凭证表、科目余额表字段中的单位) 进行核算。需对科目代码和科目代码辅助码合并为1个字段。

方法一:使用access查询功能进行处理。首先将凭证表和科目余额表分别导入access中, 然后使用查询功能合并字段, 合并后的字段命名为科目编码, 处理字段方法为“科目编码:IIf ([科目代码辅助码]Is N ull, [科目代码], [科目代码]+R ight ([科目代码辅助码], *) ) ”, 其中“*”表示提取科目代码辅助码的长度, 生成新凭证表和科目余额表, 导出为EX C EL。

方法二:在A O系统进行处理。首先将凭证表和科目余额表导入access或在EX C EL中, 利用其查找替换功能将“科目代码辅助码”需要保留的科目长度保留, 不需用的进行替换, 如“科目代码辅助码”为508001, 长度6, 经整体分析该套账的科目编码的规则应为3-2-3, 由于科目一级编码已为3位, 需2、3级科目明细, 为此需保留“科目代码辅助码”长度5位 (即二、三级明细科目分别为2位、3位) , 将“508001”中的“508”替换为“08”即可。其次, 待下面的几步处理完成后导入A O系统中再进行科目代码与科目代码辅助码字段的合并, 利用数据字段处理-字段合并-生成新的科目编码字段。

在access操作中需注意, 将凭证表、科目余额表中的借方发生额、贷方发生额、期初期末余额在设计视图中由文本型转化为数字型, 设置字段大小为双精度型, 小数位数为自动。在access或EX C EL中要删除科目余额表中的资产小计、负债小计、净资产小计、收入小计、支出小计、合计等行。

4.处理会计科目表, 由于会计科目表中的暂付款 (应收账款) 、暂存款 (应付账款) 等科目代码为一级或二级代码, 没有与科目余额表和凭证表中的科目代码 (科目编码) 级次一一对应, 需对会计科目表进行处理。处理方法为以科目余额表的科目编码为基础, 增加科目表中科目代码的级次, 设置增加科目代码、科目名称、余额方向, 科目代码以科目余额表中的科目编码进行设置, 科目名称以科目余额表中字段4单位明细 (实际为科目明细) 进行设置, 余额方向根据科目性质设置。

5.处理科目余额表, 科目余额表也要按科目编码级次增加相应的科目编码, 由于该科目编码已经有了末级科目编码, 需按会计科目明细级次增加相应的科目编码, 并且对科目余额表按科目编码级次汇总科目余额表。

五、将数据导入现场审计实施系统

计算机数据审计的探秘 篇6

世界上第一台电子计算机ENIAC虽然诞生于1946年,但其设计思想在1941年就已经基本完成,而发明电子计算机的思想更早在20世纪30年代就出现了。我们简要回顾这段历史,以及其中几个关键人物,以探寻计算机发明过程中的奥秘。

1936年,英国数学家阿兰·图灵发表了他那篇具有里程碑意义的论文《论数字计算在决策问题中的应用》,在文中提出了“图灵机”的构想。图灵机不是一台具体的机器,而是一种思想模型。他证明了任何可计算的函数都存在相应的图灵机,反之,不存读写头、存储带和存储带驱动装置等几部分组成。虽然图灵机的结构与动作都极为简单,但是却包含了现代电子计算机的基本工作原理。在相应图灵机的函数就是不具有可计算其函数值算法的函数。图灵机由主机、读写头、存储带和存储带驱动装置等几部分组成。虽然图灵机的结构与动作都极为简单,但是却包含了现代电子计算机的基本工作原理。

几乎与此同时,在大洋彼岸的美国衣阿华州立大学物理系的阿塔诺索夫副教授,正为计算量大增同时却没有好的计算工具而烦恼。传说中他是在一次醉酒后突然灵感大发,从而建造出电子计算机的原型。

1939年,阿塔诺索夫和他的助手贝里向学校申请了650美元作为研究经费,开始电子计算机的研制。他们把这台计算机称为ABC (意为“阿塔诺索夫和贝里的计算机”,阿塔诺索夫英文名字第一个字母“A”,贝里英文名字第一个字母“B”,计算机英文第一个字母“C”)。ABC机于1940年秋天初见雏形,正当阿塔诺索夫踌躇满志准备进一步制造出一台通用计算机的时候,第二次世界大战的战火燃烧到了保加利亚,眼看自己的祖国沦陷,他毅然放下了热爱的计算机事业,于1942年夏天投身战场。ABC机及其后续研究中断,渐渐被人们遗忘。

就在阿塔诺索夫研制ABC机的时候,他结识了在费城执教的莫克利。莫克利当时对电子计算机非常感兴趣,但未开始实践。1941年6月的一天,莫克利驱车数天,来到衣阿华州立大学,由阿塔诺索夫陪同参观了ABC机。阿塔诺索夫向莫克利演示了ABC机工作的全过程,并提供了ABC机的设计构思和相关资料。莫克利在衣阿华州立大学参观5天后离去,毫无疑问,这是一次成果丰硕的旅程。

1943年,莫克利和埃克特在得到了军方15万美元的研究经费后,正式启动了电子计算机的研制计划。这台被命名为ENIAC的计算机由莫克利负责总体设计,埃克特担任总工程师。经过几年的努力,终于在1946年设计完成,与世人见面。

随后,冯·诺依曼对ENIAC进行了几处关键改进,包括将十进制改为二进制,增添了程序计数器并且提出了中央处理器的概念和现代电子计算机的完整体系结构(即冯·诺依曼结构),并于1952年开发出了代表这些思想的计算机——EDVAC。

ENIAC中蕴涵着ABC机的很多重要思想,但是长久以来,莫克利对1941年的那次关键性造访只字未提。从20世纪60年代开始,为了讨回计算机的发明权,阿塔诺索夫开始了长达6年的诉讼。最终,在1973年,美国明尼苏达州阿波利斯地方法院大法官拉尔森裁决:ENIAC源于阿塔诺索夫的思想,莫克利和埃克特对于ENIAC的专利权无效。阿塔诺索夫终于夺回了计算机的发明权。

●电子计算机发明过程中各关键人物的关键贡献

电子计算机发明过程中各关键人物的关键贡献如下表所示。

由此可知,在计算机发明的过程中,凝结了从数学家、物理学家到工程技术人员的辛勤耕耘。对于几位关键人物,经历了半个多世纪的风风雨雨,正所谓,是非功过自有评说。图灵——虽然没有实现计算机的设计,但首先在理论上证明了现代电子计算机的可行性,奠定了其理论基础。人们称图灵为“计算机理论的奠基人”,并以他的名字来命名计算机领域的最高奖——图灵奖。阿塔诺索夫——首先制造出电子计算机的雏形,经过近10年的专利权诉讼,夺回了属于自己的计算机发明权,被人们称为“真正的计算机之父”。冯·诺依曼——发展和完善了存储程序思想,奠定了现代电子计算机理论的整体结构,被人们称为“计算机之父”。莫克利和埃克特——制造出了世界上第一台可以实用的通用电子计算机,解决了制造过程中的诸多技术难题,计算机界至今仍有一项大奖,叫做“埃克特一莫克利奖”,但是莫克利有意隐瞒阿塔诺索夫对他毫无保留的提供初始设计方案的事实,最后被撤消计算机发明专利,却是有失科学家的学术道德,为人所诟病。

作为20世纪人类最杰出发明的计算机,其诞生的历史波澜壮阔。虽然我们列举了计算机发明过程中的几位关键人物,但是计算机的复杂性使我们深刻地认识到,计算机的发明过程体现了人类诸多领域的进展及其出色的合作。至于本文标题中的问题,也许正如美国计算机科学家马丁·戴维斯所说的:“现代计算机是逻辑与工程的复杂混合体,单独挑出一个人作为发明者是可笑的。”或许这句话可以看成是对本文所提问题的一种回答。

注:本文为网友上传,旨在传播知识,不代表本站观点,与本站立场无关。若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:iwenmi@163.com

上一篇:血清酶变化下一篇:正时链系统

付费复制
期刊天下网10年专业运营,值得您的信赖

限时特价:7.98元/篇

原价:20元
微信支付
已付款请点这里联系客服
欢迎使用微信支付
扫一扫微信支付
微信支付:
支付成功
已获得文章复制权限
确定
常见问题