文献质量评价(精选10篇)
文献质量评价 篇1
脑卒中 (脑梗死) 在我国部分城市的发病率逐年增高[1]。然而有效的治疗方法至今还很有限[2]。药物是目前治疗脑梗死的主要方法, 虽然溶栓治疗取得一定效果, 但严格的治疗时间窗[3,4]是瓶颈。恢复组织血流灌注, 减轻缺血再灌注损伤, 保护缺血半暗带仍是目前努力的方向。注射用尤瑞克林即人尿激肽原酶, 是从健康男性尿液中提取的糖蛋白。临床研究证实其能激活自身激肽原酶——激肽系统, 起到扩张脑缺血部位微动脉、促血管新生、减轻神经细胞损伤等生物学效应, 目前国内拥有很多的相关报道。但是缺乏系统的评价, 本文旨在运用临床流行病学和循证医学的方法, 对尤瑞克林治疗脑梗死的文献进行评价, 以便进一步提高临床研究水平以及文献质量。
1 资料与方法
1.1 文献来源
根据国际Cochrane系统评价手册标准[5]于2011年10月10日选择万方数据库 (1989年—2011年) , 中国知网 (CNKI, 包括中国期刊网, 1979年—2011年) , 中文科技期刊全文数据库 (重庆维普, 1989年—2011年) , 中国生物医学文献数据库 (CBM, 1978年—2011年) , Pubmed (1966年—2011年) , Embase (1974年—2008年) 以及The Cochrane Library (2010年) , 以“尤瑞克林”、“人尿激肽原酶”、“脑卒中”、“脑梗死”、“急性脑梗死”、“脑血管病”、“HUK”、“Urinary Kallidinogenase”、“Urinary Kallidinogenase for Injection”为检索词进行文献检索并翻阅。
1.2 纳入与排除标准
1.2.1 纳入标准
研究设计:随机对照试验和临床对照试验, 文献中提及“随机”、“对照”、“分组”的临床研究。干预措施:尤瑞克林。研究对象:脑梗死。
1.2.2 排除标准
动物实验等基础性研究。非治疗性研究, 包括护理、个案报道、综述等。
1.3 文献筛选和资料提取
由两名评价者按预先指定的纳入及排除标准独立筛选文献并交叉核对, 如果遇到分歧, 通过协商解决或者与第三位评价者讨论进行解决。
1.4 文献质量评价
按照临床科研设计、衡量、评价和循证医学原则[5], 由两名评价者独立评价文献质量, 如有分歧时讨论解决。对纳入的所有文献, 参考Jadad评分量表[6], 如果文章中提及随机、盲法、随访 (失访) 的情况, 有一项加1分, 共3分, 在此基础上, 如果随机方法描述错误减1分, 若正确加1分, 盲法不正确减1分, 正确加1分, 总分5分, 对纳入的每篇文献进行评价。再计算出纳入文献各条标准的得分情况, 进行评价。
2 结果
2.1 论文分布年代及各个图书馆分布情况
万方数据库 (1989年—2011年) 392篇, 中国知网 (CNKI, 包括中国期刊网, 1979年—2011年) 148篇, 中文科技期刊全文数据库 (重庆维普, 1989年—2011年) 130篇, 中国生物医学文献数据库 (CBM, 1978年—2011年) 169篇, Pubmed (1966年—2011年) 0篇, Embase (1974年—2008年) 0 篇, The Cochrane Library (2010年) 0篇, 共计839篇。排除重复、动物实验等基础性研究和非治疗性研究剩余168篇, 其中文献分布年代分别为2006年1篇 (0.60%) , 2007年3篇 (1.79%) , 2008年13篇 (7.74%) , 2009年41篇 (24.40%) , 2010年65篇 (38.69%) , 2011年45篇 (26.79%) 。
2.2 纳入研究的观察对象
小于50例的研究文献为115篇 (68.45%) ;≥50例小于100例的研究文献为43篇 (25.60%) ;≥100例的研究文献为10篇 (5.95%) 。
2.3 随机对照试验方法学问题
其中146篇文献提及随机试验, 142篇文献运用随机方法正确, 3篇文献运用随机方法不正确, 有1篇文献仅提及随机, 未提及所用方法。
2.4 盲法方法学问题
其中11篇文献提及盲法, 9篇文献运用盲法正确, 6篇采用单盲, 3篇采用双盲, 有2篇文献仅提及盲法, 未提及所用方法。
2.5 失访及随访
所有纳入文献提及失访的有13篇, 其中8篇文献既有随机对照试验也提及详细失访记录, 3篇文献既有随机对照试验也使用盲法并提及详细失访记录。所有纳入文献提及随访的文献有15篇, 其中13篇既有随机对照试验也提及随访3个月记录, 1篇文献既有随机对照试验并且使用盲法并提及随访3个月记录, 仅1篇未提及随机对照试验与盲法, 但有3个月随访记录。
2.6 临床试验设计质量评估
根据Jadad量表评估所有纳入文献, 0分文献20篇 (11.90%) , 1分文献5篇 (2.98%) , 2分文献115篇 (68.45%) , 3分文献19篇 (11.31%) , 4分文献6篇 (3.57%) , 5分文献3篇 (1.79%) 。
2.7 文献中诊断标准、所选量表、疗效判定标准
2.7.1 所选诊断标准 (见表1)
标明诊断标准的文献有135篇 (80.36%) ;未标明诊断出处的文献有33篇 (19.64%) 。表明文献中诊断标准不统一, 难以保证研究的可重复性和可靠性。
2.7.2 所选量表 (见表2)
标明使用量表的文献有133篇 (79.17%) ;未标明使用量表的文献有35篇 (20.83%) 。表明文献使用量表标准不统一, 难以保证研究的可重复性和可靠性。
2.7.3 所选疗效判定标准 (见表3)
标明疗效判定标准的文献有45篇 (26.79%) ;未标明诊断判定疗效标准的文献有123篇 (73.21%) 。表明大部分文献疗效判定标准采用自拟标准, 缺乏统一, 难以保证研究的可靠性。
3 讨论
本研究结果表明了我国尤瑞克林治疗脑梗死的临床治疗研究按照Jadad量表评分有140篇文献质量一般, 有28篇文献质量较高, 针对目前相关文献不足之处进行以下几个方面的讨论。
3.1 随机方法
随机方法的描述不够具体, 本研究中有142篇文献提及随机分组, 但不清楚随机分组后是否进行隐藏, 如果没有对随机方案进行处理, 将有可能导致选择性偏倚, 尚有3篇采用不正确的随机分配方案, 1篇未提及随机分配方案。
3.2 盲法的使用
盲法的运用可以有效地避免研究人员或者受试者所带来的各种偏倚。本次文献评价的168篇文献中仅有11篇提及盲法, 9篇文献运用盲法正确, 6篇采用单盲, 3篇采用双盲, 有2篇未提及盲法方法。若不使用盲法或使用方法不当则无法避免人为因素对结果产生的影响。
3.3 诊断标准、纳入标准、所选量表、疗效评判标准
在临床研究中, 如果要想使选择的样本具有较好的代表性, 必须确立正确的诊断标准, 并根据研究目的进一步确定纳入标准, 从而使得样本具有与之相应总体的同质性, 本次文献评价有33篇 (19.64%) 文献采用自拟诊断、纳入标准。35篇 (20.83%) 文献未采用任何评价量表。123篇 (73.21%) 文献采用自拟疗效评判标准。诊断标准, 纳入标准, 所选量表, 疗效评判标准不统一, 很难保证研究的可重复性以及研究成果的可靠性。
3.4 失访及随访情况
仅有28篇 (16.67%) 文献提及到随访或者失访, 其中失访13篇 (7.74%) , 随访15篇 (8.93%) , 现如今疗效重点指标越来越受重视, 但有83.33%的研究忽略随访与失访情况, 从而影响到疗效的重点判定。
综上所述, 尽管尤瑞克林治疗脑梗死的文献数量较多, 但是其总体质量一般, 主要表现在盲法的应用, 而且方法学的质量环节不够完整, 因此影响到研究质量, 使文献的可信度以及研究结论的科学性降低, 为了使尤瑞克林治疗脑梗死的疗效得到普遍的认可, 应该多开展前瞻性、多中心、设盲的大样本的随机对照试验, 以探索出疗效确切, 可行性强的治疗方法。
摘要:目的 评估尤瑞克林治疗脑梗死的文献质量。方法 检索万方数据库 (1989年—2011年) , 中国知网 (CNKI, 包括中国期刊网, 1979年—2011年) , 中文科技期刊全文数据库 (重庆维普, 1989年—2011年) , 中国生物医学文献数据库 (CBM, 1978年—2011年) , Pubmed (1966年—2011年) , Embase (1974年—2008年) 以及The Cochrane Library (2010年) , 获取所有关于尤瑞克林治疗脑梗死的文献, 选择符合纳入标准的文献进行评价。结果 纳入文献共168篇, 根据Jadad量表评估所有纳入文献, 0分文献20篇 (11.90%) , 1分文献5篇 (2.98%) , 2分文献115篇 (68.45%) , 3分文献19篇 (11.31%) , 4分文献6篇 (3.57%) , 5分文献3篇 (1.79%) 。其中33篇 (19.64%) 文献采用自拟纳入标准;35篇 (20.83%) 文献未采用任何评价量表;123篇 (73.21%) 文献采用自拟疗效评判标准。结论 尤瑞克林治疗脑梗死的文献总体质量一般, 主要表现在盲法的应用, 缺乏统一的诊断、纳入、排除标准。
关键词:尤瑞克林,脑梗死,脑卒中,人尿激肽原酶
参考文献
[1] Jiang B, Wang WZ, Chen H, et al.Incidence and trends of stroke and its subtypes in China:Results from three large cities[J].Stroke, 2006, 37:63-68.
[2] Sweetman SC.Martindale:The complete drug reference[M].34th ed, London:Pharmaceutical Press, 2002:836-837.
[3] Wardlaw JM, Zoppo G, Yamaguchi T, et al.Thrombolysis for acute ischaemic stroke[J].Cochrane Database Syst Rev, 2003 (3) :CD000213.
[4] Ingall TJ.Intravenous thrombolysis for acute ischemic stroke:Time is prime[J].Stroke, 2009, 40:2264-2265.
[5]Julian PT, Higgins PT, Green S.Cochrane handbook for systematicreviews of interventions[EB/OL][2011-05-16].http://www.co-chrane-handbook.org.
[6]Jadad AR, Moore RA, Carroll D, et al.Assessing the quality of re-ports of randomized clinical trials:Is blinding necessary[J].ControlClin Trials, 1996, 17:1-12.
科学文献评价的新探索 篇2
关键词 优胜论文 文献计量 文献评价
分类号 G255.51
Abstract Using the methods and theories derived from the successful paper, this paper discusses the evaluation indexes of scienti?c output, and then conducts an empirical analysis of 4 journals and one scientist, that is, Monatshefte fur Chemie, Monatshefte für Mathematik, Journal of Neural Transmission, Chemical Reviews and MK. The adopted data come from the web of science. It studies a number of references, citations and successful papers, which purpose is to make a more detailed and multi-aspect description of the journals and the scientist, and reflect the value of scienti?c output.
Keywords Successful paper. Bibliometrics. Document evaluation.
一篇科学文献的价值通常通过被引次数来衡量。被引次数与某一特定数值的关系用以评价科学文献的价值,而这些科学文献数量的多寡就被用以评价科研人员的科研成就。H指数就是一项旨在评价科学家个人绩效的指标,科学家发表论文的数量和论文被引的频次本身包含了很多有用的信息[1]。但是,基于H指数的科研评价存在一定的问题,比如科研成果形态的差异也使其不能全面地反映科研状态[2]。
一篇论文中参考文献的数量(number of references,NR)和其被引用数量(number of citations,TC)是相关的。拥有高参考文献数量的论文可以更好地接受评审人的积极推荐,并最终被出版物所接受。被引文献数和引用文献数的关系在期刊、主题分类以及学科层面已经得到了广泛的研究。
1 问题的提出
优胜论文的数量可以有效地作为科研人员、期刊、科研机构等科研成就的评价指标。
被引文献数的SP评价方法的优势是由TC和NR的比例决定的。
(1)TC和NR的篇平均值在不同的学科中是不同的。比如在科学的某一分支领域,TC和NR都很高,并且有众多活跃的科学家和高质量的期刊,而在科学稍冷门的分支领域,数量相对就很少。在不同科学分支领域的引用行为虽受到一些因素的影响,但不受活跃的科学家数量和高质量期刊的数量影响。基于SP的评价方法减少了他们的固有优势。
(2)TC和NR的篇均平均值在不同的国家是不同的。在大而富饶的国家,TC和NR都很高,而在小而贫穷的国家都较低。大而富饶的国家的科研人员有内在的优势,他们有更多的机会得到更多的引用。基于SP的评价方法减少了他们的固有优势。
(3)综述比原创论文的TC和NR的篇均平均值都要高,这就使撰写综述论文的作者具有内在的优势,他们有更多的机会得到更多的引用。基于SP的评价方法减少了他们的固有优势。
(4)基于SP的评价方法校正了过度自引的现象。自引的人就意味着要比其他科研人员具有更高的TC数超过他的论文的NC数,才能使他自己的论文成为优胜论文。
当然,在一个数据库中的所有科学论文的NR总和高于其TC的总和,因为不管是非科学的出版物还是科学出版物的参考文献并不是全部被这个数据库所涵盖(如博士论文就不被Web of Science收录)。因此,一篇TC=NR的论文其TC值高于平均水平,并且目前对优胜论文的定义是有点武断的。一个更一般的定义,例如,score=1当TC>X×NR(其中X是一个正数,并且X因不同的学科有所不同),但目前这个研究仅限于X=1的定义。
2 优胜论文的判定
一个例子可以很容易地证明基于SP的评价有悖常理。例如,有一篇参考文献的论文在过去的20年被引用2次,就是一篇SP。然而有120篇参考文献的论文被引用了100次就不是一篇SP。按照同样的思路,我们就可以批驳另外一个引用指标。例如,一个作者有2篇学术文章,分别被引用了2次,他的H指数是2。而另外一个作者只有1篇学术文章,但被引用了100次,他的H指数是1。TC只是稍高于NR的SP和TC比NR高很多的SP是没有区别的。H指数虽然给予高被引文献更多的关注, 并且2008 年6 月,中国科学技术大学吴强博士也提出了H指数的另外一个变种——W指数,更强调关注高被引文献,但是对高被引文献中的最高被引文献却没有引起足够的重视[4]。TC>>H的文章的得分和TC=H的文章的得分是一样的。可以使用下面的方法来评估高被引论文。
3 研究对象和研究方法
3.1 研究对象
nlc202309040906
选取4种期刊Monatshefte fur Chemie、Monatshefte für Mathematik、Journal of Neural Transmission、Chemical Reviews作为研究对象。Monatshefte fur Chemie(MC)被选为化学的代表。Monatshefte für Mathematik(MM)被选为数学的代表。Journal of Neural Transmission(NT)被选为神经科学的代表。这3种期刊出版地都是奥地利,它们主要刊登原创文章(MM仅刊登原创文章),而非评论性文章。这三种期刊每种每年收录论文约100篇,它们都在2000年以前创刊。而第四种杂志Chemical Reviews化学评论(CR)是在美国出版,并发表评论性文章。为了避免社论材料(前言,修改)的干扰,NR=0的文章我们故意忽略。
选取单个人(MK,化学家)在上述四种期刊发表的论文作为研究对象,研究单个科研人员SP的产出情况。
3.2 研究方法
3.2.1 期刊评价
利用Web of Science数据库分析上述4种期刊在2000年发表的文章。数据库访问时间:2013年08月18日。本节中研究的论文是同一年发表的,这就消除了文章发表时间因素对TC和NSP的影响。
选择发表至今10年的文献是比较典型的时间跨度,因为考虑到科学家科学文献产出评价在项目申请和职称评定中的作用。基本科学指标(ESI)表明,文章发表10年后被引率很低,也就是说,10年前发表的论文的平均TC 比9年前发表的略高,相差很少。这些期刊与SP相关的文献计量学指标见表1。
表1给出了第1部分讨论的关于顺序的问题:神经科学>化学>数学(评论性文章)>原创性文章,“>”表示更多的参考文献量和更多的被引次数。所选期刊中平均TC的比例与在第2节中讨论的所有学科类似。MM和NT被引率分别稍低于数学和神经科学的平均被引率。MC的被引率远低于化学学科的平均被引率,CR的被引率远高于化学学科的平均被引率,但CR是一种特殊的杂志,仅发表评论性文章,并且在化学领域是具有高影响因子的期刊之一。
因为神经科学>化学>数学(评论性文章)>原创性文章,神经科学的期刊和评论性的期刊本身具有更多的参考文献和被引次数,从表1可以看出MM和MC的平均TC/平均NR就比较低。因此换句话说平均TC/平均NR依赖于期刊本身的性质,即属于哪种学科的期刊,发表的是评论性文章较多还是原创性文章较多。CR比其他3种期刊的平均TC和其他TC> 100的论文数量高很多。尽管这4种期刊平均TC有很大的区别,CR仍然比其他3种期刊有更多的SP。MM中所有成功论文的NR处于MM所有论文的NR平均数,TC值比MM所有论文的NR平均数要高很多。MM的所有SP的NR值均比其所有论文的平均NR值稍低,并且所有SP的TC值均比其所有论文的的平均TC值高很多(这3篇SP的NR、TC分别为11/5、56/11、8/10)。
MC中所有SP的论文都是原创论文。MC中最佳评论性文章NR为170,TC为74,相比之下,一篇原创TC仅为5,而NR为4,那么这篇原创性文章就称为优胜论文。NT中所有SP的论文也都是原创论文。NT中最佳评论性文章NR为170,TC为28,相比之下,一篇原创论文的TC仅为8,NR为7,那么这篇原创性文章就称为优胜论文。CR中一些TC值最高的论文(例如TC值为664,而NR高达967)都不是优胜论文,而一些TC值最低的论文(例如TC值为13,NR仅为1)却是优胜论文。
3.2.2 科研人员评价
利用Web of Science数据库分析MK发表论文的情况。理论上,MK发表论文的数量和他们的平均值和在第四节讨论的数值应该是一致的。MK发表的SP和非SP见表2。
由表3可见,MK的NSPhc大于NSP说明TC远远大于NR值,NSPma略低于NSP,说明MK的SP论文都是独自撰写的论文或者与他人合作的论文很少。NSPpy的值低于NSP的值,此结果反映了SP的平均年龄。NSPsc的值比NSP低12,表明MK的引用中有很多自引。
4 结语
基于SP的指标对作者、期刊或者科研机构的跨学科领域的科学产出是有用的。单个科研人员的NSP可以很容易避免多作者、自引以及论文出版时间的影响。
基于SP的指标比较有争议的一点就是某一作者,某种期刊或某一科研机构优胜与否的阈值由一定数量的引用次数决定,而没有考虑到过量被引的问题[6]。因此,基于SP的指标虽简单易操作,但也有其缺陷,在以后的研究中会作进一步的探讨。
参考文献:
[ 1 ] 邱均平,缪雯停.文献计量学在人才评价中应用的新探索:以“h指数”为方法[J].评价与管理,2007,5(2):1-5.
[ 2 ] 宋振世,周健,吴士蓉.h指数科研评价实践中的应用研究[J]图书情报工作,2013,57(1):117-121,135.
[ 3 ] Marek Kosmulski. Successful papers:A new idea inevaluation of scientific output[J].Journal of Informe-trics,2011(5):481-485.
[ 4 ] 聂超,朱国.h指数在科研评价中的缺陷及其对策[J].情报理论与实践,2009,32(11):1-2,7.
[ 5 ] Kosmulski M. New seniority-independent Hirsch-typeindex[J].Journal of Informetrics,2009,3(3):341-347.
[ 6 ] Franceschini F, Maisano D. The citation triad:An-overview of a scientist’s publication output based on Ferrers diagrams[J].Journal of Informetrics,2010,4(4):503-511.
姜莹莹 南京航空航天大学图书馆助理馆员。江苏南京,210016。
陈万寅 南京航空航天大学金城学院图书馆馆长、研究馆员。江苏南京,211156。
李睿华 南京航空航天大学图书馆馆员。江苏南京,210016。
(收稿日期:2013-11-04 编校:方 玮)
文献质量评价 篇3
关键词:参考文献,学术期刊,学术论文,学术水平,编辑审稿
学术论文是指科研人员提交给学术期刊予以发表或在学术会议上宣读的论文, 主要报道最新研究成果, 反映相关领域最前沿、最新的科学水平和发展动态。参考文献是学术论文的有机组成部分, 有助于作者最精练最直接论述研究背景及相关研究动态, 也便于读者追溯有关文献资料。可以认为, 参考文献是学术研究的基础和起点, 体现出科学和技术发展的继承性和连续性。合理引用参考文献不仅是论文作者严谨研究态度和职业道德的体现, 而且也是对同行的尊重及其研究成果的肯定。
参考文献对于科研论文本身具有重要的学术价值, 也可促进学术交流, 同时也是评价学术论文质量的重要依据。因此, 可以利用参考文献对学术论文质量进行合理评审, 成为衡量学术论文质量高低的重要指标, 并纳入学术期刊质量评估体系。编辑人员是编辑工作的主体, 学术期刊的学者型编辑更应从多角度、多侧面鉴审学术论文的质量。笔者根据近来稿件审阅经验, 注重对论文所附参考文献进行分析, 从参考文献的引用角度探讨编辑人员在初审时如何评价学术论文质量。
一、从参考文献的学术性进行评价
参考文献是学术研究的起点和基础, 体现科学研究的继承性和延续性。论文作者在科学研究的选题论证、研究方法、理论探讨和论文撰写过程中, 都要参考和利用大量与选题相关的参考文献, 掌握相关领域的发展动态, 吸取前人研究成果, 避免重复他人的劳动。在介绍研究背景、实验设计、研究目的时, 必然要对已知的研究成果进行比较分析和消化吸收, 确定作者自己论文研究方向的理由、起点、深度和依据, 这都需要引用参考文献作为基础, 体现出作者研究论文的创造性, 然后通过科学研究得出创新性成果。作为论据的参考文献实质上隐含着作者对引用参考文献观点、理论、方法或结论的认可, 更是论文作者对所引用参考文献的评价。
通过对所引用参考文献学术内涵的比较分析, 可以大抵了解论文的学术水平是超过前人, 还是简单重复他人已完成的科研工作, 从而判断论文的学术价值是否具有独创性和先进性。只有论文具备新理论、新方法、新观点或新结论时, 才表明科学研究有实质性成果, 作者的学术水平才能得到人们的认可和肯定。可见, 参考文献能体现作者事前进行文献调研的细致程度, 从而反映论文的起点、深度和广度, 即从一个侧面反映了论文的学术水平。此外, 若参考文献多是作者以前所发表的文章, 可以认为作者研究的基础比较扎实可靠, 关键是鉴别在前有研究基础之上的进展。因此, 认真审阅参考文献是编辑人员评审学术论文的创新性和新颖性的一种有效的辅助方法。
二、从参考文献的权威性进行评价
权威性文献是指某学科领域中的经典理论著作、权威专家论著、核心期刊论文等。每个学科都有一些权威专家、核心期刊及高水平论文等, 这些文献学术水平高, 创新性强, 反映了学术发展的前沿, 倍受学术界关注。学术论文应该引用这些文献为主, 否则很难反映出作者研究思路和研究方法的创新性、新颖性和先进性, 及其研究的起点和深度。
若学术论文所附参考文献多出自这类文献, 说明作者学术视野开阔、学术功底深厚, 对该学科的前沿领域有所掌握, 同时可使作者论文的论点更加明确、论据更具说服力, 这是创新性研究的必要前提, 也可间接证明该类论文具有相当的学术水平。相反, 若论文所引用的参考文献不是权威性或具有代表性文献, 而是一些低水平的文献, 说明作者较少参考那些高水平的文献, 其所引用的理论、论点和论据可能不具有代表性和权威性, 那么此类论文的结论可靠性不强、学术质量不会高。因此, 编辑人员在评阅论文时, 要根据参考文献的权威性从一个侧面反映作者的学识水平和学术视野, 从而判断论文的起点、广度和深度。
三、从参考文献的时效性进行评价
时效性原则是引用参考文献的原则之一, 即参考文献要“以近期为主”, 属于新颖性原则范畴, 是体现科学研究起点的重要标志。当今科技发展迅速, 知识更新很快, 参考文献的引用要注意文献的时效性, 时效性也是评价学术论文质量的参考指标。学术论文选题要新颖, 就必须创新, 就要以最新文献为主, 尤其是近2—3年的期刊文献, 因期刊的出版周期较短, 研究内容较新颖, 更能反映科学研究选题的背景及最新发展动态, 显示作者论文选题的现实性、新颖性或前瞻性, 也在一定程度上也反映出论文水平。
根据参考文献时效性的特点, 编辑人员在审阅稿件时, 要注意近期参考文献的引用情况, 依此初步判断论文的起点和新颖性。一般来说, 参考文献越新、越权威, 说明该文起点越高;反之, 说明该论文所进行的研究尚处于较低水平。如果作者引用的参考文献比较陈旧, 说明作者没有及时跟踪学科发展动态, 思想观点较陈旧, 所从事的科学研究缺乏创新性, 广度和深度不够, 基于此所形成的论文学术水平不会高。但应当注意的是, 有些学科 (如史学、中医学) 因其涉及年代久远, 某些重要的经典理论需要引用;或是某些刚刚兴起的交叉学科或研究领域, 尚无近期文献可引用, 只能以过去的理论和长期的研究实践文献为基础。这些学科的某些研究领域的研究成果不能以参考文献的时效性来判断其论文的学术水平。
四、从参考文献的全面性进行评价
参考文献的全面性并不是指全部参考文献, 而是指经过精选后最能代表该方面研究成果和水平的文献。科学研究之前作者已对该学科相关领域进行全面熟悉、系统分析和整体把握, 才确定研究方向。所以, 论文中参考文献引用得越全面, 表明作者对前人的研究成果和研究进展把握得越准确全面, 尤其是作者自己前期的研究内容和结论, 这正是选题具有独特性、创新性、新颖性的前提。编辑人员在审阅参考文献的全面性时, 可以了解作者对该研究方向的研究现状及发展动态的深度和广度, 也从侧面反映作者研究工作的起点和论文的学术水平。许多国际刊物将“文后参考文献引用是否全面合理”作为论文的评审指标之一, 要求审稿人员明确论文所引参考文献是否全面、是否存在漏引情况。
五、从参考文献的数量进行评价
学术论文中参考文献的引用数量也是评价学术论文质量的一个指标。参考文献的数量取决于学科性质、学术研究热点和论文类型等方面。尽管我国科技期刊论文所附参考文献数量近年有所上升, 但仍少于国外同类期刊, 这在一定程度上说明我国科技期刊论文的学术质量与国外科技期刊论文质量有差距。
学术论文所附参考文献是科研人员进行选题调研、了解研究进展等活动的记录, 参考文献的数量反映了科学研究的起点和深度。参考文献数量多, 表明作者查阅的资料多, 前期准备工作充分, 作者获取、吸收、消化文献信息的能力较强, 其学术论文的质量有一定保证。当然, 参考文献数量多应以其权威性、代表性、时效性等为前提, 不是所附参考文献越多, 论文水平就越高。如果只是将文献中的研究成果堆积在一起, 不加以分析提炼, 没有形成自己的见解, 就体现不了作者的科学研究水平。如果参考文献过少, 就说明作者获取文献的能力不强或缺乏科学研究经验;或作者引用了他人的研究成果而未标注, 则反映作者治学不严谨, 学术论文的质量不可靠。但是, 对于新兴学科, 由于前人研究成果缺乏, 可引用的参考文献也就很少, 不能因为其少而判定学术论文的质量不高。
六、从参考文献的语种分布进行评价
参考文献的语种分布是反映作者对所从事研究领域所掌握文献的广度和深度指标。如果学术论文所引用的参考文献全部为中文文献, 或外文文献很少, 表明论文作者可能只掌握了国内该研究领域的现状和进展情况, 而对国际研究进展掌握不够。这类学术论文, 其学术水平多为国内研究水平, 难以达到国际水平。外文文献引用少可能是由于作者忽略了或很少查阅外文文献, 其论文的研究内容或许是重复国外研究人员的劳动, 这样就很难超越国际同行而达到国际水平。但是, 国内有些学科 (如中医药学) 一直处于国际领先水平, 自然可引用的参考文献就少, 不能因为外文文献少而质疑或否认其论文学术水平。
因此可以认为, 参阅适量的外文文献是研究人员选题论证和撰写高质量学术论文的前提之一。只有查阅了一定量的本专业研究领域权威的外文文献, 并进行比较分析和有效引用, 才能证明作者掌握了该学科的国际研究进展, 是从事高水平的科学研究, 其学术论文的质量也达到国际水平。所以, 编辑人员可根据论文中参考文献的语种分布情况, 推断论文水平。
七、结语
在学术期刊的编辑出版过程中, 审稿是编辑的一项日常且重要的工作, 只有高水平的审稿, 才能确保学术论文的质量。参考文献是学术论文的重要组成部分, 也是稿件审阅不可忽略的环节, 是判断论文质量的优劣的有效辅助方式。
通过审阅学术论文所引用参考文献的学术性、权威性、时效性、全面性, 及其数量和语种分布, 可以了解作者在进行科学研究和论文撰写过程中所参考的资料, 反映论文作者的研究水平、研究思路和研究程度, 判断作者是否掌握了该领域的最新研究成果, 是否佐证该论文的观点, 进而比较准确和客观地评价论文结论的可信度及其学术水平。
文献质量评价 篇4
【关 键 词】高中学生;综合素质评价
自2004年以来,普通高中新一轮课程改革在全国各地纷纷启动,着力于从本质上改变一考定终身的应试教育现象,打破其长期的主导地位,建立并发展真正符合素质教育的课程指标与课程体系,遵从国家立德树人的基本概念,将高中生培养成既具有良好道德修养、兼顾科学文化知识的综合素质全方位人才,综合素质评价应运而生。
2014年国务院下发了《关于深化考试招生制度改革的实施意见》,明确进一步规范高中学生综合素质评价并将其作为学生毕业和升学的重要参考。随后教育部下发的《关于加强和改进普通高中学生综合素质评价的意见》规定了综合素质评价的主要维度,即思想品德、学业水平、身心健康、艺术素养、社会实践五方面反映学生全面发展情况和个性特长,注重考察学生社会责任感、创新精神和实践能力。高中学生综合素质评价是我国普通高中课程改革的重要内容,是对传统招考制度的重要突破和全新举措,是推进素质教育、深化考试招生制度改革的重要评价手段。近年来虽取得了初步成效,但在评价实践中还存在着评价实施困难、评价指标不完善、评价人员的专业知识和技能缺乏、诚信问题严重、应付现象明显、评价与教学脱节等问题。
目前,高中学生综合素质价改革正在全国迅速展开,在这样的形势下,全面而深入地分析高中学生综合素质评价实施的现状,发现其中存在的不足与弊端,对于及时解决评价过程中出现的各种问题,提高评价的科学性和有效性,完善并深化招考制度改革,推进素质教育进程具有非常重要的现实意义。
一、国内高中学生综合素质评价的研究现状
(一)综合素质评价指标、体系及制度研究方面
蔡敏在《高中学生综合素质评价:现状、问题与对策》(《教育科学》2011年2月第1期)中阐述了高中学生综合素质评价的实施现状:政府行政手段成为推动评价改革的主要力量,评价内容维度出现一致化趋势,评价过程体现多元主体参与,评价方法显示多样化特点等方面,存在着理论研究欠缺,综合素质评价指标体系尚不完善,相关培训不足,实施者缺乏必要的评价知识与技能,诚信问题突出,综合素质评价出现结果失真,敷衍现象明显,评价实施过程过分注重表面形式,评价目迷失,评价与教学之间没有建立应有的反馈链等诸多问题,提出要改进高中学生综合素质评价,应在科学建构评价指标的基础上,辅助以各层面的专业性评价培训,完善监管机制,全面了解学生所学所长,注重评价的反馈育人功能。
张杰、李晗在《学生综合素质评价指标体系的构建及应用》(《教育与职业》2014年第3期)中提出了运用德菲尔法和专家咨询法构建学生综合素质评价指标体系,①基于这种评价指标体系,运用层次分析法评价一组学生的综合素质,并进行验证,为综合素质评价指标的确定提供了新的评价思路和方法。邓志勇在《构建学生综合素质评价体系的策略研究》(《教育测量与评价》2010年6月)一文中,以重庆市北碚区构建综合素质评价的保障系统为例,建设学生综合素质评价三级实施体系,三峰诚信体系,多元督导体系与多元导航体系,②对义务教育阶段的学生综合素质评价保障提出了新的发展模式。
(二)综合素质评价的问题与反思方面
朱志平在《综合素质评价:经验、问题与对策》(《基础教育课程》2013年4月)中提出评价工作缺乏自主意识、保障机制、诚信氛围及系统思考。高凌飚在《综合素质评价反思》(《基础教育课程》2013年4月)中提到综合素质评价不适用功利性目的。
李宝庆等在《高中生综合素质评价方案:问题及改进》(《教育发展研究》2012年10月)一文中阐述目前各地综合素质评价部分指标不合理,会增加学生负担,导致新的方面教育不公平;各地评价标准不统一;等级评价过程繁杂,操作难以保证客观公正等问题。
王敏勤在《高中学生综合素质评价的虚化现象及对策研究》(《考试与评价》2009年10月)中提出,普通高中学生搞综合素质评价在很多学校存在着实抓德育与虚搞评价的不合拍现象,即重视评价体系的甄别功能,忽视其导向功能;学校的德育运行体系与综合素质评价体系不接轨;学校的评价指标与综合素质评价指标不接轨。
罗祖兵《分析式综合素质评价的困境及其突围对策》(《教育科學》2014年10月第5期)一文中明确表明造成当前高中学生综合素质评价诸多困难的问题,表面看是技术原因而实际上是思路问题,提出突破分析式综合素质评价应用综合式思路应对。在其《高中综合素质评价的矛盾探析》(《考试研究》2012 年第5期)描述了高中综合素质评价易产生的三种矛盾:实践操作性与指标模糊性的矛盾;发展功能与甄选功能的矛盾;主管部门主动与学校被动的矛盾,并对其做出了概述性分析。其曾在《关于将高中综合素质评价纳入高考体系的思考》(《课程·教材·教法》第31卷第12期2011年12月)一文中,对高中综合素质评价是否应该被纳入高考做出了深刻的反思,并对其利弊做出了深入的分析,对现行综合素质评价结果使用具有很好的参考价值。
(三)我国其他省份综合素质评价开展现状
管光海在《浙江:从常态化走向有质量的实施》(《人民教育》2014年6月)一文中说到,浙江省将项目测评与纸笔测试相结合,引导实施方向,建构了以动手项目制作为代表的综合素质测评和以纸笔项目测试为代表的会考相结合的信息技术评价体系,并通过信息技术转化,将结果用于招考改革之中。高中学生综合素质评价通过电子信息技术测试(内涵日常实践活动和配套项目设计)旨在引导学校在日常积极开展学生实践的同时,通过配套项目设计提高学生综合素质。
金付栓等在《初中学生综合素质评价的现状——以北京市延庆县为例》(《北京教育学院学报》第27卷第4期)得出的结论是:初中综合素質评价对学生全面发展有一定的效果,但存在人为因素多、保障制度不完善、费时费力影响工作、应付形式多、评价结果缺乏及时性、易造成学生心理压力等问题,对考量现阶段综合素质评价具有实际意义。
孙彩霞在《区域间高中综合素质评价标准的比较研究》(《基础教育》第11卷第1期)一文中,运用比较研究法对比以重庆为代表的西南地区综合素质评价标准和以浙江省为代表的东部沿海地区高中学生综合素质评价标准,明确目前对学生综合素质评价的认识仍存在混乱的问题,评价标准在情境化的认知与理解过程中需不断调整,执行环节要考虑具体空间的现实需要与可能等问题。
林珑等在《中小学综合素质评价中的问题及对策——对福建省中小学的个案调查分析》(《中国考试》2009年第4期)中提出的评价内容的片面性、评价主体愈识与能力的缺失、评价方式的模糊性等,现今也是经常出现的问题,对现阶段综合素质评价具有指导意义。
二、美国高中学生综合素质评价
在美国,学生综合素质评价作为一种标准,为高校录取提供评判参考。美国没有综合素质的专项测试,往往通过申请材料确认学生是否达成进入大学的入学条件。
(一)监管部门与机制
美国高校招生起决定作用的是高校独立的审核部门,利用校友会对申请人进行就近面试考察学生综合素质,同时申请者还必须提供有考试服务中心和高校测试中心提供的SAT或ACT成绩。
诚信与监管机制方面,除了美国本土的信仰文化与自觉遵守外,多主体参与在一定程度上可以保证申请人的信息真实性。还有一点,不得不提到美国完善的信用机制。在评价过程中,高校有权对弄虚作假者做出退学等相应处罚,并记录信用局档案,影响个人信用报告产品的信用度。③
(二)评价构成
完整的申请材料包含入学申请和附件材料两部分。如世界著名的普林斯顿大学的入学申请及备选材料包括短文(想让高校了解自己的自荐书)、中学报告、中期学校报告、两份教师推荐函、备选知情人推荐意见(可以是校长、议员等的推荐信)、备选才艺材料,充分公正地显示出一个学生所具有的综合素质。
我们可以由此了解申请材料是一种写实性的资料积累与评判,既有反映学业结果的SAT/ACT考试,又存在平时选课和成绩的中学报告和中期学校报告,不乏多人参与(教师、校长、知情人、申请人)的推荐函,可以说申请材料就是反映学生综合素质的材料文件,涵盖学业检测和非学业检测两部分,定性与定量相结合,客观而全面的反应学生的综合素质。
值得注意的是,美国的综合素质评价与我国有着本质的不同,没有将综合素质进行分解,形成一系列基础指标进行评判,而是作为一个整体进行总体评价,偏向材料积累与收集,更注重教育活动与课程相结合。
三、现阶段综合素质评价的解析与思考
浙江与上海作为我国深化考试与招生制度改革的试点地区,对普通高中学生综合素质评价在地方性政策方面给出了全新的参考依据。分别于2015年4月13日下发了《关于完善浙江省普通高中学生成长记录与综合素质评价的意见》、2015年2月15日下发了《上海市普通高中综合素质评价实施办法》两个相关文件,并在指导思想、评价内容评价程序方面与教育部相关文件保持高度一致。而在具体的评价环节,上海注重材料收集与汇总以写实记录报告作为最终评价结果;浙江将综合素质评价结果分成A、B、C三等,以等级评价结果和材料汇总相结合的方式作为最终评价结果,并均已自主招生参考作为评价实质结果使用方式,表现出不同的地方区域特色。
笔者认为,在不断深化考试与招生制度改革的道路上,“两依据,一参考”必将成为最终的招考形式,综合素质评价作为重要的参考标准,必然在招考中越来越重要。“高中保真、高校保用”必将成为今后综合素质发展的核心关键。高中学生综合素质评价应严禁给予打分、评等等方式呈现评价结果,具象化的材料写实才是对评价公平而言最好的诠释。评价目的除招考升学以外,应充分发挥评价本身育人反馈的实效性,让学生的综合素质得以全面长远的发展。而高中在做好学生综合素质评价,保证其客观性与真实性的前提下,高校应怎样给予相应的使用标准,是今后值得深思的重要问题。
注释:
①德尔菲法,是一种匿名的专家问卷调查法。即选择数位有经验的专家,为其提供必要的背景材料。并将需要提出的问题设计成调查问卷进行咨询。然后从专家那里回收所有答复意见并整理出相同意见。将不同意见的部分再次设计成问卷反馈给专家,如此反复进行直到最终意见一致。
专家咨询法,即模拟市场法。将专家设定为市场潜在购买者,利用其知识,经验和分析判断能力对价格进行鉴定的一种方法。
②三级实施体系:区教委(领导系统)——区教师进修学院(研究与指导系统)——中小学(实施系统)
三峰诚信体系:从区级和学校两个层面出台关于评价的公示、诚信、监督、申诉和责任追究等制度,建构了“区-校”两级他律与自律相结合、“公示-监督-追究”三峰交错的综合素质评价诚信体系。
多元督导体系:以综合素质评价作为层次最高的办学水平综合评价的最重要参考,将单项督导与综合督导相结合的方式。
多元导航体系:学生综合素质评价与学校德育工作评价挂钩,将其作为评优评先的重要依据;让学生综合素质评价与初中毕业、高中招生挂钩,实现了高中招生改革的三级跳充分利用示范性高中招生指标50%到校的政策,以综合素质评价为基本依据,实行“诚信推荐录取、综合测评录取、艺术体育科技特长录取”。
文献质量评价 篇5
2013年,我国内部审计协会修订了《内部审计准则》,首次将内部审计的职能由“监督和评价”拓展为“确认和咨询”,以期内部审计在公司治理中发挥日益重要的作用。内部审计作为一种服务,质量是其生存和发展的根本,只有不断提高内部审计的质量,内部审计才会不断被认可。内部审计工作的质量和效率直接影响内部审计在组织内的生存与发展。近些年,无论是企业内部的管理层和治理层,还是企业外部的社会公众,都越加重视内部审计部门的作用。以期通过内部审计部门的优化以及内部审计工作质量的提高来加强企业内部控制制度的执行,发现并抑制舞弊行为的发生。因此,提高内部审计质量,使内部审计发挥更大的作用,成为我国内部审计发展的重要问题。而内部审计作用的发挥很大程度上取决于内部审计工作的质量,同时内部审计质量的好坏关系到内部审计部门在企业的生存和发展,所以理论界都认为很有必要对内部审计质量进行研究。
我国对内部审计的相关研究虽然起步较晚,但是内部审计的相关问题始终是理论界关注的热点,理论研究成果层出不穷。而对于内部审计质量的相关问题理论界研究情况如何?内部审计质量高低如何影响公司治理的效果?研究中又存在着哪些问题?本文采用文献计量学方法,通过对近年来内部审计质量相关研究文献的整理,对近年来我国内部审计质量的研究过程进行综合分析,旨在了解内部审计质量评价与效果研究的现状与阶段变化,并指出存在的问题,以便为今后的研究提供借鉴。
二、载文统计
(一)学术论文增长曲线
文献计量学中科技文献增长四阶段理论显示:在某学科刚刚诞生时,论文绝对数量相对较少;而在学科大力发展以及日趋成熟的过程中,论文数量先持续增长后保持稳定;随着理论的完备,学科文献日趋减少。本研究试图借助此理论来判断内部审计的质量研究处于该学科研究的哪一个阶段。我们以“内部审计&质量”为关键词对2003~2015年中国期刊网进行精确匹配搜索,并对获得的文献进行了手工筛选,由于在研究时我们并未取得2015年完整的统计数据,因此将2015年的数据剔除,最后共获得样本文献118篇。
鉴于与内部审计部门相关的信息披露制度在2012年才开始实施,相关研究在2012年之后才有较详实的数据保障,本文以2012年为界限进行了文献数量的数据分析,见下图。
由于2012年之前的内部审计信息较难取得,所以我们对2003~2012年之间的文献数量进行了平均化处理。从图中示可以看出,内部审计质量的相关研究在2012年开始有较大幅度的增长,而2013年和2014年的研究成果数量相当,这表明,内部审计质量研究正处于研究的第二到第三阶段,研究正在大力推进并日趋成熟。
(二)研究内容
我们对118篇样本文献进行手工筛选之后进一步整理发现,学者对内部审计质量的研究主要集中在四个大的方面,分别是:内部审计质量的影响因素、内部审计质量的评价体系、提升内部审计质量的相关建议以及内部审计质量与其他问题的相关程度。其中,对内部审计质量评价体系的研究始终是学者们关注的重点,占到118篇研究文献的32.20%;学者的关注重点其次放在了内部审计质量是否有利于抑制盈余管理的行为方面;对内部审计质量的影响因素以及提升内部审计质量的建议及意见的研究比重相当;有相对较少的学者关注了内部审计质量与公司绩效以及信息披露的相关关系。具体见表1。
(三)研究方法
按照研究惯例,我们将审计研究的方法分为规范研究和实证研究两大类,并对样本文献进行了研究方法的进一步分析。在所有研究样本118篇文献中,采用实证研究方法的总共有39篇,占到了总研究的33%,占比相对较低。在进一步分析中我们发现,不同的研究内容采用的研究方法有较大的差异。其中,采用实证方法研究最多的领域在于内部审计质量是否有利于抑制盈余管理的行为,25篇文献中共有21篇文献采用了实证研究方法,并且占据了所有采用实证研究方法的39篇文献的53.85%;其次39篇采用实证研究方法的文献中有17.95%探讨了内部审计质量和公司绩效的相关关系,详见表2。
三、研究综述
根据之前对文献研究内容的划分,下面简要梳理了主要研究内容的相关文献。
(一)质量影响因素
李莲(2011)选取内部审计部门的设立和独立性、人员素质、董事会的独立性作为解释变量,选取资产规模、资产结构、公司业绩、股权集中度和公司成长性作为控制变量,选取公司市值作为被解释变量,建立多元线性回归模型,并以209家上市公司2007~2009年的数据为样本进行了实证检验,结果显示,上市公司单独设立内部审计部门、增强内部审计部门独立性、提高人员素质都有助于提高企业价值,而董事会的独立性与企业价值之间存在不显著的负相关关系。
鲁文红(2013)概述了内部审计质量的控制因素、控制目标及其重要性,分析了内部审计质量控制系统的构成要素及其质量控制的现实需求,并以某公司的案例进行了深入分析。赵晓铃、雷雨嫣(2014)基于中国内部审计协会2012年5月颁布的《中国内部审计质量评估手册(试行)》将内部审计质量影响因素分为内部审计环境、内部审计主体、内部审计流程及内部审计结果四个方面,并进一步对其进行了深入分析。
孙青(2014)通过设计和发放企业内部审计质量调查问卷,利用数据来验证企业内部审计质量的影响因素及其影响程度,研究显示,企业内部审计质量的影响因素按照影响程度排序,分别为:审计人员的素质、内部审计机构的独立性、内部审计部门的规章制度、内部审计协会的监管、内部审计部门负责人对审计过程进行的督导,并据此提出了建立高素质的内部审计师队伍、合理设置内部审计机构、完善内部审计部门制度及充分发挥行业监管和部门督导的作用等政策性建议。赵华光、马日波(2008)对影响审计质量因素中的审计环境、审计机构、审计人员、审计程序、审计标准、审计方法进行了分析,并提出了建议。樊奕呈(2015)通过案例研究得出:影响内部审计质量的内部因素中最为关键的是人员素质,其次是机构的设置方式;在企业外部,法律环境和行业环境对内部审计质量的影响最为直接。
(二)评价体系的构建
内部审计质量评价是保证与提高内部审计质量的重要措施,因此,内部审计质量评价体系的构建始终是学者重点关注的话题。对于此问题的探讨,部分学者借鉴平衡计分卡的原理,试图通过多维度分析来构建综合评价体系,在这方面,高岩芳和苍乐(2013)、曹若霈(2014)、王芳芳(2015)等学者都做了积极的尝试。与其他学者固守平衡计分卡基本原理的四个维度不同的是,曹若霈(2014)做了创新尝试,基于价值增值理论和平衡计分卡的原理修正了内部审计质量评价的六个维度,分别是管理层、董事会、外部注册会计师、管理能力、执行能力及创新能力。翁贤东、涂明金、柯星角(2012)基于平衡计分卡和价值链管理理论,通过设计发放调查问卷进行因子分析,将内部审计质量评估体系分为五大模块,分别是财务水平、内部审计环境、内部审计流程、客户服务、内部审计成长与创新,构建了内部审计质量评估的基本框架。
其他学者则从不同的视角对此问题进行了积极的探讨。郭群、潘长宇、郭礼全、严忠新(2012)尝试利用服务差距模型对内部审计质量进行评估,并以中国第一家内部审计通过IIA完全外部质量评估的中广核工程公司为例,解析了模型的应用。柯金秀(2011)构建了内部审计质量评价体系,并使用了内部审计质量评价的改进方法——评分法,定位于对内部审计“投入”与“产出”的量化,使评价结果更具有客观性和科学性。张亚男(2014)则从外部评价的视角,采用问卷调查的方式,分别从人员、制度、意识三个方面对我国组织内部审计机构的现实水平进行了评估,得出我国绝大部分组织内部审计机构达到了一定水平,基本具备开展内部审计质量外部评估的条件。同时,也对阻碍组织开展内部审计质量外部评估的主要因素进行了分析,进而从意识、制度、人才、技术四个角度提出保障机制,为我国全面开展内部审计质量外部评估提供外部保障。
(三)建议
裴芳荣、魏素艳(2006)基于公司治理视角,提出了完善公司治理结构的内部审计机构设置的双重监督模式,一方面由监事会对董事会和总经理层进行监督和宏观方面的调控;另一方面由内部审计机构对总经理及其下属各职能部门的责任履行情况进行监督评价,内部审计对审计委员会负责,最终向董事会负责,保障经济责任链条上各方的监督都能有效实施。赵璐(2014)提出,应从保障内部审计的独立性、提高内部审计人员专业素养和完善知识结构以及创新审计方式三个方面来提升内部审计质量。汪彦君(2010)从系统的角度提出从内部审计质量控制主体、目标、作业程序控制和内部审计质量标准控制四个方面构建企业内部审计质量控制体系,并进行了应用。黄国瑞(2007)从政府、内部审计协会、内部审计机构和内部审计人员三个方面提出了企业内部审计质量的保障措施。唐欣荣(2015)认为可以借助质量波动理论5M1E来分析产生内部审计质量缺陷的六大要因,并采取相对应的控制措施来保障内部审计质量。
(四)相关性
1. 与盈余管理相关。
王守海(2009)选取2006~2007年沪深上市公司的部分样本实证检验了操作性应计与内部审计质量为负相关关系,即高质量的内部审计能够降低盈余管理发生的可能性,但其对内部审计质量的度量仅仅从客观性、人员的专业胜任能力和内部审计部门的规模三个方面进行,难免不够全面。王兵、陈运佳、孙小杰(2014)则以独特的视角,选取中小板企业的数据,实证检验了内部审计负责人的特征与盈余质量的关系,结果表明,内部审计负责人的年龄越大、学历越高,对盈余管理行为的抑制作用越大,而内部审计负责人的性别、资历以及工作经验对盈余质量没有显著影响。蔡春、蔡利、陈幸(2009)从内部审计的独立性、部门规模、设立动机和制度规范四个角度衡量了内部审计的质量特征,并通过2007~2008年A股制造业上市公司的样本实证检验得出和其他学者相似的结论,即内部审计质量与盈余管理负相关。赵瑜(2011)认为内部审计部门规模的大小、内部审计人员的专业胜任能力以及内部审计部门的独立性和权威性都可能影响盈余管理,并从公司治理的视角选取2007~2009年A股制造业上市公司390个样本进行了实证检验,结果同样显示高质量的内部审计确实能够对企业盈余管理进行约束。除此之外,张培(2012)、蔡利(2013)也采用相同的思路进行了实证检验。
2. 与公司绩效相关。
钟浩(2011)将五个特征指标合成衡量内部审计质量水平的综合指标(IAQ),选取2007~2011年深交所A股上市公司为初选样本,通过实证检验得出内部审计质量与企业价值正相关,并区分不同实际控制人性质和第一大股东是否拥有绝对控制权的不同情况进行了内部审计质量和企业价值相关关系的进一步探讨。杨晶(2015)构建实证模型对内部审计部门规模、内部审计模式、内部控制信息披露质量、内部审计制度的健全性、内部审计部门独立性以及有无独立董事和监事会对内部控制自我评价报告的意见六大方面与企业绩效的关系进行检验,结果显示,内部审计质量与企业绩效呈显著正相关关系,说明高质量的内部审计对企业绩效的增长产生重大的推动作用。肖慧萍(2014)则着眼于内部审计制度执行稍显落后的民营企业,以是否设立内部审计部门、内部审计的独立性、财务报告是否发生重述和是否受到证监会处罚这四个变量作为衡量内部审计质量的指标,并分别采用净资产收益率、总资产收益率和托宾q值作为衡量公司绩效的指标,对于内部审计质量对公司绩效的影响进行了实证检验。
3. 与会计信息披露相关。
程新生、孙利军、耿祎(2007)从审计委员会与内部审计关系模型出发,实证检验了我国上市公司内部审计制度的建立和实施能够完善企业的财务控制,而财务控制情况越好,信息透明度也越高。刘怡芳(2012)从内部审计的五大特征对会计信息质量的影响入手研究,结果表明,内部审计质量对会计信息质量有显著的正向影响,开展内部审计活动有助于提高上市公司会计信息质量。李嘉明、陈芳(2013)主要围绕内部审计的独立性、内部审计的专业胜任能力、内部审计的规模探讨了内部审计对上市公司信息透明度的影响,结果显示,内部审计质量与公司信息透明度呈正相关关系,而他们对信息透明度是通过六个维度进行界定的,即会计资料披露的真实性、准确性、完整性、及时性、合法合规性和公平性,这较其他学者仅仅以会计报表数字为基准更加科学。
四、研究趋势与展望
(一)研究视角有待拓宽
从已有的研究来看,学者对内部审计质量进行研究的视角仍然较为狭窄,主要体现在以下三个方面:
1. 研究热点单一,缺乏创新。
对内部审计质量与盈余管理的程度研究始终是关注的热点,尽管从2006年开始就有学者通过实证方法对内部审计质量与盈余管理程度的负相关关系进行了检验,但直到2015年,对此问题的研究仍然热度不减。诚然,内部审计质量与盈余管理程度的相关关系是重要的理论问题,但我们在文献整理的过程中发现,大多数学者就此问题的研究所采用的思路和手段基本相似,如对于盈余管理程度多采用操作性应计来反映,而内部审计质量通常选取内部审计部门的规模、内部审计人员的专业胜任能力以及内部审计部门的独立性和权威性来反映,仅仅是采用的数据有所差异,这样的重复研究缺乏理论创新。
2. 对内部审计质量影响因素的考虑欠全面。
我们认为,对内部审计质量的评价必须以内部审计质量的影响因素分析为基础,而影响内部审计质量的因素本身就是较为复杂的问题,应从多方面来考虑。现有的研究,不论是研究内部审计质量和其他方面的相关性,还是仅仅研究内部审计质量各项影响因素,多是通过内部审计部门的规模、内部审计人员的专业胜任能力以及内部审计部门的独立性和权威性这三大要素来进行,这样的研究视角过于狭窄,并不能全面地衡量内部审计的质量。
3. 对内部审计质量相关方面的研究欠深入。
就内部审计质量和其他方面的相关性研究,绝大多数学者是对内部审计质量和某一方面的相关性进行了实证研究,实际上,就学者们探讨较多的三个方面——企业的价值、盈余管理程度以及会计信息的质量同样存在着相关关系,能否对内部审计质量与企业的综合评价进行进一步的研究?除此之外,内部审计的价值增值功能已经得到了理论和实践的一致认同,是否可以考虑检验内部审计质量的提升对企业价值增值程度尤其是隐形价值增值的程度?这些问题都可以作为后续理论研究的方向。
(二)构建评价体系的方法有待多样化
1. 内部审计质量评价体系的构建方法较单一。
已有的文献对内部审计质量评价体系的构建主要采用了两种方法,即:平衡计分卡和评分法。尽管有学者对这两种方法进行了修正,但研究方法仍显单一。
2. 所构建的评价体系有待完善。
已有研究所构建的评价体系多停留在理论层面,可操作性不强,部分研究成果仅仅在小范围内应用,没有得到推广。并且在选取评价体系指标时首先要对影响内部审计质量因素的各个方面进行分析,现有研究中所进行的因素分析并没有充分利用结构分析和系统论的观点进行整合,基本上是孤立的。另外,评价指标体系的构建并不是简单的指标堆砌,内部审计质量的影响因素具有较高的综合性,并且兼具定性和定量评价指标,所以构建评价体系还需要考虑如何对评价指标进行标准化处理。同时,指标体系的权重代表了指标的重要程度,如何通过科学的方法确定各个指标所占权重也是评价体系构建需要考虑的重要问题之一。
(三)对内部审计质量的建议可以多角度进行
内部审计质量不高并非由单一因素引起,而往往是内外部因素综合作用的结果。既有审计人员的原因,也有被审计单位的原因,既有审计职业界的原因,也有社会环境方面的原因。
因此,已有研究中仅仅针对内部审计机构设置方式、内部审计人员专业素养以及创新审计方式等方面提出建议,对内部审计质量的研究工作还是停留在企业内部控制的层面,关注的重点仍然是组织内部如何控制内部审计质量的问题,这难以有效提升内部审计的质量。
未来的研究更应将内部审计放置于社会大环境中,只有从内外部、多角度探讨提升内部审计质量的方式、方法,才能更有成效。同时,还可以借鉴其他学科的成果,从技术层面有效提升内部审计的质量。
参考文献
李莲.上市公司内部审计质量影响因素分析[D].成都:西南财经大学,2011.
柯金秀.内部审计质量评价体系研究[D].成都:西南财经大学,2011.
李嘉明,陈芳.内部审计特征与信息透明度--基于深市上市公司的经验证据[J].财会通讯,2013(5).
黄国瑞.企业内部审计质量保证问题研究[D].合肥:安徽大学,2008.
蔡春,蔡利,陈幸.内部审计质量与盈余管理--来自中国A股制造业上市公司的经验证据[J].上海立信会计学院学报,2009(11).
刘怡芳,黄政.内部审计特征对会计信息质量影响研究--基于深交所主板上市公司2009~2012年的经验证据[J].东北师大学报(哲学社会科学版),2015(1).
石油安全评价方法文献述评 篇6
一、文献概述
对石油安全评价指标体系进行的研究主要有:葛家理等(2002)运用复杂性科学的理论对石油经济安全系统进行分析,通过综合集成建立石油经济安全的主指标体系,确定其安全界限,并编制石油经济安全数据库系统和预警监测系统软件;[1]吴文盛(2002)在对影响石油资源安全的因素进行分析的基础上,建立起石油资源安全评价的指标体系与标准;[2]张抗(2004)建立了单指标的石油安全预警系统;[3]郭小哲等(2005)构建了能源经济安全的多目标多因素监测预警系统,石油安全是其中一个子系统;[4]张华林等(2005)建立了石油安全评价的指标体系、评价标准和安全等级,运用层次分析法对中国的石油安全状况进行综合评价;[5]李凌峰等(2005)建立了石油安全的危机预警模型和我国石油安全评价层次结构,运用层次分析法对中国的石油安全状况进行综合评价;[6]聂富强等著(2005)认为能源安全是国家经济安全直接影响系统中的一个构成部分,保证能源安全是维护国家经济安全的重要方面,石油安全即是能源安全中的主要部分;[7]迟春洁(2006)运用改进的BP神经网络方法建立中国能源安全预警模型;[8]何贤杰等著(2006)首先确定四个基本指标:国内资源禀赋、国内生产保障能力、国际市场可得性、国家应急保障能力,再通过统计概率法和专家咨询法最终选定6个要素指标建立石油安全评价指标体系;[9]郝吉(2007)从资源禀赋、政治局势、经济影响、运输因素等方面分析我国的石油安全状况;[10]范秋芳(2007)针对中国石油安全面临的主要国内、国际态势,建立石油安全监测预警体系。[11]
二、评价与总结
(一)石油安全评价方法
根据石油安全评价方法的研究特点,分别对指标选取、权重确定、计算方法进行评价与总结。
1.指标选取
通过对石油安全评价方法相关文献的综述,可以发现在指标选取方面存在三种类型:单指标、复合指标、层次多指标。
张抗(2004)建立的是单指标的石油安全预警系统,仅选取“石油短缺量占上年消费量的比值”一个指标。这个指标反映石油供应数量上的短缺对石油消费的影响,仅仅反映石油安全问题的某一个方面。而我国面临的石油安全问题涉及方方面面,仅仅一个指标无法考虑到石油资源储量、价格波动、进口能力等多方面因素,不能全面衡量我国石油安全的状况,因此单指标方法并不能客观评价石油安全水平。
葛家理等(2002)认为石油经济安全是复杂性问题,他采用系统化、集成化的方法找出影响系统的主要因素,进而选取若干个复合指标来进行研究。作者选取储采比、投入产出比、供需比、国际市场油价和产量等几个复合指标,反映我国石油资源储量、生产、需求、国际市场等方面的情况,是国内较早建立的较为系统的石油安全评价体系。但是仍不能综合反映我国的石油安全水平,如缺少石油储备、石油贸易等方面的相关指标。而且作者没有建立综合评价体系,各个指标分别评价石油安全状况,无法形成石油安全的综合评价。
以张华林等(2005)为代表的层次多指标法,将石油安全评价结构分成目标层、准则层、指标层三个层次。准则层一般包括几个方面,吴文盛(2002)、聂富强等(2005)将之分为国内因素、国外因素;张华林等(2005)将之分为资源因素、进口因素、市场因素和其他因素;李凌峰等(2005)将之分为资源安全、进口安全、市场安全、消费安全;何贤杰等(2006)将之分为国内资源禀赋、国内生产保障能力、国际市场可得性、国家应急保障能力;郝吉(2007)将之分为资源禀赋、政治局势、经济影响、运输因素;范秋芳(2007)将之分为资源安全、供需安全、进口安全、市场安全。准则层下的指标层更具体的列出相关指标,郝吉(2007)选取的指标最少,仅在每个准则层下选取一个指标,分别为石油对外依存度、石油储备天数、管线运输能力、能源消费弹性系数等4个指标;张华林等(2005)选取了12个指标,分别为储采比、储量接替率、战略石油储备度、石油对外依存度、石油进口集中度、运输通道可靠性、石油在一次能源消费中所占的比重、石油消费增长速度、油价波动率、国际市场的石油可获得性、石油消费强度、能源可转换与替代程度,建立了较为全面的石油安全评价指标体系,后来者的研究在其指标体系基础之上不断进行补充和完善;到范秋芳(2007)时建立了16个指标的石油安全评价体系,在张华林等(2005)的指标基础上减少了石油消费强度,增加了资源储量探明程度、石油消费增长弹性、生产增长速度与消费需求增长速度比、石油进口份额、石油价格等指标。层次多指标法能够较为全面的衡量我国石油安全状况。
2.权重确定
通过对石油安全评价方法的综述,可以发现有些研究没有建立综合评价体系,如葛家理等(2002)、吴文盛(2002)、郭小哲等(2005)、迟春洁(2006),因此无所谓权重确定的问题。
在建立石油安全综合评价体系的研究中,权重确定方法主要包括主观赋值和客观赋值两大类。郝吉(2007)在指标权重确定上采用的是纯粹主观赋值法,张华林等(2005)、李凌峰(2005)、范秋芳(2007)采用了层次分析法,聂富强等(2005)采用了德尔菲法,何贤杰等(2006)采用了德尔菲法和主成分分析法。德尔菲法等主观赋值法相对于客观赋值法来说,受专家个人知识水平、价值判断标准的影响较大,不能客观地反映各指标之间的重要性。层次分析法是在建立主观比较指标重要性后,在对顺序赋值的基础上计算出指标的权重。层次分析法依然带有主观的色彩,因此刘建平、舒晓惠(2006)认为层次分析法确定的权重只能用于排序,不能作为比率权重。[12]相比于层次分析法,主成分分析法更加客观。主成分分析是将原来众多具有一定相关性、不可比(量纲不一致)的指标重新组合成一组新的互相无关的综合指标,从而既最大限度地保留了原指标的信息,又避免了指标间信息重复、不可比等影响综合评价的问题,因此主成分分析法更适合石油安全评价指标体系的权重确定。
3.计算方法
石油安全评价方法主要包括分指标评价法和综合指标评价法,在综合指标评价法中主要采用加权平均函数法和人工神经网络方法。
葛家理(2002)、吴文盛(2002)、郭小哲(2005)等没有建立石油安全综合评价体系对各个指标的安全状况分别进行评价,因此当各个指标之间的安全程度不一致时,无法获知我国石油安全的整体状况。张华林(2005)、聂富强(2005)、李凌峰(2005)、何贤杰(2006)、郝吉(2007)等采用了加权平均函数法对石油安全水平进行综合测度,公式为其中,张华林(2005)、李凌峰(2005)等运用了层次分析法,所以采用多目标线性加权函数法,公式为这种方法合理、客观,是评价石油安全水平的主流方法。迟春洁(2006)、范秋芳(2007)采用了人工神经网络法。迟春洁(2006)认为,复杂的能源系统由于其自组织性以及非线性反馈的存在,用经典的模型和理论难以研究。能源安全预警是一个最优化、函数逼近、模式分类的过程,这些正是人工神经网络最擅长的应用领域,因此可以将这种技术应用于能源安全预警的研究,对于石油安全预警问题当然也适用。当人工神经网络训练好后,对未来石油安全水平的预测简单、精确,但缺点是样本数量少导致人工神经网络的训练受影响。人工神经网络法在非线性复杂系统中具有高效的仿真能力,适用于预测未来,因此应重视这种方法在石油安全问题研究上的运用。
通过以上对石油安全评价方法的梳理可以发现:其一,指标数量逐渐增多。从单指标发展到多指标体系,最多达16个指标,基本涵盖石油安全问题的各个方面。其二,定性指标和定量指标相结合。有些要素影响石油安全的综合评价,但是没有与该要素相对应的定量指标,因此有必要设计一个定性指标,并采用人工赋值的办法将其纳入到定量分析的综合评价指标体系中。其三,计算方法多样化。指标的权重从最初由作者人工赋值,发展到德尔菲法、层次分析法、主成份分析法;石油安全综合评分由简单加权平均法,多目标线性加权函数法,发展到人工神经网络法。近几年在学者的努力下,石油安全评价指标体系研究不断向前推进,但是仍处于不断探索创新的阶段,在指标选取、权重确定和计算方法上仍存在分歧。
(二)石油安全评价结果
虽然石油安全评价方法不够完善,但是上述文献的研究结果无一例外地显示现阶段我国石油安全状况岌岌可危,处于“危险”或“不安全”的等级。
从影响我国石油安全的主导因素来看,各位学者各有侧重,但是综合研究发现,储采比、战略石油储备量、对外依存度、石油消费速度是最主要的影响因素,这几个指标的权重排名在前几位,对石油安全水平进行综合评定的影响力最大。储采比和石油消费速度反映石油供需状况,储采比显示石油资源状况和石油开采能力,体现石油供给水平;石油消费速度体现石油需求水平,这两个指标是影响石油安全水平的根本原因。对外依存度和战略石油储备量反映石油供需不均衡时的调节状况。对外依存度显示从国际石油市场进口石油以弥补国产石油自给率的不足,战略石油储备量显示紧急状态下可以动用的石油储备以保证暂时石油安全。对外依存度是中期调节指标,战略石油储备量是短期调节指标,这两个指标也是影响我国石油安全水平的关键因素。
从这四个指标的统计数据可以看出我国石油安全状况不容乐观。一是2007年我国石油储采比仅为11.3,远远低于41.6的世界平均水平。[13]这说明如果没有新发现的可开采石油资源,以当前的开采水平,十几年后我国的石油资源将被开采殆尽,届时我国的工业化进程仍未完成,缺少了石油这一战略基础物资,我国的经济发展必将受阻。二是从1991~2004年,我国年均石油消费增长速度高达7.7%,消费速度大大超过年均1.8%的生产增长速度,导致国内石油供不应求,自给率连年下降。再对比世界各地区的石油消费量,根据美国能源信息署EIA发布的《世界能源报告2005》[14]预测的2002~2025年世界各地区的石油消费年均增速数据显示,我国为4.5%,为世界最高,世界平均水平为1.9%。发达国家石油消费增速趋缓,发展中国家石油消费增速迅猛,未来石油供需矛盾压力将越来越明显。三是石油对外依存度从1990年负的20.5%,增长为2005年正的43.9%(1),说明我国近一半的石油消费依赖国际市场。根据国际能源机构2004年发布的报告,这一上升趋势并不会逆转,到2030年,中国石油的对外依存度将达到80%以上,原油进口将超过2亿吨。[15]四是我国长期以来没有建立战略石油储备体系,直到2004年才开始着手建立,但是由于起步较晚,目前我国的战略石油储备仍然很薄弱。据国家有关部门透露“目前中国战略石油储备量在200~300万吨之间,2010年前将增至1200万吨。”[16]以我国2006年消费石油34875万吨可以计算出,目前的战略石油储备也仅够4天左右的消费量,到2010年也仅够15天左右的消费量,与国际能源机构要求的90天石油净进口量和欧盟要求的90天的石油消费量的安全储备天数相距甚远。
企业业绩评价研究文献回顾及建议 篇7
一、传统财务性业绩评价方法
(一) 主要的传统财务性业绩评价方法
传统的财务性业绩评价是指利用会计报表的数据、财务指标对企业绩效进行分析的一种方法。由于运用时间较长, 比较成熟, 也比较简单, 既可以利用单一指标或某一类指标分析与评价某一方面的财务状况, 也可以利用多类指标综合评价企业业绩。传统财务性评价指标体系的核心指标主要有净收益、投资报酬率、剩余收益、杜邦财务分析等。
(1) 净利润、每股收益。净利润、每股收益是反映企业在一段时间产生的经营成果的流量指标, 因为其可以从财务报告中直接取得, 且容易理解, 所以一直是评价业绩的重要指标, 至今仍为大多数企业所采用。但利润仅仅是一个绝对值指标, 无法在不同规模的企业间进行对比, 而且没有考虑投入资本的多少, 容易导致管理人员不顾投资成本、盲目扩大短期利润。
(2) 投资回报率 (ROI) 。即净利润与平均投资额的比率。投资回报率综合了有形资本投入, 反映企业运用资产的效率。投资回报率是相对率指标, 可以对不同规模的企业业绩进行比较。另外, 投资回报率可以通过杜邦分析法分解为销售利润率、资产周转率、权益乘数等三个指标, 从而使其与企业销售、成本控制、资本结构、资本运营能力等多方面因素建立直接联系, 以寻找影响业绩的具体原因。该指标的缺点是:第一, 只关注回报, 没有考虑风险。相等回报不同风险的项目为企业创造的价值是不同的, 显然风险低的项目更有利于企业;第二, 忽略权益成本, 视权益投资为免费投资, 虚增了利润;第三, 导致企业经营者放弃高于资本成本但低于目前企业投资回报率的机会, 直接损坏企业的整体利益;第四, 只代表投资效率, 而不是财富增长。
(3) 剩余收益 (RI) 。即净利润减去资产与资本成本的乘积。剩余收益的运用至少可以追溯到20世纪50年代, 其克服了使用投资回报率指标衡量业绩带来的次优化问题, 引导经营者采用高于资本成本的决策。同时, 剩余收益还考虑了企业全部的资本成本, 包括权益成本的补偿。不同部门、行业的风险不同, 资本成本不同, 剩余收益指标允许企业按风险程度调整资本成本, 风险高的企业资本成本更高, 即使取得与风险较低的其他企业相同的利润, 剩余收益也比较低。但剩余收益是绝对值指标, 不便于在不同部门、不同行业之间进行比较且资本成本确定较困难。
(4) 杜邦财务分析指标体系。20世纪初美国杜邦公司成功创建了杜邦系统 (The Du Pont System) 。杜邦系统的核心是权益净利率, 是所有财务比率中综合性最强、最具代表性的一个指标。杜邦系统分析法通过层层分解财务指标, 直观地反映了影响权益净利率的因素及其内在联系, 揭示了企业筹资、投资和生产运营等方面的经营活动效率, 是一种有效的综合财务分析法。杜邦分析系统在企业管理中发挥了巨大作用, 也奠定了财务指标作为评价指标的统治地位。
(二) 传统财务性业绩评价方法优缺点
传统财务性评价指标体系在一定程度上很好地反映了企业的经营业绩。有些指标也非常综合, 在一定程度上满足了企业大规模、多元化发展后对其业绩评价的需要。其优点主要体现在:根据主流产权理论, 强调股东利益最大化可以同时确保其他利益相关人利益最大化, 而这种方法产权思想明晰, 强调了股东利益;在对资产收益率指标层层分解的过程中, 也更容易发现企业经营中存在的问题以便纠正;通过指标分解, 这种评价方法还能从不同角度判断和分析企业经营状况, 有助于经营状况相近的企业间的比较, 为投资决策提供重要支持。但是, 由于财务报表本身的局限性 (如货币计量和历史成本原则的影响等) 、会计政策不同选择影响可比性 (如资产计价方法的选择等) 和财务报表的真实性问题等因素, 使得传统的财务性业绩评价指标体系存在明显的局限:第一, 财务指标过分注重当期经营效果, 容易使公司追求眼前利益, 产生短期行为, 不利于激励公司追求长期的、潜在的利益, 缺乏预测性;第二, 衡量公司业绩的传统财务评价指标体系很容易被操纵, 造成企业业绩良好的假象。
二、现代业绩评价的方法
(一) 经济增加值 (EVA)
经济增加值 (EVA) 是指企业扣除了全部资本成本 (既包括债务资本成本, 也包括权益资本成本) 之后的资本收益, 具体而言, 其是企业税后净营业利润 (未扣除债务资本成本) 减去债务资本和股权资本的综合资本成本后的余额。
EVA=税后净经营利润-投资资本×加权平均资本成本
由于EVA计算过程中的NA是公司资产期初的经济价值, 没有反映出投资者投资于企业时资本的实际价值 (可变现价值) , 仍旧难以准确反映企业在给定时期为投资者创造的利润情况。1997年杰弗利 (Jeffrey) 等人又提出了修正的经济增加值 (Re-fined Economic Value Added, REVA) 。该指标认为, 公司用于创造利润NOPATt的资本价值总额既不是公司资产的账面价值, 也不是公司资产的经济价值, 而是其市场价值。因此, 要以资产的市场价值MVt-1为基础结合资本结构Kw来衡量企业的经营业绩, 用公式表示为:
REVAt=NOPATt-Kw×MVt-1
EVA (包括REVA) 概念简单, 容易理解, 是经营者能够理解的财务指标, 其意义在于:其用经济利润代替了会计利润, 能真实反映企业的经营业绩并将企业经营决策与股东财富目标联系起来, 使管理者的利益与股东的利益在矛盾和协调中取得一致, 并据此建立一种所有权激励报酬体系, 使企业管理者和员工在为股东着想的同时也能像股东一样获得应有的报酬, 引导管理者注重企业的长远发展。
尽管EVA指标与传统的财务业绩指标相比具有突出的优点, 但EVA评价体系有其自身的缺陷。首先, EVA在一定程度上存在失真。经济增加值毕竟是基于会计系统的指标, 其有效性必然受到会计制度合理性和会计信息真实性的限制。因为EVA无法识别会计报表中隐藏的虚假成分, 这是经济增加值实践中的最大问题。其次, EVA忽略了所有者以外的其他利益相关者。在当今以顾客化、竞争化为主旋律的全球经济中, 与利益相关者之间忠诚、协调的关系成为决定企业活力和成功的最重要因素, 然而EVA明显忽略了除股东外的其他利益相关者的重要性。第三, EVA无法避免管理者的短期行为及操纵行为。EVA在计算时进行了一系列的调整, 但作为一个短期指标, 还是无法避免一些管理者的短期行为以及操纵盈余行为。如果一个净现值为正的投资项目在投资的前几年EVA为负, 以后才逐渐盈利, 在这种情况下, 管理者往往会为了短期的业绩而放弃该项目, 损害了股东财富。此外, 管理者还可以通过安排收入和费用的确认时间来操纵利润, 达到增加短期经营业绩的目的。第四, EVA具有滞后性。经营业绩评价作为一种事后报告, 只是客观反映了事实, 是经营管理的效果。EVA是企业以往业绩的评价, 很难对以后的业绩做出预测, 而且也无法衡量企业在行业中创造财富的地位, 也就无法提供公司在行业中新增财富的份额, 很难解释企业内在的成长机会, 也就增加了企业对未来预期的难度。
(二) 平衡计分卡 (BSC)
1992年罗伯特·S·卡普兰 (Robert S·Kaplan) 和大卫·P·诺顿 (David P·Norton) 提出“平衡计分测评方法”, 即平衡计分卡, 创建了财务指标与非财务指标相结合的评价指标体系。第一次将创造能力和学习能力作为重要的评价指标, 将目标与战略具体化, 使经营者从更广阔的领域来审查企业的经营业绩。尽管平衡计分卡没有针对一个具体行业设计具体的评价指标, 但其以财务目标作为企业绩效评价的核心, 同时强调市场经营、内部管理、企业成长等因素在企业绩效增长过程中的作用的思想是值得吸取和借鉴的。
BSC的创立实现了对传统业绩评价系统的重大创新, 贯穿其始终的基本核心观念是鲜明的“平衡观”与“战略观”, 以财务指标作为业绩评价的核心和焦点, 强调企业在顾客、产品创新、质量等方面的经营业绩必须和财务目标联系在一起, 建立了以因果关系为纽带的战略实施系统, 弥补了战略制定与战略实施之间的差距, 有利于企业战略管理目标的实现。因此, BSC是一种自上而下的企业战略目标任务的分解与管理过程, 其始终将企业的战略目标作为中心, 将企业战略目标及实施战略的措施具体化为各部门、小组和员工个人的业绩评价指标, 从而实现企业战略与各部门、小组和员工个人目标的紧密结合。此外, 由于BSC成功地开发了学习与成长方面的业绩指标, 能够通过员工满意度调查和员工审议等程序促使战略分析返回到管理过程的起点, 即实现明确企业未来蓝图和制定战略中各部门的再次协调, 有利于对战略的重新调整, 完成了双循环的、战略性的信息反馈过程。
但BSC也并非是一种尽善尽美的企业战略性经营业绩评价系统:首先, 指标难以量化。平衡计分卡业绩评价体系虽然实现了财务指标和非财务指标的融合, 但与此同时也给绩效评价提出了一个难题, 即指标量化问题。非财务指标如何取值不是一件容易的事情。有些指标是很难量化的, 如员工满意程度、员工受激励程度等方面的指标。难以量化便降低了考核的准确性和实用性。其次, 平衡计分卡引入了权重的思想, 显然权重的设置带有浓厚的主观色彩。在实践中, 平衡计分卡往往设立过多的指标, 并任意为其分配权重, 使得员工感觉到难以取舍, 甚至无所适从。平衡计分卡业绩评价体系没有给出财务、顾客、内部经营、学习与成长四个方面在整个体系中应占有的分值或比重, 更没有给出在某个方面各个具体指标的计分比例, 从而导致实际操作中无法区分评价企业业绩指标的重要程度, 使评价结果的客观性受到影响。最后, 贯穿平衡计分卡的因果关系链很难做到真实可靠, 在短期内经理对战略影响的评价, 不得不依靠主观的定性判断。
三、构建企业业绩评价体系的建议
(一) 财务指标与非财务指标相结合
财务指标最大的优点在于其可以量化, 且操作方便、可信性高, 能够对企业战略和经营策略的结果进行量化而总括地评价, 评价结果具有较强的公信力。但财务指标容易导致过分地注重短期财务成果、急功近利思想和短期投机行为, 弱化了追求长期战略目标的动力等局限性。所以, 必须设计相应的非财务指标与之相匹配, 才能全面、系统地对企业的业绩做出正确的评价。
(二) 系统性原则
对企业业绩进行评价, 必须用若干个指标从不同角度进行衡量, 才能评价其全貌。指标既要有战略性的, 也要有战术性的;既要有总括性的, 也要有辅助说明性的。同时, 这些指标必须互相联系、互相制约, 同一层次上的指标应尽可能边界分明, 避免互相包含, 减少对同一内容的重复评价。
(三) 采用标杆管理法制定标准
标准的制定一定要参照一个合理的标杆。如果标准定得过高, 就会影响积极性并可能导致消极怠工。但如果标准定得过低, 也可能会影响积极性并可能导致“棘轮”效应。同时, 在这种情况下, 经理人员越努力, 超过标准的数额就越多, 下一年的标准就会越高。
(四) 可操作性原则
用于分析和评价企业业绩的各项指标所需的资料必须易于取得, 且同一层次上指标的权重分配要合理, 对指标权重的分配要尽量合理地采用层次分析法和标杆管理法。否则, 指标再好, 也会由于无法获取相关的资料而缺乏实际应用价值。
企业的绩效评价体系作为战略决策和执行的重要支撑, 对企业整体的运用与管理具有举足轻重的作用。我国现行的绩效评价体系在我国经济发展过程中发挥了很大的作用, 但也存在一定缺陷。有学者认为我国绩效评价体系的构建存在着不少问题, 如研究绩效评价指标的方法存在不足, 制定的绩效评价指标不够科学等, 但是不能否认目前研究取得的成果, 而且相关研究也将会继续。
参考文献
[1]池国华、迟旭升:《我国上市公司经营业绩评价系统研究》, 《财会通讯》2003年第8期。[1]池国华、迟旭升:《我国上市公司经营业绩评价系统研究》, 《财会通讯》2003年第8期。
企业绩效评价与内部控制文献综述 篇8
(一) 国外关于企业绩效评价文献回顾。
企业绩效评价, 是指运用数理统计和运筹学原理, 特定指标体系, 对照统一的标准, 按照一定的程序, 通过定量定性对比分析, 对企业一定经营期间的经营效益和经营者业绩做出客观、公正和准确的综合评判。
在企业绩效评估模型方面, Sink (2001) 和Tuttle (2001) 采用绩效评价计划编排阶段的六步程序的框架;Keegan (1997) 采用绩效评价矩阵;Lockamy (1999) 采用四理论绩效评价体系模型等。
Beni Lauterbach, Joseph Vu, Jacob Weisberg (2004) 通过调查研究了165家上市公司1989~1991的数据, 发现了内部和外部继任者对企业绩效评价的影响, 发现外部继任者比内部继任者对企业绩效评估有更好的效果。
Sunil Mithas (2011) 等通过研究发现信息管理能力, 包括对顾客的认知程度、过程了解、信息技术的了解对企业绩效评价的影响。这主要是指通过运用ERP来对企业绩效进行评价。
(二) 国内关于企业绩效评价文献回顾。
目前较流行的企业绩效评价方法主要来自西方创造的杜邦财务分析体系、平衡计分卡、经济增加值等工具。立足于我国的企业实践, 我国学者也提出了许多不同的观点。
刘睿智、胥朝阳 (2008) 基于中国上市公司2000~2006年的财务数据, 利用验证性因子分析技术构建了两个因子以反映公司竞争战略是倾向于差异化还是低成本, 在此基础上考察战略定位对公司短期绩效和长期绩效的影响。
张益明、张志华 (2011) 基于2003~2009年A股市场381家中小上市公司的面板数据, 分析了资本结构、公司治理对企业绩效评价的影响。我们发现, 这种相关性的方向与控股人性质密切相关。
二、内部控制文献综述
(一) 国外关于内部控制文献回顾。
1936年美国颁布了《独立公共会计师对财务报表的审查》, 首次定义了内部控制, 此后美国审计程序委员会又经过多次修改, 内部控制的理论经历了内部牵制、内部控制制度、内部控制结构、内部控制整体框架和企业风险管理这五个阶段。
Hermanson (2000) 通过实证研究, 被调查者非常认可内部控制的重要性, 并且认为内部控制能为公司的长远发展提供更好的保证。
Newson和Deegan (2002) 通过调查认为, 上市公司自愿性披露信息的主要目的在于体现公司核心能力和全球化竞争策略。Udi Hoitash等 (2009) 从财务专家数据库中收集了5, 480家公司的数据, 进行了相关的实证研究, 发现了公司治理和作用于财务报告的内部控制薄弱环节之间呈现一定的关系。
(二) 国内关于内部控制文献回顾。
20世纪九十年代到现在, 内部控制初步发展时期我国的内部控制研究主要侧重于会计和审计领域, 研究成果主要服务于审计程序与方法的应用、审计效率的提高和审计风险的控制。
蔡吉甫 (2005) 通过实证研究, 认为我国上市公司内部控制信息披露受到公司盈利能力、财务报告质量以及财务状况存在异常的显著影响。另外, 我国上市公司内部控制信息披露存在自愿披露积极性不高和隐瞒不利消息的问题。
林钟高等 (2007) 通过运用实际数据进行实证研究, 发现我国上市公司的内部控制的建立和完善确实对企业价值有高度显著的正向促进作用, 并随着改革的深入和证券市场的规范化, 呈现出逐年强化的趋势。
董望、陈汉文 (2011) 研究表明, 在信息“生产”方面, 高质量的内部控制提高了应计质量;在投资者反应方面, 内部控制质量越高, 盈余反应系数越大。这证实了内部控制的财务报告目标, 也证实了内部控制制度在我国的适用性。
三、企业绩效评价与内部控制相互关联文献综述
(一) 国外文献综述。
内部控制与企业绩效评价之间的关联性问题, 近几年引起了国外理论界的强烈关注。
Karen Hopper WUCK (1989) 根据私人股本融资经验数据, 运用实证研究方法, 发现了股权集中度和企业绩效之前存在一定的关系, 为企业内部控制的治理水平提供了依据。
Deumes.Ragier和Knechel.w.Robert (2008) 以1990年开始在荷兰公开上市交易的公司为样本, 对管理者自愿披露内部控制信息的经济动机进行了实证研究。研究发现, 内部控制信息披露程度与财务杠杆作用正相关。
Ashbangh和Doyle (2007) 对SOX404要求下的公司的内部控制信息披露状况进行了研究。研究指出, 组织特征在很大程度上会影响其内部控制信息披露。
(二) 国内文献综述。
企业管理层通过企业绩效评价提高企业内部控制建设中的主动性和约束性, 将企业引入正规, 加大监管力度。这方面的理论研究近几年才在国内兴起, 成为了理论界研究的热点。
陈丽蓉、周曙光 (2008) 以2008年度披露内部控制信息的上市公司为研究对象, 以内部控制信息披露程度、内部控制缺陷和内部控制部门定期提交监督报告作为内部控制效率的替代变量, 验证了内部控制效率对经营业绩的影响。
张双鹏、胡本源等 (2011) 以权变理论为基础研究了我国企业内部控制与环境权变因素的适应性, 研究结论表明:企业环境权变因素对内部控制有不同的影响, 企业应该注重内部控制与其所处的环境的适应性, 提高内部控制与其所处企业环境的适应性能够增加企业绩效。
王凡林、杨周南 (2012) 从IT治理、内部控制两个企业调控资源的措施因素入手, 探讨两个因素独立和协同对企业绩效的影响。研究发现:IT治理是信息技术大量应用于企业后公司治理活动的必然选择, 又是企业内部控制的组成部分, 这是减少信息化风险, 提升企业整体绩效的可行手段。
四、今后研究方向及建议
综上所述, 企业绩效评价对企业内部控制存在一定的影响, 在其他条件不变的情况下, 企业绩效评价对内部控制的控制质量是至关重要的。根据前人的理论研究, 都是比较分散地研究企业绩效评价对内部控制效果的影响, 以上研究大多采用实证研究手段, 但是研究变量的选取有时未能存在一定的相关性, 没能全面正确地反映企业绩效评价中的每一个要素对内部控制效果的影响, 所以还需要对二者之间的内涵关系做进一步的深层研究。
摘要:一个企业的绩效如何, 深受各方利益关系者的关注。有关企业绩效评价的研究, 也是现在理论研究界讨论的热点。同时, 企业需要通过内部控制的信息更好地进行企业绩效评价。本人在前人研究的基础上, 对企业绩效评价与内部控制的关系进行分析, 并提出建议。
关键词:企业绩效评价,内部控制
参考文献
[1]Beni Lauterbach, Joseph Vu, JacobWeisberg.Internal vs External Suc-cession And Their effect on FirmPerformance.Human Relations, 2004.12.
[2]Rani Hoitash, Udi Hoitash.Therole of audit committees in manag-ing relationships With external au-ditors after SOX:Evidence from theUSA.Managerial Auditing Journal, 2009.24.
[3]Deumes.Ragier, Knechel.w.Robert.Economics incentives for voluntaryreporting onInternal risk manage-ment and control systems.Auditing:A Journal of Practice&Theory, 2008.1.
[4]蔡吉甫.上市公司内部控制信息披露的实证研究[J].山东经济, 2005.4.
[5]陈丽蓉, 周曙光.内部控制效率对经营业绩影响的实证研究———来自中国证券市场的经验证据[J].财会通讯, 2008.3.
[6]刘睿智, 胥朝阳.竞争战略、企业绩效与持续竞争优势———来自中国上市公司的经验证据[J].科研管理, 2008.6.
[7]林钟高, 郑军, 王书珍.内部控制与企业价值研究———来自沪深两市A股的经验分析[J].财经研究, 2007.4.
[8]董望, 陈汉文.内部控制、应计质量与盈余反应———基于中国2009年A股上市公司的经验证据[J].审计研究, 2011.4.
[9]张双鹏, 胡本源, 陈利军, 刘婧.基于权变理论的内部控制与企业绩效的实证研究[J].会计之友, 2011.9.
文献质量评价 篇9
关键词:港口物流;物流服务;质量改进
一、港口物流研究综述
(一)港口物流定义
周丽娜(2006)在《我国沿海港口物流发展模式》中提出了对港口物流的理解:以港口作为整个物流过程中的一个重要节点,依托在这个节点上所形成的服务平台所进行的物流活动,发展具有涵盖物流产业链所有环节特点的港口综合服务体。梁钦(2008)对港口物流给出的定义相对比较简单:港口,作为一个从事货物装卸、搬运、储存以及加工的场所,其生产运作所形成的物流,就称为港口物流。正如Harrie.de.Leijer(2006)描述的港口已经不再是简单的海上-陆地物理界面,它已经转变成物流和配送的平台,已经成为全球供应链网络中的重要节点,所以对港口物流的研究要置于供应链的环境,从一个更高的角度进行。
(二)港口物流评价
从搜集到的文献中,对港口物流评价既有对宏观的发展环境评价,也有对港口物流的自身功能和发展水平等的微观评价。蔡远游(2007)研究了港口物流园区规划战略环境评价指标体系,建立了以社会子系统、经济子系统、环境子系统为准则层的评价体系,以厦门港口物流园区为对象,确定最适合厦门物流园区的规划方案。更多文献的是对港口物流的微观评价。梁钦(2008)将港口物流划分为港口系统和物流系统两大功能,并对两大功能系统分别建立了评价指标体系,运用商权筛选法、层次分析法、模糊综合评价进行指标的筛选、权重计算和综合评判。何汉欣(2008)也对港口物流发展水平评价进行了研究,建立了以基础设施能力、物流规模、物流服务水平、信息化水平、集疏运条件、物流支持为一级指标的指标体系。Khalid.Bichou和Richad.Gray将港口系统放到物流和供应链管理的角度衡量,构造了一个评价效率的有效框架。
二、质量改进综述
质量改进理论在制造领域广泛应用。高秀峰(2007)以一家钢铁公司进行基于全面质量管理的持续改进研究,运用因果图分析质量问题,用质量功能展开方法解决问题。刘慧春(2010)等分析了影响公路工程施工质量的主要因素和施工中容易出现的问题,提出了加强对公路工程关键环节的质量控制、对施工单位的质量控制、做好竣工阶段的质量控制工作等改进措施,从根本上确保公路工程的施工质量和经济社会效益。方建红(2009)等在通过运用质量改进统计方法找出优碳圆钢产生表面裂纹的原因,并制定了相应的技术措施,提高了优碳圆钢质量。
随着服务重要性的提升,许多学者对服务质量改进进行有益的探索。Kwang-jae.Kim(2003)等人以高速网络服务为例探讨了这个行业的服务质量改进。尹子元(2007)研究了服务质量改进的银行零售业务的应用,进入21世纪,我国金融市场逐步开放,对我国商业银行尤其是零售业务带来很大冲击,作者引出应用六西格玛质量管理方法提高我国商业银行零售业务服务质量管理的可行性,并建立指标评价体系运用因子分析法对改进前后的效果进行评价。QFD作為目前比较流行的质量改进方法,也有许多相关的文献。梁文宾(2007)等设计了应用于服务业的四阶段QFD模式:第一阶段是将顾客需求转换为服务属性测量;第二阶段将服务属性测量转化成服务过程要素;第三阶段将服务过程要素转化成服务设计特征;第四阶段是将服务设计特征转化成日常质量管理措施。李祝平(2007)介绍了质量功能展开的模式,目前已经形成了三种被广泛接受的QFD模式,即综合QFD模式、ASI四阶段模式和GOAL/QPC矩阵模式。
三、物流服务质量改进综述
(一)物流服务质量的研究
针对物流服务质量评价方法和评价指标体系研究的研究成果比较丰富,已经形成了相对成熟的理论体系和框架:定量分析大部分采用层次分析法和模糊综合判断法,指标体系的构建一般都是建立在PZB的SERVQUAL方法的基础上。
在搜索到的文献当中,相对较少的文献对物流服务质量改进展开研究。
姚晓菲等(2007)运用了QDF中的质量策划来确定物流企业的关键服务质量需求,以此指导物流企业服务质量管理和质量改进。孙效东(2008)等对军事物流服务质量进行研究,作者分析了目前我国军事物流服务现状和军事物流服务质量差异,提出了提高军事物流服务的对策。孙晓光(2008)阐述了物流服务的特点,分析了现在物流企业服务中存在的问题,提出采用PDCA循环方法的物流企业服务质量的改进方法。祝世富(2009)也对提升我国第三方物流服务改进展开研究,作者运用了DMAIC模型,也就是六西格玛改进模型,论述了DMAIC模型提升3PL服务质量的可行性和有效性,说明对于我国急需尽快做大做强并迅速提高服务质量的第三方物流业来说,应用DMAIC模型来规范业务流程和提升服务质量时,其应用效果要比制造业更加明显。叶阿真(2010)专门针对第三方物流进行研究,运用价值分析法对第三方物流服务质量进行评价,得出当服务质量与标准存在差距时,进一步采用QFD方法来分析影响质量指标的因素及其各自的重要程度。
(二)港口物流服务质量的分析
姚亮(2004)运用委托代理理论解释了在组织港口物流过程中可能出现的各种问题,探讨了港口物流服务质量的概念。吴永富(2004)对港口现代化评价指标体系进行了探讨,设立了一级指标和二级指标,并运用德尔菲法经专家打分赋予各指标以权重,并将结果反馈给专家,在一级指标中就包括港口生产绩效和服务质量现代化这一项。王磊、吴庆军(2007)以日照港为为例构建了港口服务质量评价指标体系,包括功能质量指标、过程质量指标、关系质量指标、价值质量指标。Xinlong.Jiao,Xuelian.Liu(2008)分析了AHP方法存在的不足,从而引入模糊综合评价方法弥补不足,并以宁波港为模糊评价的案例分析。
港口在我国物流网络中是一个重要节点,港口物流服务质量的改进,能够带来港口物流服务质量的提升,也能够促进我国外贸业务的开展,提升外贸水平,因此对与港口物流服务质量改进的研究也将会不断更新和发展。(作者单位:青岛酒店管理职业技术学院)
参考文献:
[1]周丽娜.我国沿海港口物流发展模式研究[D].武汉:武汉理工大学,2006:1-2.
[2]梁钦.港口物流功能综合评价研究[D].大连:大连海事大学,2008:4-7.
文献质量评价 篇10
1 研究方法
1.1 检索策略
根据研究主题设置检索词:医院、医疗机构、绩效评价、绩效评估。检索式:(1)关键词=医疗机构or 医院(2)关键词=绩效评价 or 绩效评估(3)1#and 3#;检索维普数据库(VIP),中国生物医学文献数据库(CBM),中国知网(CNKI)和万方数据库。检索日期:建库到2010年10月。
1.2 文献纳入及排除标准
纳入标准:涉及我国医院绩效评价方法相关研究文献,其中医院包括各级医疗机构
排除标准:声明、会议纪要、报道、征文稿约、通知等消息类文献;与医院绩效评价方法相关内容无关的文献,如涉及企业绩效评价、人力资源管理等。
1.3 数据提取
采用事先反复修订好的数据提取表,数据由一人单独提取,另一人审核。内容包括医院级别,绩效评价方法,考核对象,评价指标,后效评价。
1.4 统计分析
主要采用描述性方法对纳入研究进行分析。数据提取表通过归纳分析及记录整理后,采用统计软件SPSS16.0进行相关方面的统计和分析研究。
2 结 果
2.1 纳入文献情况
电子检索VIP、CNKI、CBM、万方数据库,共检索到文献461篇。阅读题目:排除重复文献67篇;阅读摘要:排除信息不全文献、会议摘要,报刊文章等81篇,纳入313篇全文;阅读全文:排除197篇不符合纳入标准的文献,最终纳入文献116篇。
2.2 绩效评价方法文献分析
2.2.1 方法数量
文献中涉及到的绩效评价的方法包括:平衡计分卡法(BSC)21.55%(25/116);层次分析法(AHP)14.65%(17/116);TOPSIS法15.51%(18/116);关键绩效指标法(KPI)15.51%(18/116);综合分析法12.93%(15/116),密切值法6.03%(7/116),德尔菲法2.58%(3/116),经济增加值法(EVA)1.72%(2/116),因子分析法、360度绩效反馈法、病例分析法、双要素二维四象限法均为0.86%(1/116)。
2.2.2 医院级别与绩效考核方法
116篇纳入文献中,明确表述医院级别的共59篇。其中三级甲等医院占79.66%(47/59),采用方法主要集中在平衡计分卡法29.78%(14/47),层次分析法21.27%(10/47),关键业绩指标法21.27%(10/47),TOPSIS法、综合分析法均占10.63%(5/47);二级医院共占 11.86%(7/59),采用的主要考核方法为TOPSIS法42.85%(3/7)、综合分析法28.57%(2/7);社区医院11.86%(7/59),采用绩效评价方法仅三种为:TOPSIS法57.14%(4/7)、综合分析法28.57%(2/7)和主诊医生负责制14.28%(1/7)。
2.2.3 绩效考核对象
根据绩效考核针对对象的不同分为:全院31.03%(36/116);医疗单元25%(29/116);财政部门8.62%(10/116);护理科室7.75%(9/116);后勤部门1.72%(2/116);未明确提及25.86%(30/116)。
2.2.4 评价指标体系
由纳入文献中提及的指标级别进行归纳,目前的评价一级指标主要包括社会效益、工作质量、工作效率、资产运营、发展潜力这五大方面,二级指标的制定有很大差异,集中在七大类:基础设施、信誉指标、经济效益、工作效率指标、医疗质量指标、患者负担指标、工作效率等。
2.2.5 绩效考核方法的比较
2.2.6 后效评价
文献报告中采取后效评价的共占22.41%(26/116),后效评价指标多选用满意度调查76.92%(20/26);无后效评价占77.58%(90/116)。
3 讨 论
3.1 我国医疗机构绩效评价现状
为实现医疗行业的良好健康发展,1987年国家开始研究医院分级管理评审工作;1989年国家卫生部颁布的《医院分级管理办法(试行草案)》,是由政府主导的以外力推动医院质量改进的有效办法,对改善医院医疗质量和管理水平发挥了重要作用;1994年,国务院颁发《医疗机构管理办法》;2005年卫生部又颁布了《医院管理评价指南》,包括医院管理、医疗质量管理与持续改进、医疗安全、医院服务、医院绩效、部分统计指标和三级医院指标参考值7个部分[9]。最近召开的“十二五”中解决群众“看病难、看病贵”,实现人人享有基本医疗卫生服务目标,依然为未来五年计划的发展主题[10]。国家将医疗机构的绩效管理置于工作的重点。
我国卫生体制的进一步改革,医疗市场的竞争日益激烈,医疗费用的过快增长问题已经成为社会关注的要点,社会各界都在想采取什么样的措施及服务,来提高医院绩效,降低运营成本。在政府相关政策的支持指引下,我国各型医院纷纷根据自身情况采取相应的绩效评价方案,在一定程度上取得了很大的进展。传统的现存绩效评价理论和方法多种多样,但多注重经济效益,企业特点较强,因此对于医疗服务这个特殊行业来讲,不能照搬应用。近年来,针对医院经营管理中存在的服务效率低、满意度下降、资源配置不合理等诸多问题,国内一些医院管理者和学者通过对各级、各类医院及内部管理多层面的调研开展了关于医院绩效评价的理论和实践研究,初步建立起医院、科室、岗位三级评价体系,但尚未形成普遍公认和广为接受的理论及方法体系[11]。
3.2 绩效考核方法的选择
现有的关于医院绩效评价的文献涉及方法中平衡记分卡法、层次分析法、TOPSIS法、关键绩效指标法、综合分析法共占80.17%,其它一些方法如主诊医生负责制、因子分析法、360度绩效反馈法、病例分析法、双要素二维四象限法虽然在某医院显示出有效性,但尚未得到广泛应用。大多文献绩效考核是针对三级甲等医院的医疗单元且多在理论及方法论层面上进行讨论,资料完整度低,护理科室、后勤部门、财务部门报道较少仅18.10%,一定程度上反映了缺少从全局长远发展的战略意识。即使是三级甲等医院,采用的绩效评价方法基本上集中于上述层次分析法、平衡计分卡法、TOPSIS法、KPI关键绩效指标法、综合分析法这几种,并没有专门针对医院不同的情况表述为何选用某种方法,以及此种方法相对于其它的优越性及不足。就目前文献资料,平衡计分卡法由于其应用时间久,评价指标的选择全面合理,备受三级医院的青睐[12],二级及二级以下医院多采用TOPSIS法,因其操作方便,对数据形式要求少。不同的方法均有各自的优缺点,综合分析方法的应用充分发挥不同方案之间的优势,在不同的步骤情形下适时采用相应较为优势的方法,合理的规避缺点,在一些医院的实例中得到了证实。然而,现有的文献资料较少,不具有充分的说服力,有待进一步研究。
实际工作中,可以由医院流程来思考组织架构,思考每一个流程具体环节是否真正具有附加价值,分析组织的关键价值流程,设计高效流程管理系统,建立以流程为主导,朝向组织远景迈进的制度和架构;对外倾听顾客的声音,对内重视绩效和激励,持续改革、鼓励创新;整合制度和架构紧紧相扣,支持医院的竞争策略[13]。有关专家可以进一步进行研究,结合国内外现有的绩效评价实例,总结出一套理论依据更加坚实的评价系统。
3.3 绩效考核中二级指标的制定
各家医院绩效考核二级指标的具体制定差异及灵活度大,没有较为统一的评价标准及制定原则。评价指标多是针对目前的利益效率发展,如年终考核、岗位聘用、收益等,指标设置较少涉及整体目标的发展、长远战略的实现,没有科研能力及成长性的评价;作为社会公共服务部门,患者满意度及社会效益的响应指标所占权重小,不能起到推动整个医疗环境健康发展、资源合理配置,减少社会矛盾的作用。
3.4 绩效反馈机制
上述结果已经显示目前的绩效评价体系采取后效评价的仅占22.41%,大多数情况下,绩效考核结束后没有相应的反馈,员工依旧不明白自己的工作问题,不能及时有效的改正错误,完善相应的工作流程,没有最大限度的发挥绩效考核提高员工的工作绩效和职业能力作用[14]。仅有的反馈机制多是满意度、调查问卷之类,过于单一,不能很好的反应实际情况,良好的绩效评价在很大程度上取决于后效评价机制是否完善,有效。虽然我国医院在绩效评价的实施方面已有较大的进展,但是实施后的效率略显不高,很大原因就是一直采用之前选定的方法,而没有根据相应的反馈进行调整,每家医院的个体情况不同,不能照搬其他医院的经验,而只是应该作为参考并加以适当的调整。因此在后效评价方面应加大研究和实施力度。
3.5 文献信息
目前的文献中,涉及医院绩效评价方法的多为方法学的理论报道,包括不同方法中各级指标的设定过程,改进意见,个案实例报到极少,因此可以提示的信息不足。在理论研究日益成熟的基础上,相关机构和研究学者可以加大力度报道医疗机构中取得较好效果的绩效评价方法和具体的实施过程,尽可能提供信息,如涉及的具体部门、指标的制定、后效评价等,不仅可以供全国的医疗人员进行学习,同时能够及时的发现自身的问题,及早合理的解决。
3.6 意见及建议
【文献质量评价】推荐阅读:
生活质量研究文献综述07-23
文献信息检索课程文献检索参考课题05-24
教育质量综合评价评价06-02
翻译质量评价07-15
教育质量评价07-16
盈余质量评价05-09
耕地质量评价06-09
培养质量评价08-12
质量综合评价08-27
质量评价机制09-15