ROST反剽窃系统:能否抵制学术不端

来源:百度文库 编辑:神马文学网 时间:2024/04/29 07:40:50

●该系统多次抽样检测表明,如今高校内学术抄袭现象严重,从教师到博士生、硕士生、本科生,抄袭的程度逐步递增。

●该软件目前不给个人使用,只针对单位用户开放,因为有教师担心:“怕学生找老师的麻烦”。

●相对于人工筛查,反剽窃软件作为初筛工具,已经展现出它的优势,对于遏制学术不端行为具有一定的作用和应用前景。


实习记者 奚平

        在院士抄袭不再是新闻的今天,一种新问世的反剽窃软件系统悄悄地推广应用,已在二十多所高校掀起了无声的波澜。据新华社武汉4月4日电讯消息,今年全国部分高校将启用该系统对研究生学位论文进行检测。
    
检测490万篇文献
        针对学术不端行为的检测系统——ROST反剽窃软件,目前已在全国二十多所高校院系推广和一百多家期刊社使用。据部分用户反映,作为初筛工具,该软件能够最大程度地杜绝有抄袭可能的论文得以通过或发表。“ROST反剽窃系统”软件的独特性能逐渐受到有关部门的高度关注。
        武汉大学信息管理学院出版科学系副教授沈阳作为“ROST反剽窃系统”软件的自主研发者,早在2003年他在美国做访问学者的时候,就开始关注国外的反剽窃研究。经过6年研发,该系统于2008年4月研制成功,并根据用户反馈意见逐步升级。这项在国家自然科学基金和其他项目资助下研发的ROST文档相似性检测工具(为避免太敏感有时也叫相关性检测工具),通过比对源文档和目标文档的相似性给出相似度结果,从而能够有效地检测出论文的抄袭相似情况。
        虽然问世仅半年,但是ROST反剽窃软件已展示不凡身手,令人刮目相看。沈阳回忆说,那是2008年11月的事情。在北京举办的一次计算机领域国际会议征稿过程中,应用该系统进行检测,“从随机抽查的6篇应征论文中,轻易检测出其中的1篇论文其内容属于全文抄袭,唯一不同之处则是抄袭者仅在标题中增加了一个词汇而已。”当年12月,“ROST反剽窃系统”在由国家新闻出版总署举办的期刊创新年会以及武汉大学举办的数字时代出版产业发展与人才培养国际学术研讨会上得到推介和应用。从此,该软件因其实用性而被部分高校和多家期刊社所青睐。
      沈阳介绍该软件的工作原理时说,反剽窃软件自动将目标文档切割为多个200字(可自定义)的小文本,通过混合引擎将其与相关网页和490万篇文献进行模糊匹配,标示出每个文本块与文献库中的某些文献的最大相似度。由此,该软件可统计出上述两者之间的相似字数所占总字数的比例。如相似度大于或等于95%,则可认定为基本原封不动抄袭;相似度大于或等于80%,则可认定为略作修改后抄袭。95%和80%这两个比例即作为剽窃(相似)程度的衡量指标。
      据了解,该系统根据重合字符数量与文字复制比例,检测结果分为轻度句子抄袭、句子抄袭、轻度段落抄袭、段落抄袭、整体抄袭等5个类别。此外,还有针对数据篡改、内容伪造、引用杜撰等方面的多个检测指标。
      该软件推出以来,沈阳的工作小组曾借助反剽窃系统,开展了对学术剽窃现象的专门检测。而在对一所部属高校的学生课程论文进行检测时,结果既让他兴奋,又使他感到难过。“从783篇论文中检测出涉嫌抄袭者过半,其中全文抄袭的论文161篇,占20.4%;段落抄袭256篇,占33.2%。”“在某个院系的30篇博士学位论文检测中,存在学术不端行为的有4篇。”沈阳介绍,该系统多次抽样检测表明,如今高等院校内学术抄袭现象严重,从大学教师到博士生、硕士生、本科生,抄袭的程度逐步递增。

高校启用的喜与忧
      沈阳介绍说,根据2008年国际反剽窃大会给出的定义,凡是会引起原创性误会的均称为剽窃。他说,20世纪90年代后,互联网的普及,包括搜索引擎、文献资源库、翻译软件的大量涌现,导致剽窃现象快速蔓延。过去,论文剽窃多靠人工发现,而实际上单靠人工筛查,很难在海量的信息中找到稿件的剽窃来源,加之审阅者若未能熟悉相关稿件的细化研究领域等原因,使得剽窃作品被查出的风险较小。而借助这种先进的反剽窃检测工具,情况就大不相同。
      厦门大学会计发展研究中心杨颖瑜老师在接受记者采访时印证了上述说法。她说,这是一个很不错的工具,那么多学生,想太仔细地审看文章很不现实,用软件把关,再人工审定,迅速而有效。
      然而,启用该检测系统,在高校学生中却引发了争议。一些学生除了叫好外,由于不清楚该系统如何检测,因而产生会不会被技术“误杀”的担心与困惑。北京地质大学一学生说:“软件又没有灵性,只知道比对文字。它要是把我文章中的‘合理引用’判定为‘抄袭’,我找谁诉苦去呀!”
      对此,沈阳解释说,该软件的检测结果只是作为一个参考,并非对剽窃作出结论,而只是显示目标文件与现存文献相似度高于80%的文字比例所占文章总数比例的多少。因此,他认为高于80%相似度的文字才是需要关注的,低于此值可以忽略。另外,沈阳表示,他将继续优化软件功能,以便使得误判的可能性降至最低。
      对于部分同学的上述疑虑,高校有关工作人员大都强调,教师应用该系统,只是作为初筛工具。华中科技大学研究生院学位办公室一负责人说,对于疑似问题论文是否合格,最终还须以学校学位审议委员会专家的鉴定为准。
      由教育部主管、武汉大学承办的《图书情报知识》杂志社编辑李明杰也向记者介绍说,该社启用“ROST反剽窃系统”软件,有自己的一套工作方式。鉴于平素只有4%—5%的用稿率,该社编辑们对于能够用专业知识确定的文稿来源,一般不借助于该软件;而对于借助软件检测的结果,审阅者也不会将其作为定性的依据,仅仅视其为工作中的一个环节加以对待,抄袭与否,仍将以自己的判断为主。
      尽管如此,相对于人工筛查,反剽窃软件作为一项新技术和初筛工具,虽然在技术上仍有一定的局限,但已经展现出它的充分优势,对于遏制学术不端行为仍具有一定作用和应用前景。
      有意思的是,有人表示,“浙江大学药学院事件”被披露,就有该软件的功劳。该软件目前不给个人使用,只针对单位用户开放。因为有教师担心“怕学生找老师的麻烦”。对此,沈阳没有正面回答,只是表示,希望得到社会各界的理解和支持,并将积极吸收用户意见,进一步完善升级该软件,以逐步遏制广泛存在的简单抄袭现象。对于替换篡改以及翻译性的抄袭,他也将作进一步的研究。

编辑短评

一个软件够吗?
  
      近年来,造假、抄袭、剽窃他人学术成果等学术不端行为屡有发生。高校、科研院所等学术科研领域原本是清静之地,如今成为学术不端行为的“重灾区”。
      学术不端行为的产生虽然有着个人经济利益、体制弊端等原因,但实质原因就是人的学术道德和自律问题。但是,指望一个软件就能彻底遏制学术不端行为的想法显然有些一厢情愿。毕竟,作为没有生命和思想的软件,它只能按照操作者输入的一些数据来进行比较和甄别,它起到的只是参考作用,是否存在剽窃行为最终还得由具有思维的人来裁决。
      教育部为进一步加强高等学校学风建设,惩治学术不端行为,近日下发了《关于严肃处理高等学校学术不端行为的通知》。加之此前教育部社会科学委员会投票通过的《高等学校哲学社会科学研究学术规范(试行)》,正好为诊治当前的学术不端行为提供了管理规范。
      一个软件、一个规范,建起了两道遏制学术不端行为的“防火墙”。效果如何,我们拭目以待。(孙龙)