“木兰”套壳,科研打假不妨引入人工智能

新京报网

text

近日,中科院计算所发布的国产编程语言“木兰”被质疑套壳Python引发热议。经中科院计算所初步调查,编程语言“木兰”系所内员工刘雷创办的中科智芯研发的集成化产品,其开发包中包含了Python开源编译器,却对外声称“完全自主”。该行为存在欺瞒与虚假陈述的科研不端问题。

对此,中科院计算所对刘雷的初步处理是停职检查,编译实验室负责人也被责令作深刻检讨。此外,中科院计算所还将对这一问题进行深入调查,并在未来公布处理结果。

防止学术打假,可引入AI技术

科研或学术不端的原因多种多样,急功近利、意欲早日出名获利的心理动机,是个重要因素。在此心理的驱使下,有的人有意造假,有的人则是试探性造假。

但在如今信息互通互联、“技术帝”遍布网络的背景下,那些“贴牌”或“套壳”技术的翻车并不意外,而是必然。“你可以一时欺骗所有人,也可以永远欺骗某些人,但不可能永远欺骗所有人”,在互联网时代也得以应验。之前“汉芯1号”从产品发布到被曝光造假经过了4年;而今,木兰从高调称“完全自主”到被定性为“科研不端”,只用了4天。

如今,中科院对这一学术不端行为进行了初步处理。而要让类似事件绝迹,在学术打假上或许可采用更多手段。

前段时间,美国斯坦福大学博士伊丽莎白·比克曾在国外学术交流在线平台PubPeer上质疑我国学者多篇论文存在图像造假问题。当时她提到,可以利用人工智能来帮助“打假”。从效率上来看,在过去5年里,比克已经花了将近5000个小时来“纠察”论文,但如果用打假的AI软件,效率会提高很多。

全球最大的出版集团之一爱思唯尔,也积极研发和采用AI软件来打假。2017年爱思唯尔就研发了一套名为Evise的软件,来帮助进行论文的同行评审。总部位于瑞士洛桑的网络期刊出版商“洛桑前沿之声”,也推出了AI软件AIRA来进行审稿。

中国国家自然科学基金委员会也正在尝试利用AI系统来打假。原理是利用自然语言处理技术抓取在线科学文献数据库和科学家的个人网页,收集申请者和潜在申请者的出版物或研究项目的详细信息,再综合人工审核,以判断申请人是否存在造假行为。如果“论导师崇高感”之类的文章,放到现在再重新过审,很可能会被AI的火眼金睛识别出异常。

而以“木兰”为例,它虽然不是一篇学术文章而是一种编程语言。但这种语言有多大程度上是照搬Python语言,对于AI来说应该不是难事。

因此,从长远来看,AI和人工相结合的审核方式,在“学术打假”过程中将大有可为。

处罚学术不端,可考虑建“黑名单”

另一方面,对学术不端的处理除了零容忍外,还需要对造假的打击更为严厉。关于学术不端,美国有多种措施,而且处罚非常严重,值得借鉴。美国一旦对研究不端行为的指控被查证,学术不端者在一定年限内将不得参与任何由美国政府资助的研究项目(从18个月到10年不能获得联邦政府的研究经费),也不能在美国公众与卫生服务部设立的任何咨询委员会、评审委员会任职。

此外,学术不端者的身份信息将在研究诚信办公室网站上公示,以供查询,直到处罚时间到期,学术不端者的名字才会在网站上消失。当然,对于学术不端行为者还会有被开除公职甚至判刑的处罚,而后者是迄今最为严厉的惩罚。

比较起来,我国处理学术不端似乎偏轻。2017年1月1日实行的科学技术部《国家科技计划实施中科研不端行为处理办法(试行)》,考虑到不同的调查机构其处罚权限不同,规定了相应的处罚方式。

如项目承担单位可以对科研不端行为人做出“记过”“降职”“辞退”等处罚;行业主管部门、地方科技部门可以采取“在一定范围内通报批评”“禁止参加其主持的国家科技计划项目”的处罚;科技部可以“终止项目,收缴剩余项目经费,追缴已拨付项目经费”,甚至“在一定期限内,不接受其国家科技计划项目的申请”。对于某个科研不端行为,这些机构可以在各自职责范围内分别做出处理决定。

但这些处罚不足以彻底震慑和打击学术不端行为。针对“木兰”造假事件,如今相关单位目前做出了“停职检查”的处理。接下来,会否有进一步的处理,最终处理与造假蒙混过关后获得的利益是否相称,也值得观察。

无论如何,为了防治学术造假,都有必要在事前审核与事后处理上多下些功夫,别让急功近利者污染了整个科研群体的形象。

□张田勘(专栏作者)