交待好基础研究事业群的事情后,许道微刚回到办公室没几分钟,沈向洋和林斌二位总监联袂而来。
“老板,智慧应用事业群的下一个项目需要你亲自审批!”沈向洋顺势递给许道微一沓资料。
许道微瞟了一眼,赫然看见几个大字,“华夏知网”。或者说华夏知识基础设施工程项目。瞬间,许道微就明白了为何这么一个子项目,沈向洋却正儿八经的拿来给许道微申请。
华夏知网以实现全社会知识资源传播共享与增值利用为目标,建立起华夏知识资源总库。并衍生出来学术期刊,论文,文献,年鉴等一系列的子产品。
简单来说,华夏知网就是华夏最全的网络图书馆,或者说网络出版平台。沈向洋的新项目换汤不换药,唯一的区别就是弱人工智能做事情可谓是轻而易举。
沈向洋纠结的原因许道微也清楚,和饶毅博士心心念念的是同一件事,就是学术造假。
近年来,揭露出的学术造假事件层出不穷,有些已经到了堂而皇之的地步,而华夏多所高校也相继卷入旋涡,其涉及到的学术领域更是不胜枚举。
在国家管理部门严抓强打,学术泰斗严加抨击的情况下,学术造假竟不为所动,甚至成半公开化趋势蔓延,严重妨碍了人才培养与选拔机制,扰乱了社会学术风气。
许道微知道,这几年此类情况并不突出,直到2006年迎来第一个波峰,之后2009年更是发生了浙大贺海波事件。
在工业界的事故分析中,有一个著名的“海因里希”法则,即“在一起重伤或死亡的严重事故背后,非常可能有29起轻微事故,以及300处潜在的安全隐患。”这个数值是海因里希进行实际统计的结果,也被称为“300:29:1法则”
学术界同样提出一个类似的法则:在一起低劣的、明目张胆的学术造假事件背后,非常可能还有N起不易被发现的、高明的学术造假,以及M起数据修饰。N和M取决于不同学科、不同课题组,在没有深入某个课题组进行调查的情况下很难确定,但以目前的情况来看,这个课题组M和N的数值恐怕不会小于29和300。
这类法则逻辑上很容易理解,如果规范制度合理、执行严格,出现严重事故的概率是很低的。市面上大多论文查重的网站,或者期刊。受限于本身的数据库和算法,均有相当大的漏洞,给了很多造假者堂而皇之造假的机会。
弱人工智能在数据库和算法上,完全可以做到让造假者无处可逃。不再是简单的连续词条比对,而是从论文整体就开始进行判断,并且能收集到互联网上的所有数据信息。
“咚咚咚!”许道微的食指不断在桌面上敲击着,好一会儿,许道微问道:“为何打算做这个项目?”
沈向洋回道:“智慧应用事业群近期的工作主要是智能百科,智能客服等项目的升级优化,以及协助林斌总监研发第一代智能翻译机。知识库项目不仅是公司在知识领域的重要拼图,也是搜索产品的生态补充。在近期很难开展大项目的情况下,知识库和图片搜索项目很适合事业群近期的规划。
我认为一个好的学术环境,对于吸引高端人才回国有很大的好处。暂时公司只是给用户提供一个更完善的查重工具,至于是否披露学术造假问题可以视情况而定。”
学术造假,或者说学术不端问题,历史非常久远,甚至可以追溯到现代科学启蒙之时。由于几个世纪之前对于学术伦理问题的要求还未形成统一的普世概念,再加上时间久远,很多案例都被掩盖在历史的尘埃之中。
科学界有那么几个名字,在各自的领域中如同太阳般耀眼。但正如太阳上也存在太阳黑子,这些伟人的学术历史也有一些那么不太光彩的往事。
现代科学的奠基人牛顿,遗传学的先驱者孟德尔,微生物学的领路者巴斯德……都曾陷入到学术不端的漩涡。
国内学术论文大部分是属于亳无价值的假论文,垃圾论文,这些造假的论文对科学的主要危害是会误导学术研究,让有意探索学术真谛者也被误入歧途,偏离真理,对自然科学作出错误的理解,危害无穷。
至于为什么要造假?主要原因包括:学生毕业要有毕业论文。因此,为了毕业,很多大学生只好写一篇假论文应付过关;单位评职称要以论文为指标;科研单位为了弄到国家科研经费。
例如,有人统计认为,华夏关于心脏干细胞的论文就有1.2万篇造假。为了功成名就,发表的论文数量越多越有名气,于是就冒险造假或把一篇论文拆开写成几篇,或小题大做,把一些芝麻蒜皮的无关紧要的问题也写成一篇篇论文。
当然学术造假不只国内有,近日据英国媒体报道,英国高等院校招生委员会用一款名为Copycatch的防学术欺诈软件查到,去年有4559人的大学个人陈述文件内容可疑。
其中,800名医学专业申请者提交的个人陈述来自同一网站,234人用同样一桩童年趣事说明学习动机:“我8岁生日那天用一套化学实验用具做实验,不小心在我睡衣上烧出个洞,我从此爱上科学。”