第189章 学术啄木鸟 二
第二天。
徐辰打开pubpeer,看到了那条简短而傲慢的回覆。
【作者回復】:感谢关注。鑑於该论文发表时间较早,原始数据的归档检索较为复杂。但我们对研究结果的完整性和结论的科学性充满信心。因此,对於此类匿名的推测性指控,我们不予置评。
“充满信心?不予置评?”
徐辰看著屏幕,气笑了。
这哪里是回復?这分明就是赤裸裸的敷衍和傲慢!
“年代久远就能当挡箭牌?一句『充满信心』就能死无对证?”
“行,既然你们不见棺材不落泪,那我就给你们来个大的。”
徐辰的眼神变得锐利起来。
他意识到,光靠这一篇论文的几张图,確实很难锤死一个诺奖大佬。毕竟人家可以说这是“误操作”,是“图片误用”,大不了发个勘误就混过去了。
要想彻底揭穿这个谎言,必须要有更系统、更全面的证据!
……
徐辰打开了python,手指在键盘上飞快地敲击。
“既然要锤,那就锤死。”
“既然塞门扎这篇论文有问题,那我们就顺藤摸瓜,看看他的其他论文。”
徐辰编写了一个专门的爬虫脚本。
目標:pubmed资料库。
对象:塞门扎及其团队过去20年发表的所有论文。
抓取內容:所有western blot、免疫萤光、流式细胞术等实验图片。
“运行!”
“顺藤摸瓜,我倒要看看,你这棵大树底下,到底埋了多少雷!”
……
隨著回车键按下,爬虫开始疯狂工作。
数千篇论文,数万张图片,如同潮水般涌入徐辰的硬碟。
紧接著,徐辰启动了他刚刚编写的“图像查重算法”。
这个算法融合了sift特徵点匹配、频域分析以及他在slrm中用到的几何相似度计算。它就像是一只不知疲倦的猎犬,在海量的图片数据中,寻找著那些被隱藏的“双胞胎”。
……
这一夜,徐辰没有睡。
电脑的风扇在疯狂咆哮,cpu和gpu都在满负荷运转。
屏幕上,进度条一点点推进。
每隔几分钟,就会弹出一个红色的警告框:
【警告!发现高度相似图片组!】
【来源1:2008年《jbc》,图3a】
【来源2:2012年《pnas》,图5c】
【相似度:99.9%(经过旋转180度並水平翻转)】
……
【警告!发现图像復用!】
【来源1:2014年《cancer research》,图2b】
【来源2:2016年《oncogene》,图4d】
【相似度:100%(仅调整了对比度)】
……
看著屏幕上不断跳出的红色弹窗,徐辰的表情从最初的震惊,逐渐变成了冷笑。
这哪里是偶尔的失误?这分明就是一场持续了二十年的造假!
有些图片甚至连裁剪都懒得做,直接把十年前用过的图,换个標题,改个亮度,就堂而皇之地贴在了新论文里。
更离谱的是,有一张看起来很普通的细胞图,竟然在不同的年份、不同的期刊、不同的课题里出现了四次!一会儿它是癌细胞,一会儿它是正常细胞,一会儿它又是经过药物处理的细胞。
这简直就是把学术界的智商按在地上摩擦。
当清晨的第一缕阳光洒在键盘上时,算法终於跑完了。
徐辰看著最终生成的报告,即使早有心理准备,也不禁倒吸了一口凉气。
“好傢伙……”
报告显示,在塞门扎署名的论文中,竟然有超过30篇存在明显的图像復用和ps痕跡!
这些论文跨越了近20年,涉及多个顶级期刊。
有的图片是“一图多用”,在不同的论文里代表不同的蛋白;有的图片是“移花接木”,把同一个条带剪切下来贴到不同的位置;还有的图片甚至是“无中生有”,直接用ps画出来的。
“这就是所谓的诺奖团队?”
“这就是所谓的学术权威?”
徐辰看著那一个个触目惊心的红色標记,心中涌起一股难以言喻的愤怒。
这不再是猜测。
这是铁证如山的大数据证据。
这是对整个科学界的嘲讽。
“既然你敢造假,那就別怪我不客气了。”
……
电脑屏幕的蓝光映照在他略显疲惫却异常亢奋的脸上。经过整整一夜的算法挖掘,那个名为“塞门扎造假证据”的文件夹里,已经塞满了高达2gb的数据。
这不仅仅是数据。
这是核弹。
徐辰深吸了一口气,开始编写最终的分析报告。
第一次的“试探性攻击”虽然被对方轻描淡写地化解了,但也让徐辰摸清了对方的底牌——傲慢与侥倖。既然对方选择了无视,那这一次,他就要用绝对的数量和无法辩驳的逻辑,彻底击碎他们的心理防线。
他没有使用任何情绪化的词语,也没有用任何惊嘆號。他只是像一个冷酷的法医,用最精准的手术刀,將这具庞大的学术尸体解剖开来。
报告標题:《关於塞门扎及其团队多篇论文中图像异常的数学分析》
第一章:方法论。徐辰简要介绍了自己开发的“基於频域特徵与几何相似度的图像查重算法”。他公开了核心代码,任何有编程基础的人都可以復现他的检测过程。这是为了证明:这不是主观臆断,这是数学铁律。
第二章:证据链。这是最长、最触目惊心的一章。徐辰將32篇涉嫌造假的论文按时间轴排列。每一张造假图片都被他做成了对比图:左边是原图,右边是经过偽彩色处理和边缘检测后的分析图。红色的框线,精准地圈出了那些被复製粘贴的区域;绿色的连线,將不同论文中“穿越时空”出现的同一块蛋白条带连接起来。
案例1: 2008年发表在《jbc》上的图3a,其背景噪点分布,与2012年发表在《pnas》上的图5c,相似度高达99.99%。案例2: 2014年《cancer research》中的一组流式细胞图,实际上是同一张图经过了不同角度的旋转和拉伸。徐辰甚至贴心地还原了旋转角度:顺时针32.5度。案例3: sterling的那篇奠基性《nature》论文,关键的hif-x条带,在频域上显示出明显的人工涂抹痕跡,那是ps橡皮擦工具留下的特徵频谱。
整整60页的pdf。
每一页,都是一记响亮的耳光,狠狠地抽在这个诺奖团队的脸上。
……
文档生成完毕。
徐辰的手指悬停在滑鼠上,这一次,他的心情比上一回更加复杂。
如果说几天前的那次爆料只是投石问路,是一次学术层面的“质疑”,那么现在这份长达60页的铁证,性质就完全变了。
这是一次“处决”。
一旦按下发送键,这位诺奖得主苦心经营的学术帝国將瞬间崩塌。
虽然他那关於hif-1机制的诺奖发现或许依旧成立,但这三十多篇注水论文,足以將他的学术信誉彻底透支,让他在晚年身败名裂。
这种即將亲手引爆核弹、引发全球生物学界十级地震的战慄感,让他掌心微微发热,甚至连指尖都在因为兴奋而轻微颤抖。
他要挑战的,不仅仅是一个诺奖得主塞门扎。他要挑战的,是整个西方学术界构建起来的权威体系,是那个利益盘根错节的庞然大物。
脑海中,刘伟师兄那绝望的眼神,还有那句“我以为我不適合搞科研”,再次浮现。
还有无数像刘伟一样,因为相信了这些虚假数据,浪费了青春、经费甚至人生的科研狗们。
徐辰眼神一冷,嘴角的弧度却逐渐上扬,透出一丝决绝与快意。
“系统,既然给了我【学术啄木鸟】的任务,那我就当一次最大的啄木鸟。”
“这棵树烂了,我就把它啄倒!”
徐辰打开pubpeer,看到了那条简短而傲慢的回覆。
【作者回復】:感谢关注。鑑於该论文发表时间较早,原始数据的归档检索较为复杂。但我们对研究结果的完整性和结论的科学性充满信心。因此,对於此类匿名的推测性指控,我们不予置评。
“充满信心?不予置评?”
徐辰看著屏幕,气笑了。
这哪里是回復?这分明就是赤裸裸的敷衍和傲慢!
“年代久远就能当挡箭牌?一句『充满信心』就能死无对证?”
“行,既然你们不见棺材不落泪,那我就给你们来个大的。”
徐辰的眼神变得锐利起来。
他意识到,光靠这一篇论文的几张图,確实很难锤死一个诺奖大佬。毕竟人家可以说这是“误操作”,是“图片误用”,大不了发个勘误就混过去了。
要想彻底揭穿这个谎言,必须要有更系统、更全面的证据!
……
徐辰打开了python,手指在键盘上飞快地敲击。
“既然要锤,那就锤死。”
“既然塞门扎这篇论文有问题,那我们就顺藤摸瓜,看看他的其他论文。”
徐辰编写了一个专门的爬虫脚本。
目標:pubmed资料库。
对象:塞门扎及其团队过去20年发表的所有论文。
抓取內容:所有western blot、免疫萤光、流式细胞术等实验图片。
“运行!”
“顺藤摸瓜,我倒要看看,你这棵大树底下,到底埋了多少雷!”
……
隨著回车键按下,爬虫开始疯狂工作。
数千篇论文,数万张图片,如同潮水般涌入徐辰的硬碟。
紧接著,徐辰启动了他刚刚编写的“图像查重算法”。
这个算法融合了sift特徵点匹配、频域分析以及他在slrm中用到的几何相似度计算。它就像是一只不知疲倦的猎犬,在海量的图片数据中,寻找著那些被隱藏的“双胞胎”。
……
这一夜,徐辰没有睡。
电脑的风扇在疯狂咆哮,cpu和gpu都在满负荷运转。
屏幕上,进度条一点点推进。
每隔几分钟,就会弹出一个红色的警告框:
【警告!发现高度相似图片组!】
【来源1:2008年《jbc》,图3a】
【来源2:2012年《pnas》,图5c】
【相似度:99.9%(经过旋转180度並水平翻转)】
……
【警告!发现图像復用!】
【来源1:2014年《cancer research》,图2b】
【来源2:2016年《oncogene》,图4d】
【相似度:100%(仅调整了对比度)】
……
看著屏幕上不断跳出的红色弹窗,徐辰的表情从最初的震惊,逐渐变成了冷笑。
这哪里是偶尔的失误?这分明就是一场持续了二十年的造假!
有些图片甚至连裁剪都懒得做,直接把十年前用过的图,换个標题,改个亮度,就堂而皇之地贴在了新论文里。
更离谱的是,有一张看起来很普通的细胞图,竟然在不同的年份、不同的期刊、不同的课题里出现了四次!一会儿它是癌细胞,一会儿它是正常细胞,一会儿它又是经过药物处理的细胞。
这简直就是把学术界的智商按在地上摩擦。
当清晨的第一缕阳光洒在键盘上时,算法终於跑完了。
徐辰看著最终生成的报告,即使早有心理准备,也不禁倒吸了一口凉气。
“好傢伙……”
报告显示,在塞门扎署名的论文中,竟然有超过30篇存在明显的图像復用和ps痕跡!
这些论文跨越了近20年,涉及多个顶级期刊。
有的图片是“一图多用”,在不同的论文里代表不同的蛋白;有的图片是“移花接木”,把同一个条带剪切下来贴到不同的位置;还有的图片甚至是“无中生有”,直接用ps画出来的。
“这就是所谓的诺奖团队?”
“这就是所谓的学术权威?”
徐辰看著那一个个触目惊心的红色標记,心中涌起一股难以言喻的愤怒。
这不再是猜测。
这是铁证如山的大数据证据。
这是对整个科学界的嘲讽。
“既然你敢造假,那就別怪我不客气了。”
……
电脑屏幕的蓝光映照在他略显疲惫却异常亢奋的脸上。经过整整一夜的算法挖掘,那个名为“塞门扎造假证据”的文件夹里,已经塞满了高达2gb的数据。
这不仅仅是数据。
这是核弹。
徐辰深吸了一口气,开始编写最终的分析报告。
第一次的“试探性攻击”虽然被对方轻描淡写地化解了,但也让徐辰摸清了对方的底牌——傲慢与侥倖。既然对方选择了无视,那这一次,他就要用绝对的数量和无法辩驳的逻辑,彻底击碎他们的心理防线。
他没有使用任何情绪化的词语,也没有用任何惊嘆號。他只是像一个冷酷的法医,用最精准的手术刀,將这具庞大的学术尸体解剖开来。
报告標题:《关於塞门扎及其团队多篇论文中图像异常的数学分析》
第一章:方法论。徐辰简要介绍了自己开发的“基於频域特徵与几何相似度的图像查重算法”。他公开了核心代码,任何有编程基础的人都可以復现他的检测过程。这是为了证明:这不是主观臆断,这是数学铁律。
第二章:证据链。这是最长、最触目惊心的一章。徐辰將32篇涉嫌造假的论文按时间轴排列。每一张造假图片都被他做成了对比图:左边是原图,右边是经过偽彩色处理和边缘检测后的分析图。红色的框线,精准地圈出了那些被复製粘贴的区域;绿色的连线,將不同论文中“穿越时空”出现的同一块蛋白条带连接起来。
案例1: 2008年发表在《jbc》上的图3a,其背景噪点分布,与2012年发表在《pnas》上的图5c,相似度高达99.99%。案例2: 2014年《cancer research》中的一组流式细胞图,实际上是同一张图经过了不同角度的旋转和拉伸。徐辰甚至贴心地还原了旋转角度:顺时针32.5度。案例3: sterling的那篇奠基性《nature》论文,关键的hif-x条带,在频域上显示出明显的人工涂抹痕跡,那是ps橡皮擦工具留下的特徵频谱。
整整60页的pdf。
每一页,都是一记响亮的耳光,狠狠地抽在这个诺奖团队的脸上。
……
文档生成完毕。
徐辰的手指悬停在滑鼠上,这一次,他的心情比上一回更加复杂。
如果说几天前的那次爆料只是投石问路,是一次学术层面的“质疑”,那么现在这份长达60页的铁证,性质就完全变了。
这是一次“处决”。
一旦按下发送键,这位诺奖得主苦心经营的学术帝国將瞬间崩塌。
虽然他那关於hif-1机制的诺奖发现或许依旧成立,但这三十多篇注水论文,足以將他的学术信誉彻底透支,让他在晚年身败名裂。
这种即將亲手引爆核弹、引发全球生物学界十级地震的战慄感,让他掌心微微发热,甚至连指尖都在因为兴奋而轻微颤抖。
他要挑战的,不仅仅是一个诺奖得主塞门扎。他要挑战的,是整个西方学术界构建起来的权威体系,是那个利益盘根错节的庞然大物。
脑海中,刘伟师兄那绝望的眼神,还有那句“我以为我不適合搞科研”,再次浮现。
还有无数像刘伟一样,因为相信了这些虚假数据,浪费了青春、经费甚至人生的科研狗们。
徐辰眼神一冷,嘴角的弧度却逐渐上扬,透出一丝决绝与快意。
“系统,既然给了我【学术啄木鸟】的任务,那我就当一次最大的啄木鸟。”
“这棵树烂了,我就把它啄倒!”