2014年6月9日 星期一

科學家發現120篇計算機偽造論文騙過學術出版機構

許多研究生這個時節已經在為論文開題犯愁了。有些要求高的大學規定研究生要畢業必須有SCI論文(SCI是國際公認的進行科學統計與科學評價的主要檢索工具,世界上大部分國家和地區的學術界將SCI收錄的科技論文數量的多寡,看作是一個國家的基礎科學研究水平及其科技實力指標之一)。可是論文審查一直是個難題,最近有科學家通過排查研究發現,至少有120篇通過計算機程序自動生成的偽造論文,騙過了世界頂級學術出版機構。
學術出版界是個魚龍混雜的地方,並不是所有人都抱著證明自己或發現真正有價值的東西來的。所以像Springer(觀察者網注:德國斯普林格出版社,世界上最大的科技出版社之一)和電氣電子工程師學會(IEEE)這樣厲害的出版商早就學會了在出版之前,逐字逐句的讀完所有科學報告。兩家出版社至今已經將100多篇科學研究報告發回作者,因為這些報告看似牛逼,其實只是用計算機生成,裡面什麼也沒說。
Springer出版社參加第十八屆北京國際圖書博覽會
Springer出版社參加第十八屆北京國際圖書博覽會
法國格勒諾布爾市的格勒諾布爾第一大學的計算機學家Cyril Labbé對2008年至2013年會議文獻資料中的計算機生成論文進行了跟踪研究。在進行跟踪研究之前,Labbé已經試驗過了多種方法用於排查計算機程序SCIGen生成的偽論文。SCIGen能夠運用完美的工程和科學術語組合出SCI級別的論文,這些論文看似可信度很高,實際上什麼都沒說。
這樣的事情在學術界並不是第一次見到。1996年,紐約大學的教授索卡爾向文化研究雜誌《社會文本》(Social Text)投稿一篇偽科學的文章,文題為《跨越界線:通往量子引力的轉換詮釋學》。在這篇文章中,作者故意製造了一些常識性的科學錯誤,目的是檢驗《社會文本》編輯們在學術上的誠實性。結果是5位主編都沒有發現這些錯誤,也沒有能識別索卡爾在編輯們所信奉的後現代主義與當代科學之間有意捏造的“聯繫”,經主編們一致通過後文章被發表,引起了知識界的一場轟動。這就是著名的“索卡爾事件”。事件發生後,就立即觸發了一場席捲全球的科學與人文的大論戰,世界眾多著名的媒體參與其中。
Labbé私下里將他發現的120篇偽造論文通知了出版商,收到通知的出版商說他們會立即進行刪除。Labbé認為這些偽造論文之所以能夠出版,原因是學界審核標準的鬆懈。據Labbé稱,科學家的學術壓力之大,是一般人不敢想像的,科學家迫於壓力需要大量發表論文,這就導致了許多科學家發表的論文越來越水。
出版過16篇偽造論文的Springer表示將所有偽造論文從網站上刪除要花費大量時間,更何況公司每年還會出版2200本圖書,發表8400篇期刊文章。諷刺的是,前不久Labbé還通過Springer發表過一篇如何排查偽造論文的文章。
麻省理工學院的計算機工程師們在2005年寫出了SCIGen這個程序,為的只是證明,即便是毫無​​意義的論文,科學期刊也會照單全收。當他們發現一些知名科學期刊接收了他們用計算機生成的論文後還是很吃驚,所以他們相信一些作者會將SCIGen純粹作為賺錢的工具。
對於自己是否已經排查出所有利用SCIGen生成的偽論文,Labbé無法驗證,因為他無法從有限的訂閱源下載所有論文。但是120篇這個數字確實已經引起了學術界的廣泛關注。IEEE發表了一份聲明生成他們已經收到了建議,所有不符合出版公司既定質量要求的研討​​會論文全部會被刪除。他們也表示他們將盡力確保將來不會出現這種情況。
用SCIGen生成的一篇論“如何理解在線算法”的論文
用SCIGen生成的一篇論“如何理解在線算法”的論文
SCIGen自動生成的論文已經多次被一些期刊和會議錄用。以下是一些引起較大關注的案例:
2005年,《Rooter: A Methodology for the Typical Unification of Access Points and Redundancy》被WMSCI錄用。
2005年,Mathias Uslar使用SCIgen生成的《A Case for Lamport Clocks》被IPSI-2005錄用。
2005年,Genco Gülan教授在第3屆交互式媒體設計國際討論會(3rd International Symposium of Interactive Media Design)論文集上發表了使用SCIgen生成的《I/O Automata No Longer Considered Harmful》。
2007年,伊朗沙裡夫科技大學學生使用SCIgen生成的論文《Cooperative, Compact Algorithms for Randomized Algorithms》被由Elsevier出版的《應用數學與計算》雜誌(Journal of Applied Mathematics and Computation)錄用。出版商得知這篇文章為虛假的文章後,將其移除。
2008年,Herbert Schlangemann將他使用SCIgen生成的《Towards the Simulation of E-Commerce》一文投往2008年計算機科學與軟件工程國際會議(International Conference on Computer Science and Software Engineering,縮寫CSSE)。他借用了瑞典電影短片Der Schlangemann的名字作為文章的署名。這篇文章甚至通過了同行評審,被CSSE錄用,作者還被邀請擔任所在分會的主席。

=====================================================================================
SCIgen - An Automatic CS Paper Generator
SCI 論文產生器網址:
http://pdos.csail.mit.edu/scigen/

沒有留言:

張貼留言