logo logo
焦點觀點
::: 首頁 焦點觀點專欄 運用公開資料及AI讓低品質論文數量增加

運用公開資料及AI讓低品質論文數量增加

2025-06-17
TAG 學術出版 生成式AI GenAI

Scientific Reports副編輯英國薩里大學(University of Surrey)的統計學家Matt Spick在去年發現有許多論文使用了美國國家健康營養調查(National Health and Nutrition Examination Survey, NHANES)的公開資料,這個公開資料經由健康檢查、血液檢測和訪談,收集超過13萬人的的飲食與其他健康相關數據。Spick說「我每天都會收到一篇幾乎一模一樣的論文,有時甚至一天兩篇」,Spick 收到的NHANES 論文都遵循同一模式:選定一種健康狀況、一個可能相關的環境或生理因子,以及一個特定人群。舉例來說,可能探討 65 歲以上男性維生素 D 水準與憂鬱症的關聯,或 18 45 歲女性牙齒健康不良與糖尿病的關聯。「感覺所有可能的組合都被人跑過一遍了」Spick 說。

為了解這些研究的盛行程度,他與團隊搜尋了兩大科學文獻資料庫—PubMed Scopus,找出使用 NHANES 且只探討單一關聯性的研究。他們找到 341 篇這類論文,分布於 147 份期刊上,包括《Scientific Reports》、《BMC Public Health》和《BMJ Open》。2014 2021 年,每年平均約發表 4 篇這類論文,但從 2022 年起出現急遽上升,截至 2024 10 月為止已有 190 篇。這個增長速度遠超過整體使用大型健康資料集研究的成長,顯示可能有其他因素推波助瀾。這轉變時間點,剛好與 AI 聊天機器人(如 ChatGPT)的普及吻合。

Spick還發現近年 NHANES 論文多數由中國研究人員撰寫,2021年後發表的論文中,有 92% 第一作者隸屬中國機構,而 2021 年以前的比例僅為 8%。他 認為這也可能是論文工廠介入的跡象,反映中國研究者面臨的壓力與升遷誘因,導致他們訴諸此非法方式。

Scientific Reports》、《BMC Public Health》等期刊的母公司 Springer Nature 的研究誠信主管 Tim Kersjes 表示,已撤回數篇 NHANES 論文,且仍有調查在進行中。他說:「我們編輯群也以提高警覺,並要求編輯在進入審查程序前,更仔細評估論文內容,」。BMJ 集團的發言人表示,他們對論文工廠與 AI 濫用的問題深感關切,對任何不當行為都會展開調查。

這些論文反映出科學出版制度與研究評價方式的深層問題,研究人員目前的升遷制度獎勵的是「數量」而非「品質」,若不從根本上改變科學出版結構,問題將會變得更嚴重。

 

全文請見:https://www.science.org/content/article/low-quality-papers-are-surging-exploiting-public-data-sets-and-ai

回索引頁