

生成式AI及其典型代表ChatGPT是2023年最熱門的話題之一,一直廣受討論與爭議,作者將ChatGPT的成功歸因於完成以下四件重要的事情 —
作者服務於Wiley出版社,與其團隊一直在內部評估大型語言模型(LLM)在學術出版中的潛在應用和影響,也測試了ChatGPT和Google Bard,希望研究結果能夠找到使用生成式AI的新想法,並激發相關之討論,將從以下四種在學術出版的應用來探討。
將ChatGPT和Google Bard應用到創作過程的四個階段:提高寫作品質和可讀性;生成摘要和標題;推薦相關期刊;主題建議。檢查可讀性和寫作品質並提出改進建議是大型語言模型常見的應用。
將ChatGPT應用於手稿時,我們發現ChatGPT能夠:
Bard具有類似的功能,也可以自動計算可讀性分數,然而,它在重寫方面不如ChatGPT。至於在生成摘要和標題、推薦相關期刊、主題建議三方面,ChatGPT似乎也略勝一籌。
應用於投稿和審稿的生成式AI
在投稿和審稿階段,許多程序會受益於生成式AI,作者測試了其中五個:摘錄資訊的能力;依特定標準審查論文的新穎性、相關性和正確性;參考文獻品質分析;審稿人建議;識別個人身份資訊。
應用於出版的生成式AI
ChatGPT可能有助於豐富出版階段的內容,然而,它目前無法根據客戶特定的分類法來標記內容,且通常會生成假標籤或ID。
為了查看內容摘要,便將ChatGPT與作者的智能服務團隊生成的摘要進行比較,團隊從原文中選粹出重要、詳細的資訊,但可讀性不高,ChatGPT摘要的可讀性很高,但詳細資訊較少。基於這些發現,決定將團隊選粹的摘要和ChatGPT結合使用,讓ChatGPT從選粹摘要生成新的摘要,新摘要保持了細節和良好的可讀性,並規避了輸入長度的限制也降低了假資訊的風險。ChatGPT生成的摘要內容通常比Bard生成的更流暢,但在商業應用中也更昂貴,生成的細節也較少。
資助資訊對於出版品非常重要,尤其是對於OA文章,作者要求ChatGPT和Bard選取資助者和其資助ID,並連結至Crossref的資助者登記資料庫,發現ChatGPT可以正確選取資助者資訊,但無法連結獲取Crossref的資訊,而Bard選錯了四位資助者且生成一個假的Crossref ID。
在英漢自動翻譯測試中,ChatGPT的GPT-3.5版本在生物醫學摘要方面的表現不如Google和DeepL等商業工具,但對口語確實生成了不錯的效果,但GPT-4版本的ChatGPT,其功能就與商業翻譯工具一樣好。
應用於發現和傳播的生成式AI
在學術出版關鍵的傳播和發現步驟中,AI顯著提高了檢索結果的品質,同時也引進發現資訊的新方法。
在評估ChatGPT、Microsoft Bing和Google Bard時,作者詢問:「訓練大型語言模型的最新研究進展為何?」結果發現:
經過作者及其團隊對生成式AI的評估,深刻體會到目前AI管理遠遠落後於AI能力,在發展AI的同時,關於確保AI符合人類目標和價值觀並受其控管、遵守適用法律的研究卻似乎嚴重停滯,AI內容的生成、傳播和使用都存在許多風險。AI TRiSM(Trust, Risk, and Security Management)(信賴、風險和安全管理)變得愈來愈重要,與AI生成內容相關的法律和道德問題,包括是否侵害到智慧財產權或隱私權等,都必須認真處理。