RAG是什麼?

在上一篇「主要圖書館資訊服務廠商的AI應用」文末所提供的連結中,不論是Clarivate (科睿唯安) 還是 EBSCO,網頁中都不約而同提到 Retrieval Augmented Generation (RAG,檢索增強生成),我想主要目的之一是為了避免文中提到的 “產生幻覺” (Hallucinate)[1],提供更專業及精準的內容。

那什麼是RAG 呢? 透過下面二段影片的說明,大概可以了解。

第一個影片語速較慢,有英文字幕。精華是:Prompt before prompt 這句話,也就是在提交 prompt 至一般的 LLM (大型語言模型) 之前,會先在專業內容所構成的 LLM 去 query。

第二部影片語速較快,但有中文字幕。在較小的內容資料源會比較容易更新,以為確保提供資訊的正確性。

看過上述的影片後再看下圖,應該就可以了解了。

RAG diagram

圖片來源:維基百科[2]

回過頭來看科睿唯安的學術 AI 平台,是不是比較清楚了呢。不過我比較好奇的是,在圖書館資訊系統廠商的資料中,似乎只有科睿唯安會特別強調平台的概念,例如之前 Ex Libris 的 Higher-Education Cloud Platform[3],這或許是來自 Ex Libris 資訊技術公司的基因吧。

Clarivate Academic AI Platform

圖片來源:clarivate.com[4]

最後,我看到新加坡管理大學圖書館 Data Services 主管 Aaron Tay 在其部落格已有多篇關於 RAG 的深入討論,特別是 RAG 資料源的問題,有興趣的人可以前往閱讀。

延伸閱讀:

  1. Library Views圖書館觀點 — 主要圖書館資訊服務廠商的AI應用
  2. 維基百科 — Retrieval-augmented generation
  3. Library Views圖書館觀點 — 聯盟共建共享圖書館服務平台(LSP)之評估與建置經驗分享
  4. Clarivate — 科睿唯安學術 AI 平台
  5. 布丁布丁吃什麼? — 檢索擴增生成(RAG)技術的發展現況與文本知識提取的應用

發表留言

在WordPress.com寫部落格.

向上 ↑