Linked Data (關聯數據或鏈結資料) 也談了幾年了,實際應用情況如何呢? D-Lib Magazine 最新一期出版的文章中,OCLC 的 Karen Smith-Yoshimura 提供了一份針對已導入或準備導入 Linked Data 計畫的機構所做的調查結果,相信能滿足一些人的好奇心[1]。
Karen 在2014年就做過調查,為了蒐集更多回饋(特別的國家級圖書館),以及想要了解 Linked Data環境有那些改變,因此在2015年的6至7月再做一次調查。
看過這份報告和 Karen 在其部落格的補充後,底下摘錄部分內容[2]:
- 參與調查的機構從2014年的48個,增加到2015年的71個。若二年合併計算,則有來自20國家的90個機構參與調查,絶大多數來自美英及歐洲,亞洲只有日本、新加坡、馬來西亞各1個機構。大部分回覆調查的都是圖書館或圖書館相關領域的機構。
- 2015年的調查中,已導入或準備導入的Linked Data計畫/服務達168個,其中112個有不同程度細節的描述。Two-thirds of the described linked data projects/services are in production, of which 61% have been in production for more than two years.
- 大部分機構都是運用現有人力來執行 Linked Data 計畫/服務 (98個)。但有69%計畫是有來自外部組織的參與或合作。
- 由於大部分計畫都還處在前期階段,所以很少機構對計畫成果做評估。只有46個機構回應他的計畫成功或幾近成功。
- 大部分的計畫/服務同時消費(consume)及發布 Linked Data。74個有發布的計畫/服務中,有19個未對外公開,其他多公布於網頁上。RDF/XML 是最多計畫所使用的 RDF Serialization,其他依序為Turtle, JSON-LD, N-Triples, RDFa Core, RDF/JSON, Notation3 and N-Quads。
- 發布的 Linked Data 內容多為書目及作者權威資料。
- 發布 Linked Data 的主要動機為提升資料的能見度,以及想看看 Linked Data 能做些什麼。
- 消費來自機構外 Linked Data 的主要動機是要增強本地資料及提升使用體驗。
- 發布 Linked Data 的一些障礙:
- Steep learning curve for staff
- Inconsistency of legacy data
- Selecting appropriate ontologies to represent our data
- Establishing the links
- Little documentation or advice on how to build the systems
- Lack of tools
- Immature software
- Ascertaining who owns the data
- 最常被消費(consume) 的 Linked Data 來源為:
- Virtual International Authority File (VIAF)
- DBpedia
- GeoNames
- id.loc.gov
- Resources the respondents convert to linked data themselves
- Getty’s Art and Architecture Thesaurus
- FAST Linked Data
- WorldCat.org
- data.bnf.fr
- Deutsche National Bibliothek Linked Data Services
- 多數大學圖書館的 Linked Data計畫都屬於實驗性質。
在總結的部分提到了受訪者針對想要導入 Linked Data計畫的機構一些建議:
- Focus on what you want to achieve, not technical stuff.
- Model data that solves your use cases.
- Strive for long-term data reconciliation and consolidation.
- Add distinctive value: Build on what you have that others don’t.
- Pick a problem you can solve.
- Involve your institution/community.
- Have a good understanding of linked data structure, available ontologies and your own data.
- Consume your own published data.
- Consider legal issues from the beginning.
- Read as widely as possible and consult community experts.
- Start now! Just do it!
Karen Smith-Yoshimura 這篇文章提供許多的連結及範例,有興趣的人可以查看原文。另外,台灣的國家圖書館也建置了一個網頁(catld.ncl.edu.tw),可以查詢「中文主題詞表」、「中文圖書分類法2007年版」、「中文人名權威控制」,並下載 Linked Data 檔案格式。
延伸閱讀:
1. D-Lib Magazine — Analysis of International Linked Data Survey for Implementers
2. hangingtogether.org — More on international linked data survey for implementers
3. Library Views圖書館觀點 — Linked Data 101
4. Library Views圖書館觀點 — 圖書館與關聯數據
5. 鄭智遠、柯皓仁(2015)— 以鏈結資料發展電影資訊系統之研究
6. 柯皓仁、陳亞寧(2013)— 鏈結資料在圖書館的應用
發表迴響