全球關聯數據(Linked Data) 實施情況

Linked Data (關聯數據或鏈結資料) 也談了幾年了,實際應用情況如何呢? D-Lib Magazine 最新一期出版的文章中,OCLC 的 Karen Smith-Yoshimura 提供了一份針對已導入或準備導入 Linked Data 計畫的機構所做的調查結果,相信能滿足一些人的好奇心[1]


Linked Data

Karen 在2014年就做過調查,為了蒐集更多回饋(特別的國家級圖書館),以及想要了解 Linked Data環境有那些改變,因此在2015年的6至7月再做一次調查。

看過這份報告和 Karen 在其部落格的補充後,底下摘錄部分內容[2]

  1. 參與調查的機構從2014年的48個,增加到2015年的71個。若二年合併計算,則有來自20國家的90個機構參與調查,絶大多數來自美英及歐洲,亞洲只有日本、新加坡、馬來西亞各1個機構。大部分回覆調查的都是圖書館或圖書館相關領域的機構。
  2. 2015年的調查中,已導入或準備導入的Linked Data計畫/服務達168個,其中112個有不同程度細節的描述。Two-thirds of the described linked data projects/services are in production, of which 61% have been in production for more than two years.
  3. 大部分機構都是運用現有人力來執行 Linked Data 計畫/服務 (98個)。但有69%計畫是有來自外部組織的參與或合作。
  4. 由於大部分計畫都還處在前期階段,所以很少機構對計畫成果做評估。只有46個機構回應他的計畫成功或幾近成功。
  5. 大部分的計畫/服務同時消費(consume)及發布 Linked Data。74個有發布的計畫/服務中,有19個未對外公開,其他多公布於網頁上。RDF/XML 是最多計畫所使用的 RDF Serialization,其他依序為Turtle, JSON-LD, N-Triples, RDFa Core, RDF/JSON, Notation3 and N-Quads。

    Survey Responses on How Linked Data Is Used

  6. 發布的 Linked Data 內容多為書目及作者權威資料。
  7. 發布 Linked Data 的主要動機為提升資料的能見度,以及想看看 Linked Data 能做些什麼。
  8. 消費來自機構外 Linked Data 的主要動機是要增強本地資料及提升使用體驗。
  9. 發布 Linked Data 的一些障礙:
    • Steep learning curve for staff
    • Inconsistency of legacy data
    • Selecting appropriate ontologies to represent our data
    • Establishing the links
    • Little documentation or advice on how to build the systems
    • Lack of tools
    • Immature software
    • Ascertaining who owns the data
  10. 最常被消費(consume) 的 Linked Data 來源為:
    1. Virtual International Authority File (VIAF)
    2. DBpedia
    3. GeoNames
    4. id.loc.gov
    5. Resources the respondents convert to linked data themselves
    6. Getty’s Art and Architecture Thesaurus
    7. FAST Linked Data
    8. WorldCat.org
    9. data.bnf.fr
    10. Deutsche National Bibliothek Linked Data Services
  11. 多數大學圖書館的 Linked Data計畫都屬於實驗性質。

在總結的部分提到了受訪者針對想要導入 Linked Data計畫的機構一些建議:

  • Focus on what you want to achieve, not technical stuff.
    • Model data that solves your use cases.
    • Strive for long-term data reconciliation and consolidation.
  • Add distinctive value: Build on what you have that others don’t.
    • Pick a problem you can solve.
    • Involve your institution/community.
  • Have a good understanding of linked data structure, available ontologies and your own data.
    • Consume your own published data.
    • Consider legal issues from the beginning.
    • Read as widely as possible and consult community experts.
  • Start now! Just do it!

Karen Smith-Yoshimura 這篇文章提供許多的連結及範例,有興趣的人可以查看原文。另外,台灣的國家圖書館也建置了一個網頁(catld.ncl.edu.tw),可以查詢「中文主題詞表」、「中文圖書分類法2007年版」、「中文人名權威控制」,並下載 Linked Data 檔案格式。

延伸閱讀:
1. D-Lib Magazine — Analysis of International Linked Data Survey for Implementers
2. hangingtogether.org — More on international linked data survey for implementers
3. Library Views圖書館觀點 — Linked Data 101
4. Library Views圖書館觀點 — 圖書館與關聯數據
5. 鄭智遠、柯皓仁(2015)— 以鏈結資料發展電影資訊系統之研究
6. 柯皓仁、陳亞寧(2013)— 鏈結資料在圖書館的應用

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / 變更 )

Twitter picture

You are commenting using your Twitter account. Log Out / 變更 )

Facebook照片

You are commenting using your Facebook account. Log Out / 變更 )

Google+ photo

You are commenting using your Google+ account. Log Out / 變更 )

連結到 %s