前幾天從我部落格的 referer (反向連結) 中看到一個很奇怪的網址,連結過去看之後讓我相當驚訝,台大圖書館竟然也在做 web archiving。
看看台大圖書館是怎麼說:
隨著網際網路的流行,網路成為發表資訊的ㄧ個熱門途徑,它也成為資訊收集的ㄧ個重要來源,然而,網路資訊愈是流通快速,網路資訊的保存卻成為一個燙手的問題,根據調查,平均一個網站的生命週期大概只有44天,而重要的資訊,例如學者發佈的文獻資料、文化或科學資源這些寶貴的資訊,可能就因為時間的更迭而從此消逝掉了。
臺灣大學圖書館,身在臺灣第一學府~臺灣大學,自然負有保存文史資料的重大責任,因此成立了 NTU Web Archive網站,主要任務為負責「選擇」、「收集」、「保護」台灣大學 、台灣政府機構、台灣政治團體、焦點人物、原住民族及重大事件之原始性網頁資料,並提供檢索服務以滿足當代與未來世代研究發展之需求。冀望這樣的開展能夠符合現實環境之需求,為台灣大學善盡保護網路資產之責任。
web archiving 比較有名的是 Internet Archive,而本站也曾介紹過 WebCite。雖然都是網頁的典藏,但還是有一些不同之處:
- 台大圖書館的 臺灣網站典藏庫
- 針對整個網站
- 主動 archive
- 接受使用者提供網站網址
- (2008/2/26針對新介面補充) 提供不同時間點的 archive 成果
- Internet Archive
- 針對整個網站
- 主動 archive
- 接受使用者提供網站網址
- 提供不同時間點的 archive 成果
- WebCite
- 針對個別網頁
- 由使用者提供網站網址
- 提供不同時間點的 archive 成果
- 提供 bookmarklet (書籤小程式)
至於我的部落格呢,被放在 焦點人物網站 教育學術網站-教育機構-大學與學院 這個分類裡。現在可以看到幾個台灣的圖資部落格都已經被收錄進去了。
補充:(2008/02/26)
剛剛發現臺灣網站典藏庫無法連上,有興趣的人可能要等到正式推出此服務才看的到了。
新介面不論從設計或者是使用上都有很大的改善。另外,HTTrack 這個工具我已經使用二年多了,沒想到在 關於 那裡看到台大圖書館也是用它來擷取網頁的 🙂
貴站的RSS 最近都是亂碼
不知道是否是那出了問題
我也有相同問題@@
我是用Bloglines.
same as Google Readers
謝謝各位的問題回應,
由於原本的RSS內容含有一個有問題的字元,造成Feedburner無法正常的燒製,
現在問題已經解決了,接下來的文章應該會正常才對 🙂
首先感謝您,給我們寶貴建議。
本館是於2006年7月開始進行這個計劃。
是為了保存網路時代下,關於事件與學術性議題的網站。
並希望提供檢索服務以滿足當代與未來世代研究發展之需求。
冀望這樣的開展能夠符合現實環境之需求,能善盡保護網路資產之責任。
並提供圖書館學界數位典藏一個新的嘗試。
之前,您所看到的界面,是本館測試階段的產品。
全新的呈現頁面,將會在近日正式公開。
若您對我們的新界面有興趣,請撥空連結到 這個網址。
並請給予我們持續的批評與指教。
謝謝。