Archiveror 快速備份、永久保存當前看到的網頁內容(Chrome、Firefox)

最後更新於 2020 年 07 月 07 日

Copyright : rawpixel / 123RF Stock Photos

現在放到網路上的任何資料都可能被永久保存,即使編輯或刪除頁面內容依然無解,大家都知道搜尋引擎 Google 或 Bing 會索引頁面,短時間內就會快取內容,但我之前曾經提到過的網頁時光機 Wayback Machine 可以完整備份網頁畫面及相關檔案,提供可永久引用的來源,如果某個網站營運時間夠長,重要性很高,甚至能夠回溯到更早以前某個時間點畫面。因此網路上的足跡是很難被抹除的,要將任何文字圖片放上網路時務必要更謹慎小心。

本文要介紹的「Archiveror」是一個瀏覽器擴充功能,支援 Google Chrome 和 Firefox,外掛本身開放原始碼,提供使用者快速備份、保存當前看到的網頁內容,Archiveror 使用第三方服務包括 Archive.isArchive.orgPerma.cc 和 Webcitation.org 來備份網頁,透過下拉式選單快速將頁面鏈結提交到指定的服務上,就能產生永久使用的網址。

之前曾介紹過幾個類似的外掛功能,像是:

現在網路上備份資料量最多的是 Archive.org,相信大家應該都不陌生,之前還有 The Great 78 Project 收錄兩萬張古董黑膠唱片,Internet Arcade 提供 900 種老式投幣接機電玩線上玩,兩千種 MS-DOS 骨灰級老遊戲都是出自這個非營利組織。另一個支援的 Archive.is 也很有名,我有寫文章介紹過,Perma.cc 依然提供服務,但我測試好像無法使用,Webcitation.org 則已經停止接受新的網址提交請求。

除此之外,Archiveror 也能為網頁製作本機備份,將頁面資料保存在單一 MHTML 檔案中。

Archiveror
https://www.rahielkasim.com/archiveror/
Chromium | Firefox

使用教學

STEP 1

開啟 Archiveror 擴充功能頁面,點選「加到 Chrome」下載安裝瀏覽器外掛。Firefox 使用者可以透過上面提到的鏈結,返回到 Firefox 擴充套件頁面進行下載。

STEP 2

在你要備份、保存的頁面點選 Archiveror 按鈕,會看到幾個可用的備份服務,最底下的選項則是將頁面備份到本機磁碟,製作成 MHTML 格式。

最簡單的方法就是按下「Archive Now!」,外掛就會將頁面網址提交到 Archive.org 備份。

STEP 3

Archive.org 網頁時光機「Wayback Machine」需要一小段時間處理頁面資料,同時將相關檔案一併備份,例如圖片、樣式表或會用到的 JavaScript 等等,以確保未來開啟時能重現當時的頁面樣貌。這部份和 Google 等搜尋引擎的庫存機制不同,通常頁面庫存只會保留文字,如果有圖片或相關檔案並不會保存。

等到備份完成後,網址會變成 web.archive.org 開頭,這個固定鏈結就能永久存取某個時間點的某個頁面,也就達到所謂的頁面備份需求。

我也試著透過 Archive.is 備份一次頁面,中文內容當然也能正常顯示沒有問題,比較不一樣的是除了保存網頁外,還會建立一個螢幕擷圖,上方也會標示頁面備份和被存檔的日期時間。

值得一試的三個理由:

  1. 讓使用者快速備份、永久保存當前看到的頁面內容
  2. 支援 Archive.org、Archive.is、Perma.cc 和 Webcitation.org
  3. 以下拉式選單選擇即可操作,也能將頁面匯出為 MHTML 格式

 

相關的文章

Save To The Wayback Machine 一鍵備份網頁內容,查詢已存檔頁面版本(Chrome 擴充功能)

前幾天剛寫完「使用 Wayback Machine 完整備份網頁畫面,建立可永久使用的引用來源」教學,現在大家都知道 Internet Archive 網際網路檔案庫是可以用來備份網頁、查看不同時間網頁樣貌的工具,還能比較不同時間的內容差異。有時候如果要引用某個時間點的內容,透過 Wayback Machine 產生的網址可以永久使用而不必擔心失效,至少無法竄改內容,若是直接擷圖可能難以標示時間,也不能確保內容客觀性。

以網頁時光機 Wayback Machine 比較不同時間點的網頁內容差異

Internet Archive 最知名的工具「Wayback Machine」網站時光機相信大家都不陌生,這項服務的目標是將分分秒秒都在變化的網頁備份保存下來,以便使用者日後隨時返回、檢索特定時間點的網頁樣貌和內容。事實上現今搜尋引擎都有類似頁庫存檔(或稱為網頁快照)功能,當網頁暫時無法開啟時依然可以透過快取資料查看內容,以前介紹過「Cached Pages」能在網頁打不開或資料被刪除時利用頁庫存檔找回備份,當然它的資料也來自 Google 和 Archive.org,只不過提供一個更簡單、易於操作的介面。

Internet Archive 更新加入 2,500 個 MS-DOS 遊戲,可直接以模擬器線上玩

網際網路檔案館(Internet Archive)最為人熟悉的就屬 Wayback Machine 網路時光機,後來還推出 Chrome 擴充功能,讓使用者快速查看某一個網站以前的樣貌,隨意返回任何時間點,只要這個服務有索引並儲存網站就能查到。前段時間很多人跑去找以前無名小站的相簿、部落格,其實 Internet Archive 更強大的是收藏很多老東西,像是 The Great 78 Project 將兩萬張黑膠數位化,還有 Internet Arcade 收錄數千個投幣式電玩街機。

Full Page Screen Capture 快速擷取完整網頁畫面,轉為圖片或 PDF 格式(Chrome 擴充功能)

對於可以保存網頁畫面的截圖工具相信大家都不陌生,像是 WinSnap、FastStone Capture 或 Mac 系統很好用的 Jing(現在是 TechSmith Screencast)都能達到類似效果,或是透過瀏覽器擴充功能和線上工具也能做到,通常保存下來的都是靜態圖片格式。如果你想要完整保存某個網頁在某個時間點的樣貌,透過第三方建立更具公信力的網頁備份可能是更好的選擇,我曾介紹過 Wayback Machine 網頁時光機就能讓使用者將頁面完整保存在線上,以便隨時回溯到特定時間:

回應