大公網(wǎng)

大公報(bào)電子版
首頁 > 藝文 > 小公園 > 正文

?知見錄/脆弱的數(shù)字資源\胡一峰

2024-10-02 05:02:26大公報(bào)
字號(hào)
放大
標(biāo)準(zhǔn)
分享

  偶然看到一則消息,有家媒體公司有上萬個(gè)九十年代用來存檔的硬盤驅(qū)動(dòng)器,現(xiàn)在五分之一無法讀取,上面的資料可能全部遺失了。這很令人警覺。我曾下意識(shí)地認(rèn)為資料數(shù)字化后就可以千年萬代保存下去。這種想法其實(shí)是想當(dāng)然,簡單的生活經(jīng)驗(yàn)就可以證偽。我有好幾個(gè)損壞的U盤、硬盤和手機(jī),里面的文檔照片都無法讀取了。它們擺在我的抽屜里,事實(shí)上毫無用處,沒有丟進(jìn)垃圾桶,既因愛惜舊物的習(xí)慣,也怕個(gè)人信息丟失。

  冗余資料的數(shù)量與媒介方便程度似乎成正比,到了數(shù)字時(shí)代更是瘋狂增加。自打有了電腦寫作,修改文稿更加方便,修改次數(shù)也大大增加。每改一次都留下過程稿,曾被我視為一個(gè)好習(xí)慣,后來卻發(fā)現(xiàn),就回溯修改過程而言,數(shù)字化的過程稿看似增刪清晰,實(shí)則不如手改稿直觀。每改必存毫無必要,反而制造了冗余累贅。

  據(jù)說,二○二○年全球產(chǎn)生數(shù)據(jù)量已經(jīng)超過四十ZB,相當(dāng)于地球上每個(gè)人每年產(chǎn)生了五TB的數(shù)據(jù)。其中,百分之八十以上是不經(jīng)常使用的“冷數(shù)據(jù)”,但至少有百分之十的數(shù)據(jù)是有價(jià)值的數(shù)字資源,需要被長期保存。與傳統(tǒng)的紙張相比,數(shù)字介質(zhì)的維護(hù)成本更大。由于格式和載體對(duì)環(huán)境的依賴性,數(shù)字資源其實(shí)十分脆弱,如何長期保存和保真都已成為全球課題。

  其實(shí),與此相關(guān)的另一話題同樣值得關(guān)注,那就是選擇。保存文化資源的目的是為了傳遞文明。歷史地看,每個(gè)時(shí)代都在為后世立法,其方式就是對(duì)本時(shí)代的文化進(jìn)行選擇性保存。因此,研讀歷史不只是了解過去是個(gè)什么樣子,更能搞懂如今為何是這般樣子。如果說,前信息時(shí)代的選擇性保存是受制于介質(zhì)技術(shù)不得不為之“惡”,那么,在新介質(zhì)的加持下,今天更要避免因?yàn)檫x擇失誤或放棄選擇帶來的信息負(fù)擔(dān)之“惡”。

點(diǎn)擊排行