[點(diǎn)晴永久免費(fèi)OA]如何長(zhǎng)時(shí)間保存重要數(shù)據(jù)?
我大學(xué)畢業(yè)時(shí)把所有資料刻錄成幾張 DVD,才幾年就發(fā)現(xiàn)讀取不了了,而我老爸讀大學(xué)時(shí)候的筆記本,幾十年后仍然保存完好。 我前幾年保存在移動(dòng)硬盤里的照片,因?yàn)榘峒視r(shí)摔了一次,完全毀壞了,但是我家里小時(shí)候的相冊(cè)卻能幾十年沒有事情。 所以今天數(shù)據(jù)存儲(chǔ)固然比過去更加方便,但是可靠性卻大為降低。硬件壞了你還可以花錢再買,數(shù)據(jù)丟了,你就再也無力回天了。 數(shù)據(jù)對(duì)我來講是最寶貴的東西,無數(shù)血與淚的教訓(xùn)后,讓我開始深入思考,怎么樣才能讓我的數(shù)據(jù)長(zhǎng)期安全的保存幾十年甚至終身?
光碟是最廉價(jià)最受歡迎的介質(zhì),他們本來設(shè)計(jì)壽命是 10-20 年的,而一般情況你不要指望你光盤上的東西五年后還能正常讀出來。 即便一些號(hào)稱長(zhǎng)期保存百年以上的光盤,壽命也會(huì)由于我們各種不當(dāng)行為大大降低,比如,沒法按要求的條件保存(放桌面上被陽光暴曬變形),不小心刮花光盤,在盤面上留下指紋或者手上的油脂,這些都會(huì)促進(jìn)光盤表面化學(xué)成分變質(zhì),最終導(dǎo)致你的數(shù)據(jù)損壞。
這兩年 HDD/SSD 技術(shù)進(jìn)步很快,成本越來越低。8T 的 HDD 差不多只 1000 元人名幣的成本,1T 的 SSD 也從過去的好幾千元降價(jià)到 600 多了。HDD/SSD 都能組成陣列,用虛擬邏輯卷的形式跨越物理大小的限制,為你提供超大規(guī)模的連續(xù)存儲(chǔ)空間。 然而當(dāng)你想要維護(hù)更大規(guī)模的盤陣時(shí),你基礎(chǔ)硬件設(shè)施的成本會(huì)大幅上升,4 路陣列和 8 路 16 路的成本完全不一樣。同時(shí)更新?lián)Q代快,我過去保存的幾塊 IDE/SATA 接口的硬盤,今天我已經(jīng)沒有任何可用的設(shè)備來讀取他們了。 遺憾的是,不管是 HDD 還是 SSD 他們都不能長(zhǎng)期可靠的保存數(shù)據(jù),每年有 1% 的概率由于磁場(chǎng)變化造成 HDD 數(shù)據(jù)損壞,這個(gè)概率如果放到 5 年,就變成了 4.9%。 而 SSD 的壽命比 HDD 更短,同時(shí)他們還會(huì)受到溫度的影響,如果長(zhǎng)期處在 40 度以上的工作溫度,二者的壽命都會(huì)減半。
Raid 能在你一塊硬盤損壞時(shí)照樣幫你保證數(shù)據(jù)不丟失,這也是常用方案之一,但是 Raid 就萬無一失了么?并非如此,因?yàn)橛脖P設(shè)計(jì)壽命相同,一起買來的同一個(gè)品牌的硬盤,經(jīng)常要壞就幾塊一起壞,我就試過兩塊 Raid1 在不到 24 小時(shí)的時(shí)間里先后壞掉。 同時(shí)民用電源各種不穩(wěn)定,燒電器的經(jīng)歷大家都有過吧?由于 Raid 下面幾塊盤都是接在一起,如果碰到電源問題,一個(gè)擊穿,就全部都?jí)牡袅恕?/span>
云存儲(chǔ)是成本最高的選項(xiàng),最便宜的百度云 1TB 的大小每年要 200 元。然而把數(shù)據(jù)交給云服務(wù)商是風(fēng)險(xiǎn)最大的事情,百度會(huì)隨意掃描你的照片,我同事曾經(jīng)傳了個(gè)身份證掃描件到百度盤上,然后馬上刪除了,結(jié)果第二天百度盤就給他推薦「證件錢包」服務(wù)。我另外一個(gè)同事好幾 T 的視頻放在百度上,全部被替換成「凈網(wǎng)公告」: 再者網(wǎng)齡稍微長(zhǎng)點(diǎn)的人都有共識(shí),網(wǎng)絡(luò)服務(wù)是不可靠的,不管是過去的各種免費(fèi)空間還是幾年前的各種網(wǎng)盤,說關(guān)閉就關(guān)閉了,有的給你備份一下,有的連備份機(jī)會(huì)都沒有,一紙通知,說關(guān)就關(guān)。你很可能一段時(shí)間沒登陸網(wǎng)盤,沒留意到通知,而再登陸時(shí)就發(fā)現(xiàn)數(shù)據(jù)沒了。 所以網(wǎng)盤只適合保存一些,臨時(shí)的,非關(guān)鍵數(shù)據(jù),比如電影這些,看完一遍丟了也就丟了,而關(guān)鍵數(shù)據(jù)想要長(zhǎng)期保存的話,網(wǎng)盤是風(fēng)險(xiǎn)最大的地方。
U 盤或者移動(dòng)硬盤的出現(xiàn)讓我們比過去方便很多,但一般 U 盤都是有擦寫壽命的,壽命往往比 HDD/SSD 更短,同時(shí)容易攜帶也就意味著容易損壞,物理損壞,或者因?yàn)樘×耍旁谀睦锞屯浟耍竵G U 盤」想必大家都試過。家里有小孩更是,我的幾張 SD 卡,被我兒子當(dāng)積木玩了兩天,就再也讀不出來了。 除去物理損壞外,各種使用不小心(比如頻繁插拔,忘記安全彈出),也容易造成 U 盤/移動(dòng)硬盤的損害。盡管你很小心的用你的u盤,結(jié)果拿給家人搞點(diǎn)啥,幾下可能就用壞了。
各種辦法嘗試了好多年以后,我開始思考,一些國(guó)家檔案館動(dòng)輒保存上百年的資料,他們是如何做到的呢?再這些過程中,物理紙張可能老化,損壞,丟失,連墨跡也都可能淡化。他們的保存方法有什么值得借鑒的地方么? 然后我花了一個(gè)多星期的時(shí)間調(diào)研傳統(tǒng)檔案管理的各種:方法,制度,原則。研究完后受到了不少啟發(fā)…… 想要長(zhǎng)期保存數(shù)據(jù),其實(shí)是一個(gè)成本問題,你愿意花多少錢和精力來做這件事情,決定預(yù)算以后,你不能依靠某一種單獨(dú)的媒介來想著存進(jìn)去就一勞永逸,而應(yīng)該設(shè)計(jì)屬于你自己的備份流程,靠流程來保證數(shù)據(jù)安全,比如下面幾個(gè)點(diǎn)供你選擇參考: 第一:明確可靠性等級(jí),即數(shù)據(jù)分級(jí),核心數(shù)據(jù),重要數(shù)據(jù),普通數(shù)據(jù),可丟失數(shù)據(jù)。不同層次的數(shù)據(jù)對(duì)可靠性的要求是不一樣的,對(duì)應(yīng)的方法也不一樣。 第二:格式轉(zhuǎn)存,特別對(duì)于媒體數(shù)據(jù),有損圖片:JPG->BPG 基本能夠清晰度不變但是尺寸變?yōu)樵瓉?1/3,無損圖片:PNG->FLIF,基本又能減少一半,如果你是 BMP/TGA 等老格式,直接轉(zhuǎn)為 FLIF/BPG,馬上讓你空間縮小十倍。音視頻數(shù)據(jù)也可以用更先進(jìn)的編碼器進(jìn)行轉(zhuǎn)存,這樣你的空間占用至少能省一半出來。但是不要用一些太偏門的格式,避免幾年后沒有合適的程序讀取。 第三:使用好一點(diǎn)的介質(zhì),都是 DVD-R,便宜的有 1-2 元一張,貴的有 80-100 元一張,區(qū)別就是質(zhì)量,硬盤也分監(jiān)控盤,企業(yè)盤還是消費(fèi)盤。如果手頭不是那么緊張,盡量使用質(zhì)量好點(diǎn)的介質(zhì)來保存你的數(shù)據(jù)。 第四:定期轉(zhuǎn)存,不管放什么介質(zhì)里,都需要定期檢查,修復(fù),活動(dòng)介質(zhì)可以靠一些自動(dòng)腳本來轉(zhuǎn)存,非活動(dòng)介質(zhì)需要手動(dòng)進(jìn)行。 第五:重要數(shù)據(jù)至少存三分,熱數(shù)據(jù)(工作集),備份,備份的備份。 第六:備份方案根據(jù)數(shù)據(jù)重要度進(jìn)行區(qū)分,哪些數(shù)據(jù)只需要 Raid 備份,哪些數(shù)據(jù)除了 Raid 外,還需要定時(shí)冷備到另外一塊物理硬盤?哪些數(shù)據(jù)還需要定期刻錄光碟? 第七:盡量地理上多地冗余,即便家里地震了也可以從異地恢復(fù)出來。 第八:盡量把文件直接放在文件系統(tǒng)上面,而不是再弄一個(gè)打包文件把一堆文件打了包再存,當(dāng)介質(zhì)發(fā)生故障時(shí),打包文件很難恢復(fù),而直接放在文件系統(tǒng)上的文件相對(duì)容易恢復(fù)一些。 該文章在 2022/8/12 8:39:00 編輯過 |
關(guān)鍵字查詢
相關(guān)文章
正在查詢... |