科技就是發展。
而科技發展的另一面,就是對舊有生活的反叛。
如果給原始人打火機,原始人第一件事情就是扔掉打火石。
如果中國兩輪電動車企給布隆迪捐助電瓶車
,奧德彪們都會紛紛棄暗投明。
如果塞給2006年的宅男一塊裝滿外國視頻的硬盤,他或許會賣掉自己的外國雜志。
互聯網也是一樣,而且更加殘酷。
互聯網的更新迭代,不僅要摧毀產品,更要摧毀信息。
比如說,當大家開始用視頻網站看視頻了。DVD光碟就會成了被時代遺棄的廢品,許多狂野的導演也可能因此失去了自己的創意大舞臺。
當人們開始玩QQ了,聊天室就會被紛紛拋棄。
那么當現在,有人把佟大為笑稱為佟 Dark 為的時候。
沒人記得他曾經也是個站在互聯網風口的小鮮肉,扮演在聊天室里談情說愛的網民“痞子蔡”。
無數的聊天室的聊天記錄,那些故事與網民們共有回憶的信息,都會消逝。
互聯網的發展就像一個吞噬一切的巨獸一樣,吞噬過去,邁向不可知的深淵。
不久前,一篇《中文互聯網正在加速崩塌》的文章刷屏社交媒體,里邊講了很多細思極恐的例子。
比如說,如果你搜索1998年到2005年之間的關于馬云的資料,只有一條結果。
明明90年代到00年代是互聯網蓬勃發展的黃金年代,可是你用先進的互聯網搜索引擎就是找不到相關消息。
這個事情不止發生在中國。
全世界都在面臨著信息消失的問題。
美國的皮尤研究中心做了一項調查,顯示2013~2023年間存在的網頁中,有1/4的網頁已經無法訪問。
這還沒有統計更早的網站。
站長不干了、服務器不租了、合伙人鬧掰了、站長去世了……各種原因都有可能讓我們曾經樂于瀏覽的頁面消失。
比如說,有個叫做RushB的專業CS攻略網站,就因為站長去世,一度陷入了停站風波,最后在網友的關注與幫助下得以解決。
甚至政治格局變化也會讓互聯網消息丟失。
比方說中國的域名是.cn,而南斯拉夫的域名是.yu,在南斯拉夫解體后,這個.yu 域名之下的網頁內容就全部消失了。
遙想00年代,老師教給我們的是,字寫在筆記本上,筆記本可能會丟,就跟寒假作業一樣。但放在互聯網上,可以幫你保存一輩子。
可現在看來,很難。
01 黑暗時代來臨
2005年,20歲的精神小伙亞歷克斯·圖想到了一個超越時代的創意。
他建立了“百萬美元主頁”網站,里邊有100萬個像素可供購買,每個像素1美元起拍。買了有什么用?當然是承襲互聯網商業的老祖宗:打廣告。
不到一年,100萬個像素廣告位銷售一空,最后一個像素更是拍賣到38100美元的天價。
精神小伙用50歐元的域名成本換來百萬富翁的身份,可謂以小搏大的奇跡。
這個創意影響了后來Reddit的絕活“像素大戰”
如今再去訪問“百萬美元主頁”,其中至少有40%的超鏈接已經無法訪問或被重新定向。
這塊互聯網早期的活化石,難逃“失憶”的命運。
從曾經的旅游勝地,變成了如今的互聯網墓地。
當原始網頁不可訪問,我們還能通過搜索引擎的緩存服務窺見它們的樣貌。
然而像是百度快照、Google Cached這類緩存服務,都在近幾年陸續關閉。
類似“百萬美元主頁”的事件,還在不斷發生。
皮尤研究中心 2024 年 5 月的報告提到,2013 年的網絡內容里,有 38% 已經無法訪問。
但這只是個數據,如果細化到微觀視角。
那就是榕樹下、千千靜聽、快播這類承載了人類精神食量的網站,不是倒閉就是關閉。
校內網、開心網這類化石級社交網站早已消失,偷菜和搶車位永遠停留在一代人的青春回憶里。
有許多網民從快播中擴展了國際視野,獲取了文娛的養料。
聽到說快播倒閉,都說欠他一個VIP。
但殊不知,這不是個體的問題,這是互聯網時代的積弊。
互聯網的“阿爾茨海默病”已經是全世界都在面臨的問題,而且失憶的速度可能比我們想象的更快。
1997 年,國際圖書館協會聯合會上,有人提出一個術語叫“數字黑暗時代”,擔心當前的主流存儲介質可能在未來無法讀取,其中保存的資料就此湮滅在歷史中。
2015 年,設計了 TCP/IP 協議的互聯網之父溫特·瑟夫也對數字黑暗時代深感擔憂。
這可不是杞人憂天,打孔帶、軟盤、磁帶……曾經流行的存儲介質如今已成為“硬核玩家”的專屬玩具。
存儲介質的變化,帶來舊存儲信息的流逝。
《賽博朋克2077》就在愚人節時候整了個活,把游戲放進97619張軟盤里,需要2個月時間才能安裝完
有網友找到了家里抽屜中的老軟盤,想要緬懷一下軟盤里的回憶,結果一打開,差點電腦中毒。
為什么互聯網的信息那么容易丟失,究竟是不是人類文明發展的哪個環節出現了關鍵性bug?
出于對此的好奇,我必須深入對互聯網歷史探究一番。
02 從四個節點到萬物互聯
為什么今天的互聯網正在加速崩塌?
因為我們的內容生產和消費模式產生了天翻地覆的變化。
互聯網上最早出現信息崩潰的例子,發生在1969年。
1969年,L和O這兩個字母從加州大學洛杉磯分校的電腦里出發,穿行566公里抵達斯坦福研究所的電腦里。
這兩個字母就是人類用網絡傳輸的第一條信息,背后有什么含義?其實,當時操作電腦的查理·克萊恩本想輸入“LOGIN”(登錄),沒想到只輸入了兩個字母,系統就崩潰了。
對互聯網第一條信息的文字記載,右側的CSK就是查理·克萊恩的名字縮寫
這個崩潰的系統名為“阿帕網”,是人類歷史上最早的計算機網絡之一。最早的阿帕網只有4個節點,隨著后來節點越來越多,問題也越來越多。
最明顯的是,阿帕網采用的NCP協議沒有給網絡里的每臺設備指定唯一地址。
當設備太多時就容易找不到目標,信息丟失、運行效率低都是常事。你看,“失憶”從網絡誕生開始就是頑疾。
再加上當時的電腦種類龐雜,軟硬件標準互不兼容,很難接入阿帕網。
想實現真正的萬物互聯,急需搞一個統一的通信標準。
于是1974年,一篇名為《A Protocol for Packet Network Intercommunication》的論文打開了新局面,里邊設計了一種全新的TCP/IP通信協議,捏住NCP的痛點狠狠改進。
每臺設備都有唯一的地址,通過反復握手確認,保障數據傳輸時不丟失,偶爾丟包也能通過校驗、重傳等方法糾錯。
憑著這些碾壓級創新,TCP/IP定義了網絡之間傳輸信息的方法,論文的兩位作者文頓·瑟夫和羅伯特·卡恩在日后共享“互聯網之父”的頭銜。
1990年底,英國計算機學家蒂姆·伯納斯-李實現了第一次超文本傳輸協議(HTTP)的通訊。
此后,無數超鏈接交織在一起,形成一個存在于賽博空間里的萬維網。
World Wide Web這三個單詞也是世界上第一個網頁瀏覽器的名字,為了避免混淆“萬維網”和“萬維網瀏覽器”,瀏覽器后來更名成Nexus。
這也就是我們熟悉的多彩的互聯網雛形。
但web1.0時代有一個巨大的問題,信息幾乎是單向流動的,你打開一個大型網站,獲得信息,關閉網站,結束了。
你要是想要點贊、轉發、一鍵三連,那不太可能。
所以,為了解決大家的互動問題,互聯網加速進入2.0時代,數據存儲的問題卻開始顯現了。
為web2.0做出核心突破之一的是谷歌。2003 年后,谷歌連續發了三篇研究,這三篇研究都成了谷歌玩轉大數據的基礎。
先是Google File System,這種分布式文件系統把數據存儲在大量廉價硬盤上,通過多個副本、冗余和故障檢測機制保護數據安全,直接降低了數據的存儲成本。
也就是說,你的信息不是存在“互聯網”上,而是藉由“互聯網”,存在硬盤中。
然后是MapReduce,把輸入的數據打散成多個小塊,多個任務并行處理,極大提高了數據的處理效率。
最后是BigTable數據存儲系統,用來管理大規模數據,吞吐量高,延遲低。
這三板斧的核心就一個詞:降本增效。
沒有人想要被信息淹沒,那最好的方式就是把信息壓縮、打散,用最廉價的方式存儲起來,畢竟,用戶不是隨時隨地都需要所有信息的。
就好像之前有人發現微信頭像越來越褪色,就有可能是微信為了信息存儲,而壓縮的畫質。
但光壓縮還不夠,存儲成本對于內容行業來說,Web 2.0讓普通人也能享有創作內容的資格,但背后卻是更大的“失憶”風險。
曾經的個人網站必須在文章里加入多媒體素材,才能順應時代潮流。
可翻倍的存儲成本怎么辦?
所以,最早遇到存儲困境的受害者們,就是那些堅持自己建網站寫博客的人,現在可能比揚子鱷還要瀕危。
網絡提供的解決方式是,你們小散戶就別存儲數據了,我們提供一個內容平臺,把數據存儲在我們這兒,我們再優化管理,就可以降低存儲成本了。
就好像是大家每個人都做一道西紅柿炒蛋,需要用的、洗的盤子就很多。但要是有一個中央廚房,用一口大鍋炒菜,就可以降低做菜損耗。
于是無數心懷夢想的創作者們一股腦涌進平臺里一片繁榮之下,暗流洶涌。
“失憶”的第一個風險出現了:中心化的平臺掌握了數據的生殺大權。
只要平臺腦子一抽,或者某個網站倒閉,海量內容灰飛煙滅。
比如說天涯。
天涯社區曾經是無數人的精神烏托邦,但2023年4月人們發現,天涯社區已經無法訪問,今年又傳出天涯社區破產的消息。
從天涯“逃亡”的人群規模浩浩蕩蕩,不亞于2023年年初《魔獸世界》停服時候的“賽博移民”。
除此之外,我們知道要去搜索內容,就要用搜索引擎搜索。
這看起來是一句廢話。
但其實潛藏著第二個風險:搜索去中心化。
當人們越來越沉迷于視頻、音頻這類“非文本”的內容形式時。
就意味著一個結果,你在搜索引擎很難搜索到你想要的視頻片段,除非有人對此做出標注。
畢竟網絡搜索是靠爬蟲抓取文本信息,如今有價值的內容都被塞進視頻、音頻里,就像在圖書館外邊蓋上一堵柏林墻,外邊的爬蟲進不去,里邊的內容出不來。
當人們很難搜索到關鍵信息,它跟丟失了有什么區別?
蓋上最后一層棺材板的是第三個風險:信息孤島化。
如今幾乎每個平臺都在圈地自萌,不提供 PC 網頁端,不下載APP不給看內容,甚至禁止網絡爬蟲收集信息。比如就在幾天前(5月27日),有網友發現知乎開始禁止谷歌、必應爬取數據。
就說個看起來十分簡單的,你能把抖音的視頻直接轉發到微信視頻號嗎?
從搜索引擎里“隱身”的網站,化身成“深網”的一部分,成為只存在于手機里的“小而美”。
當孤島化成為常態,不想被大數據推送和繭房效應圍困的人,必須熟知幾十種 app 的搜索規則,才能撥開云霧找到有用的信息。
如今我們身處Web 2.0的末期,體驗到的一切都與互聯網的“開放精神”背道而馳,我們被困在一張張網里,不再互聯。
那么,難道就沒有解決辦法,存儲這些正在消失的數據嗎?
有的,建立檔案館。
03 信息存檔異聞錄
你想要文件不丟,就把文件存儲起來。
這看起來又是一句廢話。
但實際上存在著兩個問題,一、存儲在哪個能永久地維護的地方,二、什么存儲方式不會丟失?
比方說埃及法老,想到的永恒存儲方法,就是當自己死了,把自己尸體里的內臟挖出來,然后往里面填上香料,接著在墓地里安上各種機關,最后蓋一個大金字塔上去。
類似的還有1868 年,英軍入侵緬甸,緬甸的文化很可能毀于一旦。緬甸君主為了保存《巴利文大藏經》,讓人將其刻在石碑上,安置在新修建的圣祠里。圣祠本身就是一部經文,跟《三體》里“把字刻在石頭上”如出一轍。
信息的瀕臨滅絕與絕境重生,伴隨著人類的整個歷史。
就在提出數字黑暗時代概念的前一年,“互聯網檔案館”成立,里邊保存了大量的書籍、電影、音樂等等內容。
甚至包括東西半球最強法務部名下的內容
這里不僅保存媒體資料,還把很多實物給虛擬化了。比如這個計算器館,里邊的計算器真的能按鍵(點擊鼠標)操作。
當然,它最主要的功能是使用“網站時光機”保存網頁,前提是用戶需要手動提交希望保存的網址。想保存日新月異的海量互聯網內容?只能是杯水車薪。
一個習慣了白嫖的互聯網,用戶看完視頻別說一鍵三連了,可能點贊都不會給,你怎么要求他們自發去上傳存儲網站,很難。
所以,最好的方式就是發動國家力量。
很多國家機構也沖在對抗數字黑暗時代的前線。
我國的國家圖書館在2003年啟動“互聯網信息戰略保存項目”,首個項目是存檔新浪微博,于是在2019年,經常逛微博的網友紛紛“留言上墻”,榮獲青史留名的資格。
哇塞,我的微博存檔啦
學術機構和科研人員同樣存檔網絡資料,如“北京大學李曉明”保存了2002 ~2016年的中國互聯網網頁,數據量大約有 200 TB。
最近AI大模型爆火,好多人找李曉明拷貝這組數據,這著實為中國的AI模型訓練助力不少。
在對抗數字黑暗時代的過程里,還有一群民間愛好者正在作出努力。
2023年初,任天堂宣布要關閉WiiU和3DS的網絡商城,1000多款沒有發行過實體卡帶的純數字版游戲即將陪葬。YouTube頻道“The Completionist”站了出來,花費2萬多美元把這些游戲都買下,數據總量大概有1.5TB,全部捐贈給“電子游戲歷史基金會”。
Archive Team由一群國外愛好者組成,在Reddit, Imgur, DeviantArt更改服務條款、刪除大量內容之前,他們及時把寶貴的數據從“焚書坑儒”里拯救出來。
Save the Web Project由一群中國愛好者組成,存檔過“半次元”“抽屜”等眾多網站。如果有人把空的硬盤寄給他們,就能收獲一塊裝滿“消失的某個網站”的禮物。
Save the Web Project的Logo
他們也遇到過無力的時刻?!霸娚罹W”截止到2023年關站時已有23年的歷史,要知道中國互聯網起步于1994年,到現在也只有30年的歷史,所以這個網站有“中文互聯網活化石”的美譽。
但當Save the Web Project得知關站消息的時候,“活化石”的服務器已經關閉,錯過了搶救數據的最佳時機。
這個小組的成員經常求“哪里有便宜的服務器”“誰能送我們幾塊閑置的硬盤”,真的是為愛發電。
哪有什么英雄主義,只是一群心懷理想的人默默做著他們認為重要的事情。
但靠著這樣的組織、機構,就能對抗數字至暗時代了嗎?
04 每個人都要作出選擇
2008年,一位ID是Clash-Cash-Car的豆瓣網友開始活躍,他不知從什么地方找到一堆冷門音樂資料,在幾年里編寫了6000多個條目。直到2016年去世后,網友才得知他是一位普通的保安。
就像《大佛普拉斯》里的肚財,直到離世后,才有人發現他的內心豐富充沛,閃著炫目的光輝。
每個不起眼的普通人,可能都在不知不覺間對抗著數字黑暗時代,方法就藏在沖浪段子手都用過的包漿表情包里。
電子包漿當然沒法對抗數字黑暗時代?但背后的下載、轉發、上傳一條龍卻可以。
前邊說過,Web 2.0末期最麻煩的是信息孤島化,平臺之間各玩各的,分享個鏈接還要被迫轉換成不知所云的“&%…^$# 長按復制¥#”亂碼,簡直反人類。
現在的年輕人發揚電子包漿精神,截圖錄屏一鍵轉發,誰跟你玩亂碼?
在B站看抖音,這何嘗不是一種NTR
信息孤島化,沒想到被電子包漿打破了。
《哈利·波特與火焰杯》 里,鄧不利多有一句名言:“黑暗與艱困的時代就要來臨,很快我們就會被迫面臨抉擇,選擇對的,還是方便的。”
當“數字黑暗時代”像達摩克利斯之劍一樣懸在頭頂時,也許我們都要做一些正確但艱難的事情。
還好,我們前方有很多先行者,而且每個你我他,都能在這條路上繼續前行。
來源網易號 酷玩實驗室 https://www.163.com/dy/article/J4GARJOA0511BCOA.html
該文章在 2024/6/14 8:32:38 編輯過