
每代人都會遇到“數(shù)據(jù)危機(jī)”:基于當(dāng)時的知識、技術(shù)和工具,還無法處理的數(shù)據(jù)。歷史上,最常見的海量數(shù)據(jù)危機(jī),是天文數(shù)據(jù)和人口數(shù)據(jù),這些真是“天文數(shù)據(jù)”。
現(xiàn)代意義上的數(shù)據(jù)危機(jī)發(fā)生在19世紀(jì)中后期,當(dāng)時全球工業(yè)革命蓬勃發(fā)展,全球性貿(mào)易大繁榮,而記錄和管理這些商品、財富和人口信息的技術(shù),卻遠(yuǎn)遠(yuǎn)趕不上工業(yè)社會進(jìn)步的步伐。最典型的是人口普查難題:美國在1880年開展的人口普查,耗時8年才完成數(shù)據(jù)匯總。
隨著時間的推移,不僅人口數(shù)據(jù)處理越來越復(fù)雜,軍事、科學(xué)和商業(yè)等更多領(lǐng)域的數(shù)據(jù)量也持續(xù)增長,通用電子計算機(jī)由此誕生,海量數(shù)據(jù)的“簡單”統(tǒng)計處理不再是難題。
然而,計算機(jī)硬件能力以摩爾定律呈指數(shù)級增長,而軟件的生產(chǎn)方式還很原始,生產(chǎn)效率相對低下,導(dǎo)致20世紀(jì)60年代“軟件危機(jī)”爆發(fā),業(yè)界開始將主要注意力從硬件轉(zhuǎn)移到軟件。這時,復(fù)雜的數(shù)據(jù)庫管理軟件只是軟件危機(jī)的一部分。
軟件危機(jī)最初定義是為了提高軟件的生產(chǎn)效率,但后來演變成強調(diào)如何提升軟件質(zhì)量。軟件危機(jī)主要表現(xiàn)在以下幾個方面:超預(yù)算項目、超時開發(fā)項目、軟件運行效率低下、軟件質(zhì)量無法保證、軟件不符合客戶要求、項目管理指南缺失、代碼維護(hù)困難和軟件從未交付等。
軟件危機(jī)導(dǎo)致了“軟件工程”的誕生,讓程序員的編程從手工作業(yè)走向工程化。從20世紀(jì)70年代到90年代的20多年里,軟件的每一項新技術(shù)和新實踐,都會被吹捧為是解決軟件危機(jī)的靈丹妙藥,但事實上,所有已知的技術(shù)和實踐,都只是漸進(jìn)式地提升了軟件生產(chǎn)效率或質(zhì)量。
進(jìn)入21世紀(jì),“軟件危機(jī)”的說法逐漸“淡出”。這不是因為導(dǎo)致危機(jī)的問題解決了,而是因為人們對軟件危機(jī)產(chǎn)生了心理疲勞,并且新的危機(jī)出現(xiàn)了。在過去的20余年中,硬件技術(shù)、軟件技術(shù)和網(wǎng)絡(luò)技術(shù)等都在飛速發(fā)展,全球數(shù)據(jù)每年以50%的速度飛速增長,新一輪“數(shù)據(jù)危機(jī)”開始出現(xiàn)。
在新一輪“數(shù)據(jù)危機(jī)”下,非結(jié)構(gòu)化的數(shù)據(jù)量過大,無法用現(xiàn)有技術(shù)尤其是關(guān)系型數(shù)據(jù)庫技術(shù)工具加工處理,于是催生了“大數(shù)據(jù)”技術(shù),其旨在從技術(shù)層面解決“能”處理海量數(shù)據(jù)的問題。目前,我們大致處于從“數(shù)據(jù)手工藝”到“數(shù)據(jù)工程”的演進(jìn)中,支持全生命周期“數(shù)據(jù)運營”的技術(shù)(如DataOps、隱私計算)等尚待成熟和融合。
但是,數(shù)據(jù)產(chǎn)業(yè)在通過各種技術(shù)手段解決了“大”的危機(jī)后,卻催生出“隱私保護(hù)”的新危機(jī),這是個人數(shù)據(jù)的用途問題,可以稱為“數(shù)據(jù)危機(jī)2.0”。沒有之前大數(shù)據(jù)的成功,就不會引發(fā)今天的隱私危機(jī)。
任何一個時代都有“數(shù)據(jù)危機(jī)”。多年后,數(shù)據(jù)產(chǎn)業(yè)在又解決了隱私危機(jī)后,可能還會引發(fā)新的危機(jī),邁入“數(shù)據(jù)危機(jī)3.0”時代。彼時,危機(jī)的產(chǎn)生可能是因為數(shù)據(jù)的生產(chǎn)要素化取得了巨大成功,可能數(shù)據(jù)已經(jīng)成為大宗商品,大量的數(shù)據(jù)衍生品在金融市場上“量化”交易,于是引發(fā)新一輪的金融危機(jī)。20年前,引發(fā)金融危機(jī)的是互聯(lián)網(wǎng)泡沫;或許20年后,引發(fā)金融危機(jī)的是“數(shù)據(jù)泡沫”。
編輯:薛姣
現(xiàn)代意義上的數(shù)據(jù)危機(jī)發(fā)生在19世紀(jì)中后期,當(dāng)時全球工業(yè)革命蓬勃發(fā)展,全球性貿(mào)易大繁榮,而記錄和管理這些商品、財富和人口信息的技術(shù),卻遠(yuǎn)遠(yuǎn)趕不上工業(yè)社會進(jìn)步的步伐。最典型的是人口普查難題:美國在1880年開展的人口普查,耗時8年才完成數(shù)據(jù)匯總。
隨著時間的推移,不僅人口數(shù)據(jù)處理越來越復(fù)雜,軍事、科學(xué)和商業(yè)等更多領(lǐng)域的數(shù)據(jù)量也持續(xù)增長,通用電子計算機(jī)由此誕生,海量數(shù)據(jù)的“簡單”統(tǒng)計處理不再是難題。
然而,計算機(jī)硬件能力以摩爾定律呈指數(shù)級增長,而軟件的生產(chǎn)方式還很原始,生產(chǎn)效率相對低下,導(dǎo)致20世紀(jì)60年代“軟件危機(jī)”爆發(fā),業(yè)界開始將主要注意力從硬件轉(zhuǎn)移到軟件。這時,復(fù)雜的數(shù)據(jù)庫管理軟件只是軟件危機(jī)的一部分。
軟件危機(jī)最初定義是為了提高軟件的生產(chǎn)效率,但后來演變成強調(diào)如何提升軟件質(zhì)量。軟件危機(jī)主要表現(xiàn)在以下幾個方面:超預(yù)算項目、超時開發(fā)項目、軟件運行效率低下、軟件質(zhì)量無法保證、軟件不符合客戶要求、項目管理指南缺失、代碼維護(hù)困難和軟件從未交付等。
軟件危機(jī)導(dǎo)致了“軟件工程”的誕生,讓程序員的編程從手工作業(yè)走向工程化。從20世紀(jì)70年代到90年代的20多年里,軟件的每一項新技術(shù)和新實踐,都會被吹捧為是解決軟件危機(jī)的靈丹妙藥,但事實上,所有已知的技術(shù)和實踐,都只是漸進(jìn)式地提升了軟件生產(chǎn)效率或質(zhì)量。
進(jìn)入21世紀(jì),“軟件危機(jī)”的說法逐漸“淡出”。這不是因為導(dǎo)致危機(jī)的問題解決了,而是因為人們對軟件危機(jī)產(chǎn)生了心理疲勞,并且新的危機(jī)出現(xiàn)了。在過去的20余年中,硬件技術(shù)、軟件技術(shù)和網(wǎng)絡(luò)技術(shù)等都在飛速發(fā)展,全球數(shù)據(jù)每年以50%的速度飛速增長,新一輪“數(shù)據(jù)危機(jī)”開始出現(xiàn)。
在新一輪“數(shù)據(jù)危機(jī)”下,非結(jié)構(gòu)化的數(shù)據(jù)量過大,無法用現(xiàn)有技術(shù)尤其是關(guān)系型數(shù)據(jù)庫技術(shù)工具加工處理,于是催生了“大數(shù)據(jù)”技術(shù),其旨在從技術(shù)層面解決“能”處理海量數(shù)據(jù)的問題。目前,我們大致處于從“數(shù)據(jù)手工藝”到“數(shù)據(jù)工程”的演進(jìn)中,支持全生命周期“數(shù)據(jù)運營”的技術(shù)(如DataOps、隱私計算)等尚待成熟和融合。
但是,數(shù)據(jù)產(chǎn)業(yè)在通過各種技術(shù)手段解決了“大”的危機(jī)后,卻催生出“隱私保護(hù)”的新危機(jī),這是個人數(shù)據(jù)的用途問題,可以稱為“數(shù)據(jù)危機(jī)2.0”。沒有之前大數(shù)據(jù)的成功,就不會引發(fā)今天的隱私危機(jī)。
任何一個時代都有“數(shù)據(jù)危機(jī)”。多年后,數(shù)據(jù)產(chǎn)業(yè)在又解決了隱私危機(jī)后,可能還會引發(fā)新的危機(jī),邁入“數(shù)據(jù)危機(jī)3.0”時代。彼時,危機(jī)的產(chǎn)生可能是因為數(shù)據(jù)的生產(chǎn)要素化取得了巨大成功,可能數(shù)據(jù)已經(jīng)成為大宗商品,大量的數(shù)據(jù)衍生品在金融市場上“量化”交易,于是引發(fā)新一輪的金融危機(jī)。20年前,引發(fā)金融危機(jī)的是互聯(lián)網(wǎng)泡沫;或許20年后,引發(fā)金融危機(jī)的是“數(shù)據(jù)泡沫”。
編輯:薛姣