狠狠色丁香婷婷综合尤物/久久精品综合一区二区三区/中国有色金属学报/国产日韩欧美在线观看 - 国产一区二区三区四区五区tv

LOGO OA教程 ERP教程 模切知識交流 PMS教程 CRM教程 開發(fā)文檔 其他文檔  
 
網(wǎng)站管理員

NoSQL難以接受的七個真相

admin
2012年8月31日 9:51 本文熱度 3738
    請不要誤會。我們目前仍然在不斷地嘗試創(chuàng)建一個簡單的數(shù)據(jù)存儲機(jī)制,也仍然在挖掘MongoDB、CouchDB、Cassandra、Riak和其他NoSQL數(shù)據(jù)庫的深層次價值。我們?nèi)匀辉谝?guī)劃將最重要的數(shù)據(jù)存儲在NoSQL數(shù)據(jù)庫中,因?yàn)樗鼈冋谌找鎻?qiáng)大,也越來越經(jīng)得起考驗(yàn)。

    不過,我們也開始察覺到了一些問題,NoSQL似乎沒有我們想象中的那么完美,它們甚至經(jīng)常令人感到惱火。明智的開發(fā)者明白這一切只是剛剛開始。

    他們沒有扔掉SQL操作手冊,也沒有中斷與他們曾經(jīng)信任的SQL數(shù)據(jù)庫供應(yīng)商之間的聯(lián)系。他們將NoSQL理解為“Not Only SQL”。

    以下是NoSQL目前面臨問題的列表,這些問題或大或小。我們這樣做的目的是向公眾展現(xiàn)實(shí)際的情況并澄清事實(shí)。

    只有坦然面對這些問題,才能夠更好地理解NoSQL的優(yōu)勢與不足。

    真相1:一致性困擾

    人們對SQL系統(tǒng)的一個不滿意地方,是在兩個表單間執(zhí)行一個連接(JOIN)所需的計(jì)算成本。其理念是在一個,即唯一的一個地方存儲數(shù)據(jù)。如果你保存一個客戶名單,將他們的住址保存在一張表單上,而在其他的每一張表單上使用客戶的ID。當(dāng)你拖動數(shù)據(jù)時,JOIN將所有ID與住址連接在一起,讓所有的數(shù)據(jù)保持一致性。

    問題是JOIN非常昂貴,一些DBA(數(shù)據(jù)庫管理員)使用極為復(fù)雜的JOIN命令,它們能讓最好的硬件也會變成垃圾。NoSQL開發(fā)者是這么解決JOIN不足的:讓我們將客戶的地址像其他所有的東西一樣都存儲在相同的表單上。NoSQL的做法是存儲與每個人配對的鍵值,在需要時,你可以檢索到它們。

    不幸的是,希望讓自己的表單保持一致的人們?nèi)匀恍枰狫OIN。一旦開始存儲客戶的地址,你需要經(jīng)常將這些地址的多個拷貝保存在每張表單中。你擁有多個拷貝,并且需要同時升級它們。如果你沒有這么做,那么NoSQL將不會幫你進(jìn)行事務(wù)處理。

    真相2:事務(wù)處理復(fù)雜性

    如果說你能夠習(xí)慣沒有JOIN的表單,那是因?yàn)槟阆M@得更高的速度。這種取舍還是可以接受的。有時候,SQL的DBA就是出于這種原因才使用非規(guī)范化表單的,問題是NoSQL難以保持各種條目的一致性。很多時候,沒有一個事務(wù)處理可以確保能同時對多個表單做出調(diào)整。出于這種原因,你只有依靠自己,一個崩潰將會導(dǎo)致表單變得前后矛盾。

    最早的NoSQL部署無視這些交易。除非沒有設(shè)定一致性,否則它們將提供保持一致性的數(shù)據(jù)列表。換句話說,他們追求的是最低價值的數(shù)據(jù)。在這種情下,錯誤不會導(dǎo)致任何重大差異。

    真相3:靈活性怪圈

    許多NoSQL程序員喜歡吹噓他們的代碼如何簡潔,工作機(jī)制運(yùn)行的速度有多快,等等。當(dāng)任務(wù)像NoSQL那樣簡單時,通常他們的說法是對的,但是當(dāng)問題復(fù)雜之后,情況就改變了。

    我們應(yīng)該考慮到JOIN的挑戰(zhàn)。一旦NoSQL程序員開始在他們自己的邏輯中加入自己的JOIN命令,他們就會開始嘗試更為有效地做這項(xiàng)工作。SQL數(shù)據(jù)庫開發(fā)者花了數(shù)十年的時間開發(fā)出巧妙的引擎,以便讓JOIN命令盡可能地高效化。

    一個SQL數(shù)據(jù)庫開發(fā)者告訴我,他正在嘗試讓自己的代碼與硬盤轉(zhuǎn)速同步。這樣一來,他就能夠僅在磁頭處于正確位置時請求數(shù)據(jù)。這看起來有些極端,但是SQL數(shù)據(jù)庫開發(fā)者為此已經(jīng)努力了十余年的時間。

    毫無疑問,程序員們已經(jīng)絞盡腦汁組織他們的SQL查詢,以便利用所有的潛在優(yōu)勢。其中的過程可能很艱辛,但是當(dāng)程序員找到了解決辦法,這些數(shù)據(jù)庫就能夠真正煥發(fā)出活力。

    真相4:訪問模式過多

    在理論上,SQL被認(rèn)為是一種標(biāo)準(zhǔn)的語言。如果你在一個數(shù)據(jù)庫中使用SQL,你應(yīng)該能夠在另外一個兼容版本中執(zhí)行相同的查詢。這一說法可能僅對一些簡單的查詢有效,但是每個DBA都清楚,他們需要花上數(shù)年時間才能掌握不同版本數(shù)據(jù)庫的SQL的特點(diǎn)。關(guān)鍵詞被重新定義,在一個版本中正常運(yùn)行的查詢,在另一個版本中可能就無法正常運(yùn)行。

    NoSQL更為神秘莫測,它們就如同通天塔一樣。從一開始,NoSQL開發(fā)者就在竭盡全力地想要設(shè)計(jì)出最佳語言,但是他們的設(shè)想有著很大的差別。起初實(shí)驗(yàn)效果還是不錯的,但是當(dāng)你嘗試在工具間切換時,情況就變了。CouchDB查詢被表述為用于映射與約簡的JavaScript功能。Cassandra早期版本使用了一個原始而低級的API(應(yīng)用編程接口),即Thrift。新版本推出了CQL,一種與SQL類似的查詢語言,它必須要被服務(wù)器所解析和理解。每一個產(chǎn)品的設(shè)計(jì)原理都不盡相同。

    真相5:綱要靈活性存在問題

    NoSQL的一個重要理念是不需要綱要。換句話說,程序員不需要提前決定表單中的每一個行需要使用哪個列。一個條目可能有20個相關(guān)的字符串,另一個可能有12個整數(shù)類型,另一個可能完全是空白。程序員能夠在需要存儲時隨時做出決定,他們不需要獲得DBA的許可,也不需要填寫所有的文檔,以增加一個新的列。

    這些自由聽起來非常具有誘惑力,并且能夠加快開發(fā)速度。但是對于需要三個開發(fā)團(tuán)隊(duì)的數(shù)據(jù)庫來說,這真的是一個好主意嗎?對于可能持續(xù)六個月以上時間的數(shù)據(jù)庫來說,它們是否可行?

    換句話說,開發(fā)者可能希望利用這些自由將老的Pair(對)加入到數(shù)據(jù)庫中。

    但是,在四名開發(fā)者已經(jīng)選擇了他們自己的鍵后,你希望成為第五名開發(fā)者嗎?我們可以想象一下“birthday”(生日)的多種表達(dá)方式。在添加用戶生日進(jìn)入條目中時,每名開發(fā)者都會選擇他們自己的表示方式。一個開發(fā)團(tuán)隊(duì)幾乎可能會想到所有的表示形式,例如“bday”、“b-day”和“birthday”。NoSQL架構(gòu)并不支持限制這一問題,因?yàn)檫@意味著要重新設(shè)計(jì)綱要。它們不希望對個性化的開發(fā)者加以限制。

    真相6:沒有附加功能

    你不希望把所有的數(shù)據(jù)存儲在所有的行中,你希望得到單選索引的總數(shù)。SQL用戶能夠通過SUM操作執(zhí)行一個查詢,然后向你反饋一個數(shù)字。

    NoSQL用戶則將所有的數(shù)據(jù)反饋至他們那里,然后自己進(jìn)行添加。添加并不是問題,因?yàn)樵谌魏螜C(jī)器上增加數(shù)字都需要花上相同的時間。但是數(shù)據(jù)反饋卻非常慢。反饋所有數(shù)據(jù)所需要的帶寬也非常的昂貴。

    NoSQL數(shù)據(jù)庫中幾乎沒有附加功能。除了存儲和檢索數(shù)據(jù)外,如果你想做任何事情,你可能需要自己動手。在許多案例中,通過完整的數(shù)據(jù)復(fù)制,你可以在不同的機(jī)器上做這些事情。真正的問題是,它對在保留有數(shù)據(jù)的機(jī)器上進(jìn)行計(jì)算有幫助。因?yàn)榭梢允∪?shù)據(jù)反饋的時間,但是對于你來說卻是非常的困難。

    MongoDB提供的映射與約簡查詢架構(gòu)可以讓你通過任意的JavaScript架構(gòu)來簡化數(shù)據(jù)。在擁有數(shù)據(jù)的機(jī)器間分發(fā)計(jì)算方面,Hadoop是一個強(qiáng)大的機(jī)制。它是一個快速演進(jìn)的架構(gòu),可以為創(chuàng)建復(fù)雜的分析快速提供改良的工具。這聽起來非常酷,但是Hadoop技術(shù)本身卻非常新。盡管Hadoop與NoSQL之間的差別正在消失,但是在技術(shù)上,Hadoop是一個與NoSQL完全不同的東西。

    真相7:工具太少

    你能夠在服務(wù)器上部署NoSQL并運(yùn)行它們。當(dāng)然,你也能夠編寫你自己自定義的代碼以讀寫數(shù)據(jù)。但是如果你希望做更多的事,那它們會怎么樣呢?如果你想購買一個報告套件,一個繪圖套件或是下載一些用于創(chuàng)建圖表的開源工具,它們又會怎么樣呢?

    很不幸,大多數(shù)工具都是針對SQL數(shù)據(jù)庫編寫的。如果你想生成報告,創(chuàng)建圖表,或是利用NoSQL堆棧中的數(shù)據(jù)做一些事情,你需要重新進(jìn)行編寫。目前已經(jīng)有了用于處理來自甲骨文數(shù)據(jù)庫、微軟SQL Server、MySQL和Postgres等SQL數(shù)據(jù)庫中數(shù)據(jù)的標(biāo)準(zhǔn)工具。你的數(shù)據(jù)是NoSQL類型的嗎?目前工具制造商們正在努力解決這些問題。

    市場上已經(jīng)有20多個不同的NoSQL選擇,這些選擇都擁有自己的理念和處理數(shù)據(jù)的方式。對于工具制造商而言,他們難以支持SQL的特點(diǎn)和不一致性。

    然而與之相比,為NoSQL解決方案制造相關(guān)工具則更為困難。

    當(dāng)然,這一問題會慢慢被消滅。開發(fā)者們已經(jīng)意識到了NoSQL的優(yōu)勢,他們將修改自己的工具,以適合這些新的系統(tǒng),不過這要花上些時間。或許他們會針對MongoDB開發(fā)出一些工具,但是這對于使用Cassandra的用戶而言沒有絲毫的幫助。在這種情況下,標(biāo)準(zhǔn)就顯得尤為重要。但是在這一方面,NoSQL并不擅長。(完)

該文章在 2012/8/31 9:51:57 編輯過
關(guān)鍵字查詢
相關(guān)文章
正在查詢...
點(diǎn)晴ERP是一款針對中小制造業(yè)的專業(yè)生產(chǎn)管理軟件系統(tǒng),系統(tǒng)成熟度和易用性得到了國內(nèi)大量中小企業(yè)的青睞。
點(diǎn)晴PMS碼頭管理系統(tǒng)主要針對港口碼頭集裝箱與散貨日常運(yùn)作、調(diào)度、堆場、車隊(duì)、財(cái)務(wù)費(fèi)用、相關(guān)報表等業(yè)務(wù)管理,結(jié)合碼頭的業(yè)務(wù)特點(diǎn),圍繞調(diào)度、堆場作業(yè)而開發(fā)的。集技術(shù)的先進(jìn)性、管理的有效性于一體,是物流碼頭及其他港口類企業(yè)的高效ERP管理信息系統(tǒng)。
點(diǎn)晴WMS倉儲管理系統(tǒng)提供了貨物產(chǎn)品管理,銷售管理,采購管理,倉儲管理,倉庫管理,保質(zhì)期管理,貨位管理,庫位管理,生產(chǎn)管理,WMS管理系統(tǒng),標(biāo)簽打印,條形碼,二維碼管理,批號管理軟件。
點(diǎn)晴免費(fèi)OA是一款軟件和通用服務(wù)都免費(fèi),不限功能、不限時間、不限用戶的免費(fèi)OA協(xié)同辦公管理系統(tǒng)。
Copyright 2010-2025 ClickSun All Rights Reserved