主頁 > 知識庫 > MongoDB中的參數(shù)限制與閥值詳析

MongoDB中的參數(shù)限制與閥值詳析

熱門標(biāo)簽:百度競價排名 鐵路電話系統(tǒng) 網(wǎng)站排名優(yōu)化 地方門戶網(wǎng)站 Linux服務(wù)器 服務(wù)外包 AI電銷 呼叫中心市場需求

前言

今天搜索spark mongo的資料,意外發(fā)現(xiàn)了MongoDB的一些知識,這些都是之前沒有接觸過的,所以專門記錄下。 (๑• . •๑)

下面話不多說了,來一起看看詳細(xì)的介紹吧

一、BSON文檔

  • BSON文檔尺寸:一個document文檔最大尺寸為16M;大于16M的文檔需要存儲在GridFS中。
  • 文檔內(nèi)嵌深度:BSON文檔的結(jié)構(gòu)(tree)深度最大為100。

二、Namespaces

  • collection命名空間:.,最大長度為120字節(jié)。這也限定了database和collection的名字不能太長。
  • 命名空間的個數(shù):對于MMAPV1引擎,個數(shù)最大為大約為24000個,每個collection以及index都是一個namespace;對于wiredTiger引擎則沒有這個限制。
  • namespace文件的大?。簩τ贛MAPV1引擎而言,默認(rèn)大小為16M,可以通過在配置文件中修改。wiredTiger不受此限制。

三、indexes

  • index key:每條索引的key不得超過1024個字節(jié),如果index key的長度超過此值,將會導(dǎo)致write操作失敗。
  • 每個collection中索引的個數(shù)不得超過64個。
  • 索引名稱:我們可以為index設(shè)定名稱,最終全名為..$,最長不得超過128個字節(jié)。默認(rèn)情況下為filed名稱與index類型的組合,我們可以在創(chuàng)建索引時顯式的指定index名字,參見createIndex()方法。
  • 組合索引最多能包含31個field。

四、Data

  • Capped Collection:如果你在創(chuàng)建“Capped”類型的collection時指定了文檔的最大個數(shù),那么此個數(shù)不能超過2的32次方,如果沒有指定最大個數(shù),則沒有限制。
  • Database Size:MMAPV1引擎而言,每個database不得持有超過16000個數(shù)據(jù)文件,即單個database的總數(shù)據(jù)量最大為32TB,可以通過設(shè)置“smallFiles”來限定到8TB。
  • Data Size:對于MMAVPV1引擎而言,單個mongod不能管理超過最大虛擬內(nèi)存地址空間的數(shù)據(jù)集,比如linux(64位)下每個mongod實例最多可以維護(hù)64T數(shù)據(jù)。wiredTiger引擎沒有此限制。
  • 每個Database中collection個數(shù):對于MMAPV1引擎而然,每個database所能持有的collections個數(shù)取決于namespace文件大?。ㄓ脕肀4鎛amespace)以及每個collection中indexes的個數(shù),最終總尺寸不超過namespace文件的大?。?6M)。wiredTiger引擎不受到此限制。

五、Replica Sets

  • 每個replica set中最多支持50個members。
  • replica set中最多可以有7個voting members。(投票者)
  • 如果沒有顯式的指定oplog的尺寸,其最大不會超過50G。

六、Sharded Clusters

  • group聚合函數(shù),在sharding模式下不可用。請使用mapreduce或者aggregate方法。
  • Coverd Queries:即查詢條件中的Fields必須是index的一部分,且返回結(jié)果只包含index中的fields;對于sharding集群,如果query中不包含shard key,索引則無法進(jìn)行覆蓋。雖然_id不是“shard key”,但是如果查詢條件中只包含_id,且返回的結(jié)果中也只需要_id字段值,則可以使用覆蓋查詢,不過這個查詢似乎并沒有什么意義(除非是檢測此_id的document是否存在)。
  • 對于已經(jīng)存有數(shù)據(jù)的collections開啟sharding(原來非sharding),則其最大數(shù)據(jù)不得超過256G。當(dāng)collection被sharding之后,那么它可以存儲任意多的數(shù)據(jù)。
  • 對于sharded collection,update、remove對單條數(shù)據(jù)操作(操作選項為multi:false或者justOne),必須指定shard key或者_(dá)id字段;否則將會拋出error。
  • 唯一索引:shards之間不支持唯一索引,除非這個“shard key”是唯一索引的最左前綴。比如collection的shard key為{“zipcode”:1,”name”: 1},如果你想對collection創(chuàng)建唯一索引,那么唯一索引必須將zipcode和name作為索引的最左前綴,比如:collection.createIndex({“zipcode”:1,”name”:1,”company”:1},{unique:true})。
  • 在chunk遷移時允許的最大文檔個數(shù):如果一個chunk中documents的個數(shù)超過250000(默認(rèn)chunk大小為64M)時,或者document個數(shù)大于 1.3 *(chunk最大尺寸(有配置參數(shù)決定)/ document平均尺寸),此chunk將無法被“move”(無論是balancer還是人工干預(yù)),必須等待split之后才能被move。

七、shard key

  • shard key的長度不得超過512個字節(jié)。
  • “shard key索引”可以為基于shard key的正序索引,或者以shard key開頭的組合索引。shard key索引不能是multikey索引(基于數(shù)組的索引)、text索引或者geo索引。
  • Shard key是不可變的,無論何時都不能修改document中的shard key值。如果需要變更shard key,則需要手動清洗數(shù)據(jù),即全量dump原始數(shù)據(jù),然后修改并保存在新的collection中。
  • 單調(diào)遞增(遞減)的shard key會限制insert的吞吐量;如果_id是shard key,需要知道_id是ObjectId()生成,它也是自增值。對于單調(diào)遞增的shard key,collection上的所有insert操作都會在一個shard節(jié)點上進(jìn)行,那么此shard將會承載cluster的全部insert操作,因為單個shard節(jié)點的資源有限,因此整個cluster的insert量會因此受限。如果cluster主要是read、update操作,將不會有這方面的限制。為了避免這個問題,可以考慮使用“hashed shard key”或者選擇一個非單調(diào)遞增key作為shard key。(rang shard key 和hashed shard key各有優(yōu)缺點,需要根據(jù)query的情況而定)。

八、Operations

  • 如果mongodb不能使用索引排序來獲取documents,那么參與排序的documents尺寸需要小于32M。
  • Aggregation Pileline操作。Pipeline stages限制在100M內(nèi)存,如果stage超過此限制將會發(fā)生錯誤,為了能處理較大的數(shù)據(jù)集,請開啟“allowDiskUse”選項,即允許pipeline stages將額外的數(shù)據(jù)寫入臨時文件。

九、命名規(guī)則

  • database的命名區(qū)分大小寫。
  • database名稱中不要包含:/ .‘'$*>:|?
  • database名稱長度不能超過64個字符。
  • collection名稱可以以“_”或者字母字符開頭,但是不能包含”$”符號,不能為空字符或者null,不能以“system.”開頭,因為這是系統(tǒng)保留字。
  • document字段名不能包含“.”或者null,且不能以“$”開頭,因為$是一個“引用符號”。

最后記錄下json嵌套中含有列表的查詢方法,樣例數(shù)據(jù):

{
 "_id" : ObjectId("5c6cc376a589c200018f7312"),
 "id" : "9472",
 "data" : {
 "name" : "測試",
 "publish_date" : "2009-05-15",
 "authors" : [ 
  {
  "author_id" : 3053,
  "author_name" : "測試數(shù)據(jù)"
  }
 ],
 }
}

我要查詢authors中的author_id,query可以這樣寫:

db.getCollection().find({'data.authors.0.author_id': 3053})

用0來代表第一個索引,點代表嵌套結(jié)構(gòu)。但是spark mongo中是不能這樣導(dǎo)入的,需要使用別的方法。

總結(jié)

以上就是這篇文章的全部內(nèi)容了,希望本文的內(nèi)容對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,如果有疑問大家可以留言交流,謝謝大家對腳本之家的支持。

您可能感興趣的文章:
  • Mongodb設(shè)置TTL索引自動清除數(shù)據(jù)與過期數(shù)據(jù)的方法
  • windows與mac安裝mongodb數(shù)據(jù)庫的方法步驟與注意事項
  • node鏈接mongodb數(shù)據(jù)庫的方法詳解【阿里云服務(wù)器環(huán)境ubuntu】
  • MongoDB基礎(chǔ)入門之創(chuàng)建、刪除集合操作
  • Golang Mongodb模糊查詢的使用示例
  • Python使用pymongo庫操作MongoDB數(shù)據(jù)庫的方法實例
  • Windows上php5.6操作mongodb數(shù)據(jù)庫示例【配置、連接、獲取實例】
  • PHP封裝的簡單連接MongoDB類示例
  • PHP使用mongoclient簡單操作mongodb數(shù)據(jù)庫示例
  • MongoDB的基本特性與內(nèi)部構(gòu)造的講解

標(biāo)簽:蘭州 湘潭 崇左 銅川 仙桃 湖南 衡水 黃山

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《MongoDB中的參數(shù)限制與閥值詳析》,本文關(guān)鍵詞  ;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 收縮
    • 微信客服
    • 微信二維碼
    • 電話咨詢

    • 400-1100-266