近日接到一個開發(fā)需求,因業(yè)務調(diào)整,需要DBA協(xié)助,將MongoDB數(shù)據(jù)庫中某集合的進行替換。例如我們需要將集合A中B字段中,有關(guān)《美好》的字符替換為 《非常美好》。個人感覺這個需求如果是在SQL Server 或MySQL 數(shù)據(jù)庫上處理是小菜一碟,如果是針對MongoDB數(shù)據(jù),可能要費神了。
在SQL Server數(shù)據(jù)庫中,我們用Replace函數(shù)來實現(xiàn)字符的替換。
語法
REPLACE ( ''string_replace1'' , ''string_replace2'' , ''string_replace3'' )
參數(shù)
''string_replace1''
待搜索的字符串表達式。string_replace1 可以是字符數(shù)據(jù)或二進制數(shù)據(jù)。
''string_replace2''
待查找的字符串表達式。string_replace2 可以是字符數(shù)據(jù)或二進制數(shù)據(jù)。
''string_replace3''
替換用的字符串表達式。string_replace3 可以是字符數(shù)據(jù)或二進制數(shù)據(jù)。
例如將 字符串 SQL Server 數(shù)據(jù)庫 中的 SQL Server 替換為 MongoDB。
實現(xiàn)語句如下:
在MySQL數(shù)據(jù)庫中語法類似。
很可惜,到目前為止還沒有找到類似SQL Server的替換函數(shù),那么我們怎么去實現(xiàn)文檔中的數(shù)據(jù)替換呢?特別是集合中的文檔數(shù)量比較大時。
假設(shè)現(xiàn)在有用戶信息文檔,如下。注意其中有聯(lián)系地址。
{ "_id" : ObjectId("5c77e5f85f53771b74bc87e0"), "username" : "hanmeimei", "email" : "123456@126.com", "tel" : 7891233, "addresses" : { "provice" : "山東省", "city" : "菏澤市鄄城縣曹集鎮(zhèn)", "stree" : "武狀元街道28號" } }, /* 2 createdAt:2019/2/28 下午9:45:28*/ { "_id" : ObjectId("5c77e5f85f53771b74bc87df"), "username" : "Lily", "email" : "123456@126.com", "tel" : 123455, "addresses" : [ { "provice" : "河南省", "city" : "鄭州市登封縣李集鎮(zhèn)", "stree" : "少林街道28號" } ] }, /* 3 createdAt:2019/2/28 下午9:45:28*/ { "_id" : ObjectId("5c77e5f85f53771b74bc87de"), "username" : "Lily", "email" : "123456@126.com", "tel" : 123455, "addresses" : { "provice" : "山東省", "city" : "菏澤市定陶縣曹集鎮(zhèn)", "stree" : "武狀元街道28號" } }, /* 4 createdAt:2019/2/28 下午9:45:28*/ { "_id" : ObjectId("5c77e5f85f53771b74bc87dd"), "username" : "jack", "email" : "123456@126.com", "tel" : 123455, "addresses" : { "provice" : "山東省", "city" : "菏澤市定陶縣", "stree" : "武狀元街道28號" } }
現(xiàn)在因為行政區(qū)域劃分,將 菏澤市定陶縣劃為定陶縣區(qū)。那么怎么進行批量修改呢? MongoDB中沒有Replace。
Update,也不好寫代碼。
最終.......我們還是找到了一個方法。
大家是先看看執(zhí)行的代碼及實現(xiàn)的結(jié)果。
db.user.find({'addresses.city':{'$regex': /菏澤市定陶縣/ }}).forEach( function(item) { var tmp = String(item.addresses.city) tmp = tmp.replace('菏澤市定陶縣','菏澤市定陶縣區(qū)') if (tmp == null){ print(item.addresses.city) } item.addresses.city = tmp ; db.user.save(item); } );
執(zhí)行后,再次查看數(shù)據(jù),結(jié)果如下:
/* 1 createdAt:2019/2/28 下午9:45:28*/ { "_id" : ObjectId("5c77e5f85f53771b74bc87e0"), "username" : "hanmeimei", "email" : "123456@126.com", "tel" : 7891233, "addresses" : { "provice" : "山東省", "city" : "菏澤市鄄城縣曹集鎮(zhèn)", "stree" : "武狀元街道28號" } }, /* 2 createdAt:2019/2/28 下午9:45:28*/ { "_id" : ObjectId("5c77e5f85f53771b74bc87df"), "username" : "Lily", "email" : "123456@126.com", "tel" : 123455, "addresses" : [ { "provice" : "河南省", "city" : "鄭州市登封縣李集鎮(zhèn)", "stree" : "少林街道28號" } ] }, /* 3 createdAt:2019/2/28 下午9:45:28*/ { "_id" : ObjectId("5c77e5f85f53771b74bc87de"), "username" : "Lily", "email" : "123456@126.com", "tel" : 123455, "addresses" : { "provice" : "山東省", "city" : "菏澤市定陶縣區(qū)曹集鎮(zhèn)", "stree" : "武狀元街道28號" } }, /* 4 createdAt:2019/2/28 下午9:45:28*/ { "_id" : ObjectId("5c77e5f85f53771b74bc87dd"), "username" : "jack", "email" : "123456@126.com", "tel" : 123455, "addresses" : { "provice" : "山東省", "city" : "菏澤市定陶縣區(qū)", "stree" : "武狀元街道28號" } }
集合文檔中addresses.city中的'菏澤市定陶縣' 全部被 '菏澤市定陶縣區(qū)' 替換,符合設(shè)計要求。
(1)作為一個數(shù)據(jù)庫,MongoDB有一個很大的優(yōu)勢—它使用js管理數(shù)據(jù)庫,所以也能夠使用js腳本進行復雜的管理。MongoDB自帶JavaScript shell,可在shell中使用命令行與MongoDB進行交互。shell是一個功能完備的JavaScript解釋器,可運行任意JavaScript程序。
mongodb 的shell是javascript實現(xiàn)的,如果直接使用js實現(xiàn)相應的功能則顯得很直觀和簡便。比如我們對一些數(shù)據(jù)進行 統(tǒng)計計算,除了使用mapreduce和aggreate框架之外,直接使用js也是很好的選擇。還有一些批處理,數(shù)據(jù)同步都可以使用js
例如將集合中所有的文檔,打印出來-- db.collectionname.find().forEach(printjson)。
注意:在上面演示的MongoDB替換字符的腳本,都在mongodb shell 和 nosqlbooster 工具里面驗證過,沒有問題。但是相同的代碼在mongodb shell中要注意格式要求,最好要符合Javascript 格式要求,否則,可能報錯,如:E QUERY [thread1] SyntaxError: missing ; before statement @(shell):1:138
(2)forEach:MongoDB數(shù)據(jù)庫使用游標返回find的執(zhí)行結(jié)果??蛻舳藢τ螛说膶崿F(xiàn)通常能夠?qū)ψ罱K結(jié)果進行有效的控制??梢韵拗平Y(jié)果的數(shù)量,略過部分結(jié)果,根據(jù)任意鍵按任意順序的組合對結(jié)果進行各種排序,或者是執(zhí)行其他一些強大的操作。游標有一個重要的迭代函數(shù)---cursor.forEach(回調(diào)函數(shù)),允許我們自定義回調(diào)函數(shù)來逐個處理每個單元.
(3)$regex :正則表達式是使用單個字符串來描述、匹配一系列符合某個句法規(guī)則的字符串。MongoDB 使用 $regex 操作符來設(shè)置匹配字符串的正則表達式。
更多關(guān)于MongoDB中數(shù)據(jù)的替換方法實現(xiàn)的方法請查看下面的相關(guān)鏈接