0%

初探MongoDB中的数据库事务

背景

最近有一个业务需要同时写两个表,并且需要保证数据的正确性。我们的项目线上的 MongoDB 版本是 4.0,查了一下发现 4.0 版本的 MongoDB 已经支持副本集中的事务了,于是做了一下调研。

准备环境

鉴于 MongoDB 的事务支持需要在副本集中才生效,我用 Docker-Compose 部署了一个一主两从结构的 4.0 版本 MongoDB 副本集(部署过程参考了文章)。

初始化数据

假设有两个表,订单表(orders)和库存表(inventory), 对于一个下单行为:创建一个购买了商品 A x 件的订单,需要增加一条 orders 表记录表明购买了 x 件商品 A,同时商品 A 对应的库存表记录的库存也要减少 x 件。

1
2
3
4
5
6
import pymongo

client = pymongo.MongoClient(host="mongodb://root:123@localhost:37011")

db = client.get_database("test")
db.inventory.insert_one({"sku": "abc", "qty": 100000})

在代码中我们初始化了十万件商品 abc。

编写事务代码

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
import pymongo
import sys

client = pymongo.MongoClient(host="mongodb://root:123@localhost:37011")

db = client.get_database("test")

with client.start_session() as session:
with session.start_transaction():

print(
db.orders.insert_one(
{"sku": "abc", "qty": 1000},
session=session,
).inserted_id
)
# sys.exit(0)
print(
db.inventory.find_one_and_update(
{"sku": "abc"},
{"$inc": {"qty": -1000}},
return_document=pymongo.ReturnDocument.AFTER,
session=session,
)
)

print(
list(
db.orders.aggregate(
[
{"$match": {"sku": "abc"}},
{"$group": {"_id": None, "total": {"$sum": "$qty"}}},
]
)
)[0]
)

我们将增加订单修改库存的操作放到一个事务里,并观察abc商品在所有订单中的数量和和其库存剩余。

验证

图1
可以看到在正常执行的情况下聚合的 abc 商品的销量与库存的 abc 商品的数量总和始终为 100000。

事务中断

我们取消对sys.exit(0)所在行代码的注释,模拟创建订单后接口异常退出的情况(此时还没有修改商品的库存)。

图2

我们可以检查一下事务中断前插入订单记录有没有被回滚删除掉。

图3

结果是这两条记录并不存在,对于终端用户来说订单并没有创建成功。

我们再重新注释掉sys.exit(0)语句,看一下现在的商品abc的数量。

图4

可以看到商品abc的已售出数量和库存剩余数量之和仍然为十万,失败的事务并没有影响到数据正确。

总结

在 MongoDB 4.0 版本中,我们已经可以使用数据库事务来保证多表操作下数据的正确性了,不过事务始终会对数据库性能造成一定的影响,能在业务层面避免同时操作多表就再好不过了。

扫码加入技术交流群🖱️
QR code