掌握 MongoDB 数据类型，提升数据存储性能-猿码集

1. MongoDB 数据类型简介

在 MongoDB 中，可以存储不同类型的数据，包括文本、数字、日期、对象 ID、二进制数据、代码、正则表达式等。以下是 MongoDB 支持的常见数据类型：

String：存储字符串

Number：可存储整数或浮点数

Boolean：存储布尔值 true 或 false

Array：存储数组

Object：存储 JSON 对象

ObjectId：存储 MongoDB 的内部唯一 ID

Timestamp：用于存储时间戳

Date：用于存储日期时间值

1.1 常见数据类型使用场景

在实际应用中，不同的数据类型适用于不同的场景。

String：应用于存储文本信息，如文章、新闻、博客等。


{
    "title": "MongoDB 学习笔记",
    "content": "MongoDB 是一个 NoSQL 数据库...",
    "tag": ["MongoDB", "NoSQL", "技术"]
}

Number：应用于存储数值信息，如销售数据、用户统计数据等。


{
    "products_sold": 120,
    "revenue": 5600.25
}

Boolean：应用于存储布尔值信息，如判断用户是否登录等。


{
    "is_login": true
}

Array：应用于存储多个相同类型的数据，如商品列表等。


{
    "products": [
        {"name": "iPhone XR", "price": 649},
        {"name": "iPad Pro", "price": 799},
        {"name": "MacBook Pro", "price": 1499}
    ]
}

Object：应用于存储复杂的数据结构，如用户信息、订单信息等。


{
    "user_info": {
        "username": "John",
        "email": "john@example.com",
        "address": {
            "city": "New York",
            "state": "NY"
        }
    },
    "order_info": {
        "order_id": "123456",
        "products": [
            {"name": "iPhone XR", "price": 649},
            {"name": "iPad Pro", "price": 799},
            {"name": "AirPods", "price": 159}
        ]
    }
}

ObjectId：应用于存储 MongoDB 的唯一 ID，一般用作数据的主键。


{
    "_id": ObjectId("5fdc88ed572979238c4b1c7e"),
    "username": "John",
    "email": "john@example.com"
}

Date：应用于存储日期时间信息。


{
    "created_at": ISODate("2020-12-19T00:00:00Z"),
    "updated_at": ISODate("2020-12-20T10:00:00Z")
}

2. MongoDB 数据类型的存储性能

在 MongoDB 中，使用不同的数据类型也会对数据的存储性能产生影响。以下是一些常见数据类型的存储性能对比：

2.1 数字类型的存储性能

在 MongoDB 中，使用 Number 存储数字会比使用 String 存储数字具有更高的性能。因为使用 Number 存储数字时，MongoDB 可以更快地对数字进行排序和聚合操作。

以下是 Number 和 String 存储大量数据时的性能对比：


// 使用 Number 存储数据
db.numbers.insertMany([{num: 1}, {num: 2}, ..., {num: 10000}])
// 查询数据并排序
db.numbers.find().sort({num: 1})
// 使用 String 存储数据
db.strings.insertMany([{num: "1"}, {num: "2"}, ..., {num: "10000"}])
// 查询数据并排序
db.strings.aggregate([{$sort: {num: 1}}])

从上面的代码可以看出，使用 Number 存储数据时，可以直接使用 sort 方法进行排序，而使用 String 存储数据时，需要使用聚合操作进行排序。

2.2 数组类型的存储性能

在 MongoDB 中，使用数组类型存储数据时，需要注意数组元素的数量。如果数组元素数量较少，可以直接将数组存储在一个字段中。但是，如果数组元素数量较多，建议将数组拆分成多个文档进行存储。

以下是存储大量数据时数组元素数量对存储性能的影响：


// 存储数组元素数量较少的数据，直接存储在一个字段中
db.products.insertMany([
    {name: "iPhone XR", price: 649, tags: ["Apple", "iPhone", "XR"]},
    {name: "iPad Pro", price: 799, tags: ["Apple", "iPad", "Pro"]},
    {name: "MacBook Pro", price: 1499, tags: ["Apple", "MacBook", "Pro"]}
])
// 存储数组元素数量较多的数据，拆分成多个文档存储
db.products.insertMany([
    {name: "iPhone XR", price: 649},
    {name: "iPad Pro", price: 799},
    {name: "MacBook Pro", price: 1499}
])
db.tags.insertMany([
    {product_id: ObjectId("..."), tag: "Apple"},
    {product_id: ObjectId("..."), tag: "iPhone"},
    {product_id: ObjectId("..."), tag: "XR"},
    {product_id: ObjectId("..."), tag: "iPad"},
    {product_id: ObjectId("..."), tag: "Pro"},
    {product_id: ObjectId("..."), tag: "MacBook"}
])

从上面的代码可以看出，对于数组元素数量较少的数据，可以直接将数组存储在一个字段中；对于数组元素数量较多的数据，则建议将数组拆分成多个文档进行存储，避免单个文档过大，影响性能。

2.3 ObjectId 类型的存储性能

在 MongoDB 中，使用 ObjectId 存储数据的性能会比使用自定义字符串作为主键的性能更高。因为 ObjectId 是 MongoDB 内部生成的唯一 ID，能够更快速地进行排序和索引。

以下是使用自定义字符串作为主键和使用 ObjectId 作为主键对存储性能的影响：


// 使用自定义字符串作为主键
db.users.insertMany([
    {"_id": "1", "username": "Alice"},
    {"_id": "2", "username": "Bob"},
    {"_id": "3", "username": "Charlie"}
])
// 查询数据
db.users.findOne({"_id": "2"})
// 使用 ObjectId 作为主键
db.users.insertMany([
    {"username": "Alice"},
    {"username": "Bob"},
    {"username": "Charlie"}
])
// 查询数据
db.users.findOne({"_id": ObjectId("...")})

从上面的代码可以看出，使用自定义字符串作为主键时，查询数据时需要进行字符串比较，对性能有影响；而使用 ObjectId 作为主键时，在查询和排序时都能更快速地进行操作。

3. 总结

在 MongoDB 中，掌握不同数据类型的使用场景和存储性能，能够帮助我们更好地设计数据模型，提升数据存储性能。

总的来说，应用 Number 存储数字、将数组数量较多的数据拆分成多个文档存储、使用 ObjectId 存储数据的方式是优化性能的常见方法。

掌握 MongoDB 数据类型，提升数据存储性能

1. MongoDB 数据类型简介

1.1 常见数据类型使用场景

2. MongoDB 数据类型的存储性能

2.1 数字类型的存储性能

2.2 数组类型的存储性能

2.3 ObjectId 类型的存储性能

3. 总结

相关阅读

数据库标签

MongoDB热门

MongoDB更新