当前位置:数据库 > mongodb >>

MongoDB结构划分简述

MongoDB结构划分简述
 
从整体上可以将MongoDB自底向上划分为四部分:
 
 基础数据部分
 一般的数据库操作
 MongoDB提供的操作特性
 数据库架构管理
 
二、 各部分简介
 
1. 基础数据部分
 
数据库最终的工作就是把数据存储,然后在用户需要的时候以一种方式把数据提出去。因此,所有数据都需要以一种形式保存到内存或者硬盘里。
 
在MongoDB里面主要有两种数据的存储方式。
 
BSON:类似于一个有序的JSON。是数据存储的基础,在MongoDB中的大部分数据都是用这种数据结构与用户交互。与一般数据库不同虽然MongoDB也是KV操作读取数据,但是用一Key对应的Value可以是不同类型。
 
GridFS:BSON只能存储最大4MB的数据,当需要存储大型数据的时候,就需要用GridFS来做存储了。
 
2. 一般数据库操作
 
作为数据库应该包含基本的增、删、改、查功能,并且提供加速基本操作的辅助工具,MongoDB同样也提供了这些基本功能。
 
动态查询:基本的增删改查功能。同时在做这些操作的时候MongoDB为这些操作自动优化,如:考虑可以利用的索引,直接从缓存中读取内容等等。
 
索引:在MongoDB中为每一条数据创建了一个_id的属性,作为最基本的索引。用户也可以自己创建一个索引来提高查询效率。MongoDB也提供了合并索引的功能,可以用来合并多关键词的索引。
 
地理位置索引:可以根据距离等位置相关属性来做索引。
 
预查询:在真正执行一条语句前,测试查询等基本操作的耗时,作为数据库设计或者语句效率的检测。
 
3. MongoDB提供的操作特性
 
同一位置插入数据:与其他数据库不同,MongoDB在真正将数据写入本地前,做了缓存处理,在内存中读写数据的速度比每次都写到本地的速度快多了。
 
Map and Reduce Function:MongoDB的特殊数据结构,决定了他可以有与众不同的特殊数据处理方式。编写这两个函数可以完成很多数据库本身没有提供的自定义功能。
 
4. 数据库架构管理
 
数据备份:由于MongoDB的实时读取性和内存中处理数据的特性,单个MongoDB数据库是很容易造成数据丢失的,为保证数据不丢失或少丢失(实际生产中会丢失),MongoDB提供了数据备份和选举运行主机的机制。(在实际生产中不能需要多台MongoDB服务器共同运行)下图简单描述了MongoDB的主从机关系。
 
 
自动分片:在实际生产中,当数据量过大超过了一台MongoDB服务器所能支持的时候,需要考虑建立一个MongoDB的数据库集群,每一个集保存整体数据的某一部分。下图简单描述了一个MongoDBs集群的工作情况:
 
 
三、 源码阅读顺序及要点
 
了解了MongoDB的集群方式后,我觉得自底向上对MongoDB的源码进行阅读比较好。
 
原因:
 
1. 先了解基础的数据结构,对逻辑算法中出现的数据结构有所了解。
 
2. 算法与运行平台无关,集群等功能与运行平台有关。为了不过早的牵绊与系统功能,理解MongoDB的设计哲学之后对深层次功能的了解更有利。
 
3. 在生产优化中,底部的数据结构或者算法调整可能更容易产生效果。
 
因此,列出如下几点阅读顺序:
 
1. GridFS,BJSON
 
了解基本数据结构。
 
2. 基本搜索功能
 
了解对数据的基本处理,输入输出规则。
 
3. 索引,搜索优化
 
索引的创建和索引是如何提供其强大的辅助搜索功能的。
 
4. 数据备份
 
多台服务器的副本是如何保持同步的。
 
当主服务器宕机程序是如何选择副本服务器的。
 
当主服务器恢复后是以什么策略再次同步数据的。
 
5. 自动分片搜索
 
当创建完分片之后,MongoDB是如何处理多个服务器之间的数据跳转搜索的。
 
CopyRight © 2022 站长资源库 编程知识问答 zzzyk.com All Rights Reserved
部分文章来自网络,