MongoDB基本概念和原理

MongoDB是一个基于分布式文件存储的数据库。由C++语言编写。旨在为WEB应用提供可扩展
的高性能数据存储解决方案。
MongoDB是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰
富,最像关系数据库的。它支持的数据结构非常松散,是类似json的bson格式,因此可以
存储比较复杂的数据类型。
Mongo最大的特点是它支持的查询语言非常强大,其语法有点类似于面向对象的查询语言,
几乎可以实现类似关系数据库单表查询的绝大部分功能,而且还支持对数据建立索引。

MongoDB主要场景如下:
1)网站实时数据处理。非常适合实时的插入、更新与查询,并具备网站实时数据存储所需的复制及高度伸缩性。
2)缓存。由于性能很高,它适合作为信息基础设施的缓存层。在系统重启之后,由它搭建的持久化缓存层可以避免下层的数据源过载。
3)高伸缩性的场景。非常适合由数十或数百台服务器组成的数据库,它的路线图中已经包含对MapReduce引擎的内置支持。

不适用的场景如下:
1)要求高度事务性的系统。
2)传统的商业智能应用。
3)复杂的跨文档(表)级联查询。

[hide reply_to_this=”true”]

[info]

NoSQL概述

  1. NoSQL,指的是非关系型的数据库。NoSQL 有时也称作Not Only SQL 的缩写,
  2. 是对不同于传统的关系型数据库的数据库管理系统的统称。NoSQL 用于超大规模数据的存储

关系数据库对比非关系数据库

关系型数据库                                                NoSQL 数据库
高度组织化结构化数据                                代表着不仅仅是SQL
结构化查询语言(SQL)                            没有声明性查询语言
数据和关系都存储在单独的表中               没有预定义的模式
数据操作语言,数据定义语言                   键-值对存储,列存储,文档存储,图形数据库
严格的一致性                                                最终一致性,而非ACID 属性
基础事务                                                        非结构化和不可预知的数据
.                                                                         CAP 定理
.                                                                         高性能,高可用性和可伸缩性

 

NoSQL数据库分类

列存储:Hbase/Cassandra

文档存储:MongoDB/CounchDB

key-value存储:Redis/Memcache

图存储:Neo4j/FlockDB

对象存储:Db4o

XML数据库:BaseX

 

CAP原则
CAP 定理(CAP theorem), 又被称作布鲁尔定理(Brewer’s theorem), 它指出对于一个分布式计算系统来说,不可能同时满足以下三点:

  1. 一致性(Consistency) (所有节点在同一时间具有相同的数据)
  2. 可用性(Availability) (保证每个请求不管成功或者失败都有响应)
  3. 分区容错性(Partition tolerance) (系统中任意信息的丢失或失败不影响系统的继续运行)

CAP 理论的核心是:

一个分布式系统不可能同时很好的满足一致性,可用性和分区容错性这三个需求,最多只能同时较好的满足两个

根据CAP 原理将NoSQL 数据库分成了满足CA 原则、满足CP 原则和满足AP 原则三大类:

  1. CA – 单点集群,满足一致性,可用性的系统,通常在可扩展性上不太强大。
  2. CP – 满足一致性,分区容错性的系统,通常性能不是特别高。
  3. AP – 满足可用性,分区容错性的系统,通常可能对一致性要求低一些。

[/info]

[/hide]

[infobox title=”MongoDB体系结构“]

关系数据库 MongoDB 解释对比
Database Database 数据库/数据库
Table Collection 数据库表/集合
Row Document 数据库记录行/文档
Column Field 数据列/数据字段
Index Index 索引/索引
Table join 表关联/MongoDB不支持
Primary key Object ID 主键/MongoDB自动将_id设为主键

[/infobox]

[infobox title=”MongoDB数据类型“]

BSON( Binary Serialized Document Format) 是一种二进制形式的存储格式,
采用了类似于 C 语言结构体的名称、对表示方法,支持内嵌的文档对象和数组对象,具有轻量性、可遍历性、高效性的特点

[/infobox]

[infobox title=”MongoDB底层原理“]

Mongos是Sharded cluster的访问入口,强烈建议所有的管理操作、读写操作都通过mongos来完成,以保证cluster多个组件处于一致的状态。

Mongos本身并不持久化数据,Sharded cluster所有的元数据都会存储到Config Server,而用户的数据则会分散存储到各个shard。Mongos启动后,

会从config server加载元数据,开始提供服务,将用户的请求正确路由到对应的Shard。

 

 

MongoDB 的集群部署方案中有三类角色:

实际数据存储结点、配置文件存储结点和路由接入结点。

MongDB客户端访问过程:

连接的客户端直接与路由结点相连,从配置结点上查询数据,根据查询结果到实际的存储结点上查询和存储数据。

MongoDB 的部署方案:

单机部署、复本集(主备)部署、分片部署、复本集与分片混合部署。

Sharding分片技术(混合模式)高可用方案的大体架构图:

Sharding分片技术(混合模式)高可用方案架构下向mongodb写数据的流程图:

Sharding分片技术(混合模式)高可用方案架构下向mongodb读数据的流程图:

[/infobox]


已发布

分类

作者:

标签

评论

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注