首页
mongodb
Linux
云原生
常用bat文件
Maven教程
设计模式
Oracle常用知识梳理
更多……
申请加入课程
MongDB简介
MongDB及其附属工具介绍和安装
MongoDB 备份(mongodump)与恢复(mongorestore)
MongoDB基础DML和DDL操作
MongoDB 可视化工具
MongoDB 索引
MongoDB 聚合
MongDB 复制与分片集群
MongoDB 监控
MongoDB 查询分析
MongoDB 概念解析
MongoDB GridFS
MongoDB Java
Redis、Memcache和MongoDB的区别
MongoDB的其它关键知识点
MongoDB k8s单节点部署和备份
MongoDB 的配置mongodb.conf
MongoDB k8s下部署 Replica Set
MongoDB 状态查询
MongoDB 数据库的日志解析
MongoDb 常见错误处理方法收集
MongoDB 一次性能测试和问题解决
MongDB简介
星辰
2017-11-19
0
0
3823
人
0
人评论
0
人举报
[TOC] # MongDB简介 > * `MongoDB` 是一个基于分布式文件存储的数据库。由 `C++` 语言编写。旨在为 `WEB` 应用提供可扩展的高性能数据存储解决方案。 * `MongoDB` 是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。他支持的数据结构非常松散,是类似`json`的`bson`格式,因此可以存储比较复杂的数据类型。`Mongo`最大的特点是他支持的查询语言非常强大,其语法有点类似于面向对象的查询语言,几乎可以实现类似关系数据库单表查询的绝大部分功能,而且还支持对数据建立索引。 * “面向集合”(`Collection-Oriented`),意思是数据被分组存储在数据集中,被称为一个集合(`Collection`)。每个集合在数据库中都有一个唯一的标识名,并且可以包含无限数目的文档。集合的概念类似关系型数据库(`RDBMS`)里的表(`table`),不同的是它不需要定义任何模式(`schema`)。`Nytro MegaRAID`技术中的闪存高速缓存算法,能够快速识别数据库内大数据集中的热数据,提供一致的性能改进。 ## 历史 > MongoDB最初于2007年开发,当时公司正在建立一个类似于窗口天蓝(window azure)的服务平台。“Window azure是由Microsoft创建的云计算平台和基础设施,通过全球网络构建,部署和管理应用程序和服务。”MongoDB由位于纽约的一个名为10gen的组织开发,现在被称为MongoDB Inc.,它最初被开发为PAAS(平台即服务)。 2009年晚些时候,它被作为一个由MongoDB公司维护和支持的开源数据库服务器在市场上引入。MongoDB的第一个真正产品是从2010年3月发布的MongoDB 1.4版本开始的。2014年1月10日发布的最新版本:MongoDB2.4.9。 ## 特点 * 它的特点是高性能、易部署、易使用,存储数据非常方便。主要功能特性有: * 面向集合存储,易存储对象类型的数据。在`MongoDB` 中数据被分组存储在集合中,集合类似`RDBMS` 中的表,一个集合中可以存储无限多的文档。 * 模式自由(`schema-free`)意味着对于存储在mongodb数据库中的文件,我们不需要知道它的任何结构定义。如果需要的话,你完全可以把不同结构的文件存储在同一个数据库里。 * 支持动态查询。 * 支持完全索引,包含内部对象。可以在任意属性上建立索引,包含内部对象。`MongoDB`的索引和`RDBMS` 的索引基本一样,可以在指定属性、内部对象上创建索引以提高查询的速度。除此之外,`MongoDB` 还提供创建基于**地理空间**的索引的能力。 * 支持查询,`MongoDB` 支持丰富的查询操作,`MongoDB` 几乎支持SQL中的大部分查询。 * 支持复制和故障恢复。MongoDB 支持主从复制机制,可以实现数据备份、故障恢复、读扩展等功能。而基于副本集的复制机制提供了自动故障恢复的功能,确保了集群数据不会丢失。 * 使用高效的二进制数据存储,包括大型对象(如视频等)。使用二进制格式存储,可以保存任何类型的数据对象。 * 自动处理碎片,以支持云计算层次的扩展性。MongoDB 支持集群自动切分数据,对数据进行分片可以使集群存储更多的数据,实现更大的负载,也能保证存储的负载均衡。 * 支持`Perl`、`PHP`、`Java`、`C#`、`JavaScript`、`Ruby`、`C` 和`C++`语言的驱动程序,`MongoDB` 提供了当前所有主流开发语言的数据库驱动包,开发人员使用任何一种主流开发语言都可以轻松编程,实现访问`MongoDB` 数据库。 * 文件存储格式为`BSON`(一种`JSON`的扩展)存储在集合中的文档,被存储为键-值对的形式。键用于唯一标识一个文档,为字符串类型,而值则可以是各种复杂的文件类型。我们称这种存储形式为BSON(`Binary Serialized Document Format`)。BSON 是对二进制格式的JSON 的简称,BSON 支持文档和数组的嵌套。 * 可通过网络访问。可以通过网络远程访问`MongoDB` 数据库。 * 强大的聚合工具。`MongoDB `除了提供丰富的查询功能外,还提供强大的聚合工具,如`count`、`group` 等,支持使用`MapReduce` 完成复杂的聚合任务。 ## 数据模型 > 一个MongoDB 实例可以包含一组数据库,一个DataBase 可以包含一组Collection(集合),一个集合可以包含一组Document(文档)。一个Document包含一组field(字段),每一个字段都是一个key/value pair。 key: 必须为字符串类型。 value:可以包含如下类型。 * 基本类型,例如,string,int,float,timestamp,binary 等类型。 * 一个document。 * 数组类型。 ## 主要场景 * 1)网站实时数据处理。它非常适合实时的插入、更新与查询,并具备网站实时数据存储所需的复制及高度伸缩性。 * 2)缓存。由于性能很高,它适合作为信息基础设施的缓存层。在系统重启之后,由它搭建的持久化缓存层可以避免下层的数据源过载。 * 3)高伸缩性的场景。非常适合由数十或数百台服务器组成的数据库,它的路线图中已经包含对`MapReduce`引擎的内置支持。 ## 不适用的场景如下 * 1)要求高度事务性的系统。 * 2)传统的商业智能应用。 * 3)复杂的跨文档(表)级联查询。 ## 部署 > `MongoDB`服务端可运行在`Linux`、`Windows`或`mac os x`平台,支持32位和64位应用,默认端口为27017。推荐运行在64位平台,因为`MongoDB`在32位模式运行时支持的最大文件尺寸为2GB。 ## 概念性知识补充 ### 面向文档的数据库示例 > MongoDB是面向文档的数据库。这是MongoDB的一个主要功能。它提供面向文档的存储。这很简单,可以很容易地编程。 MongoDB将数据存储为文档,因此被称为面向文档的数据库。 ``` FirstName = "Max", Address = "Haikou City", Spouse = [{Name: "Maxsu"}]. FirstName ="Kobe", Address = "LAC" ``` > 有两个不同的文件(用“.”分隔开)。以这种方式存储数据称为面向文档的数据库。 ### 文档 > 文档是 MongoDB 中数据的基本单位,类似于关系数据库中的行(但是比行复杂)。多个键及其关联的值有序地放在一起就构成了文档。不同的编程语言对文档的表示方法不同,在JavaScript 中文档表示为:`{“greeting”:“hello,world”}` 文档中的值不仅可以是双引号中的字符串,也可以是其他的数据类型,例如,整型、布尔型等,也可以是另外一个文档,即文档可以嵌套。文档中的键类型只能是字符串。 ### 集合 > * 集合就是一组文档,类似于关系数据库中的表。集合是无模式的,集合中的文档可以是各式各样的。例如,{“hello,word”:“Mike”}和{“foo”: 3},它们的键不同,值的类型也不同,但是它们可以存放在同一个集合中,也就是不同模式的文档都可以放在同一个集合中。既然集合中可以存放任何类型的文档,那么为什么还需要使用多个集合?这是因为所有文档都放在同一个集合中,无论对于开发者还是管理员,都很难对集合进行管理,而且这种情形下,对集合的查询等操作效率都不高。所以在实际使用中,往往将文档分类存放在不同的集合中,例如,对于网站的日志记录,可以根据日志的级别进行存储,Info级别日志存放在Info 集合中,Debug 级别日志存放在Debug 集合中,这样既方便了管理,也提供了查询性能。但是需要注意的是,这种对文档进行划分来分别存储并不是MongoDB 的强制要求,用户可以灵活选择。 * 可以使用“.”按照命名空间将集合划分为子集合。例如,对于一个博客系统,可能包括blog.user 和blog.article 两个子集合,这样划分只是让组织结构更好一些,blog 集合和blog.user、blog.article 没有任何关系。虽然子集合没有任何特殊的地方,但是使用子集合组织数据结构清晰,这也是MongoDB 推荐的方法。 ### 数据库 > MongoDB 中多个文档组成集合,多个集合组成数据库。一个MongoDB 实例可以承载多个数据库。它们之间可以看作相互独立,每个数据库都有独立的权限控制。在磁盘上,不同的数据库存放在不同的文件中。MongoDB 中存在以下系统数据库。 * Admin 数据库:一个权限数据库,如果创建用户的时候将该用户添加到admin 数据库中,那么该用户就自动继承了所有数据库的权限。 * Local 数据库:这个数据库永远不会被负责,可以用来存储本地单台服务器的任意集合。 * Config 数据库:当MongoDB 使用分片模式时,config 数据库在内部使用,用于保存分片的信息。 ### NoSql数据库 > NoSQL(NoSQL = Not Only SQL ),意即"不仅仅是SQL"。 * NoSQL,指的是非关系型的数据库。NoSQL有时也称作Not Only SQL的缩写,是对不同于传统的关系型数据库的数据库管理系统的统称。 NoSQL用于超大规模数据的存储。(例如谷歌或Facebook每天为他们的用户收集万亿比特的数据)。这些类型的数据存储不需要固定的模式,无需多余操作就可以横向扩展。 #### RDBMS vs NoSQL > **RDBMS** - 高度组织化结构化数据 - 结构化查询语言(SQL) (SQL) - 数据和关系都存储在单独的表中。 - 数据操纵语言,数据定义语言 - 严格的一致性 > **NoSQL ** - 代表着不仅仅是SQL - 没有声明性查询语言 - 没有预定义的模式 -键 - 值对存储,列存储,文档存储,图形数据库 - 最终一致性,而非ACID属性 - 非结构化和不可预知的数据 - CAP定理(CAP theorem)在计算机科学中, CAP定理(CAP theorem), 又被称作 布鲁尔定理(Brewer's theorem), 它指出对于一个分布式计算系统来说,不可能同时满足以下三点: **一致性(Consistency)** (所有节点在同一时间具有相同的数据) **可用性(Availability)** (保证每个请求不管成功或者失败都有响应) **分隔容忍(Partition tolerance)** (系统中任意信息的丢失或失败不会影响系统的继续运作) CAP理论的核心是:一个分布式系统不可能同时很好的满足一致性,可用性和分区容错性这三个需求,最多只能同时较好的满足两个。 因此,根据 CAP 原理将 NoSQL 数据库分成了满足 CA 原则、满足 CP 原则和满足 AP 原则三 大类: CA - 单点集群,满足一致性,可用性的系统,通常在可扩展性上不太强大。 CP - 满足一致性,分区容忍性的系统,通常性能不是特别高。 AP - 满足可用性,分区容忍性的系统,通常可能对一致性要求低一些。 - 高性能,高可用性和可伸缩性 # 说明 > 文章内容来源于百度百科和网上其他资料拼接,作者只是做了一个知识的搬运和组装工作,希望能够把介绍性的知识尽量一次性整理齐全,让读者能够看一篇文章就能大致了解`mongdb`是个什么东西,有什么作用,试用场景,和介绍一些基础性的概念知识。 ## 官网和学习网站 * MongoDB 官网地址:https://www.mongodb.com/ * MongoDB 官方英文文档:https://docs.mongodb.com/manual/ * MongoDB 各平台下载地址:https://www.mongodb.com/download-center#community * MongDB 文档地址:http://www.mongoing.com/docs/mongo.html * 慕课基础视频学习地址:http://www.imooc.com/learn/295
所有评论列表
点我发表评论