数据库之MongoDB使用方法/教程

官网是:https://www.mongodb.com/

一个在特殊场景下使用非常合适的数据库,当然比起老牌的mysql还是有点嫩的;

MongoDB 是一个基于分布式文件存储的数据库。由 C++ 语言编写。旨在为 WEB 应用提供可扩展的高性能数据存储解决方案。

MongoDB 是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。

它的特点是高性能、易部署、易使用,存储数据非常方便。主要功能特性有:

  • *面向集合存储,易存储对象类型的数据。
  • mongodb集群参考
  • *模式自由。
  • *支持动态查询
  • *支持完全索引,包含内部对象。
  • *支持查询。
  • *支持复制和故障恢复。
  • *使用高效的二进制数据存储,包括大型对象(如视频等)。
  • *自动处理碎片,以支持云计算层次的扩展性。
  • *支持RUBYPYTHONJAVAC++PHPC#等多种语言。
  • *文件存储格式为BSON(一种JSON的扩展)。
  • *可通过网络访问。

~~~~~

1. 什么是MongoDB #

  • MongoDB是一个基于分布式文件存储的开源数据库系统
  • MongoDB 将数据存储为一个文档,数据结构由键值(key=>value)对组成。MongoDB 文档类似于 JSON 对象。字段值可以包含其他文档,数组及文档数组。

下载

      上MongoDB官网 ,我们发现有32bit和64bit,这个就要看你系统了,不过这里有两点注意:

          ①:根据业界规则,偶数为“稳定版”(如:1.6.X,1.8.X),奇数为“开发版”(如:1.7.X,1.9.X),这两个版本的区别相信大家都知道吧。

          ②:32bit的mongodb最大只能存放2G的数据,64bit就没有限制。

     我这里就下载”2.0.2版本,32bit“,ok,下载之后我就放到”E盘“,改下文件夹名字为”mongodb“。

2. MongoDB安装 #

2.1 windows安装 #

Windows官方安装指南

2.2 mac安装 #

Mac官方安装指南

  1. 先安装homebrew

    http://brew.sh/
    
  2. 使用brew安装mongodb

    brew install mongodb
    
  3. 再安装可视化工具
    Robomongo

3. mongodb启动与连接 #

3.1 windows启动服务器端 #

  1. 找到mongodb安装目录,一般是 C:\Program Files\MongoDB 2.6 Standard\bin
  2. 按下Shift+鼠标右键,选择在此处打开命令窗口
  3. 在除C盘外的盘符新建一个空目录,如 D:\Mongodb\data
  4. 在命令行中输入mongod --dbpath=刚创建的空目录,如
    mongod --dbpath=D:\Mongodb\data
    
  5. 再按回车键

  6. 如果出现waiting for connections on port 27017就表示启动成功,已经在27017端口上监听了客户端的请求

  7. 注意:--dbpath后的值表示数据库文件的存储路径,而且后面的路径必须事先创建好,必须已经存在,否则服务开启失败

  8. 注意:这个命令窗体绝对不能关,关闭这个窗口就相当于停止了mongodb服务

3.2 启动客户端连接服务器 #

  1. 找到mongodb安装目录,一般是 C:\Program Files\MongoDB 2.6 Standard\bin
  2. 按下Shift+鼠标右键,选择在此处打开命令窗口

  3. 命令窗体中输入 mongo –host=127.0.0.1 或者 mongo 按回车键

    备注:–host后的值表示服务器的ip地址
    备注: –host=127.0.0.1 表示的就是本地服务器,每次数据库都会默认连接test数据库


4. MongoDB基本概念 #

  • 数据库 MongoDB的单个实例可以容纳多个独立的数据库,比如一个学生管理系统就可以对应一个数据库实例
  • 集合 数据库是由集合组成的,一个集合用来表示一个实体,如学生集合
  • 文档 集合是由文档组成的,一个文档表示一条记录,比如一位同学张三就是一个文档


5. 数据库操作 #

5.1 使用数据库 #

语法

use database_name      database_name代表数据库的名字

注:如果此数据库存在,则切换到此数据库下,如果此数据库还不存在也可以切过来

实例
切换到 person数据库下

5.2 查看所有数据库 #

语法

show dbs

备注: 我们刚创建的数据库person 如果不在列表内, 要显示它,我们需要向 person 数据库插入一些数据 db.person.insert({name:”zhangSan”,age:30})

5.3 查看当前使用的数据库 #

语法

db 或 db.getName()

注:db代表的是当前数据库 也就是person这个数据库

实例

5.4 删除数据库 #

语法

db.dropDatabase()

实例

6. 集合操作 #

6.1 查看帮助 #

语法

db.worker.help()

实例

6.2 查看数据库下的集合 #

语法

show collections

实例

6.3 创建集合 #

创建一个空集合

db.createCollection(collection_Name)      collection_Name集合的名称

创建集合并插入一个文档

  • collection_Name集合的名称
  • document要插入的文档
db.collection_Name.insert(document)

7. 插入文档 #

7.1 insert #

语法

 db.collection_name.insert(document)
 `

参数

  • collection_name 集合的名字
  • document 插入的文档

实例

每当插入一条新文档的时候mongodb会自动为此文档生成一个_id属性,_id一定是唯一的,用来唯一标识一个文档
_id也可以直接指定,但如果数据库中此集合下已经有此_id的话插入会失败

7.2 save #

语法

db.collection_name.save(document)

参数

  • collection_name 集合的名字
  • document 插入的文档

注:如果不指定 _id 字段 save() 方法类似于 insert() 方法。如果指定 _id 字段,则会更新该 _id 的数据。

实例

db.person.save({name:"xiaoHong",age:50})

db.person.save({_id:ObjectId("562c9caf671c978b6596e825"),name:"xiaoHong",age:10})

8. 更新文档 #

语法

db.collection.update(
   <query>,
   <updateObj>,
   {
     upsert: <boolean>,
     multi: <boolean>
   }
)

参数说明

  • query 查询条件,指定要更新符合哪些条件的文档
  • update 更新后的对象或指定一些更新的操作符
    • $set直接指定更新后的值
    • $inc在原基础上累加
  • upsert 可选,这个参数的意思是,如果不存在符合条件的记录时是否插入updateObj. 默认是false,不插入。
  • multi 可选,mongodb 默认只更新找到的第一条记录,如果这个参数为true,就更新所有符合条件的记录。

实例
将document数据中name是liSi 的数据的name修改为liSi_update

db.worker.update({name:'liSi'},{$set:{name:'liSi_update'}})

注:如果有多条name是liSi的数据只更新一条,如果想全部更新需要指定{multi:true}的参数

9. 文档的删除 #

remove方法是用来移除集合中的数据

语法

db.collection.remove(
   <query>,
   {
     justOne: <boolean>
   }
)

参数说明

  • query :(可选)删除的文档的条件。
  • justOne : (可选)如果设为 true 或 1,则只删除匹配到的多个文档中的第一个

实例
删除worker集合里name是fJianZhou的所有Document数据

db.worker.remove({name:'fJianZhou'})


删除person集合里name是xiaoHong的第一条数据

db.person.remove({name:"xiaoHong"},1)

10. 查询文档 #

10.1 find #

语法

db.collection_name.find()

参数

  • collection_name 集合的名字

实例
查询worker下所有的文档

db.worker.find()

10.2 查询指定列 #

语法

db.collection_name.find({queryWhere},{key:1,key:1})

参数列表

  • collection_name 集合的名字
  • queryWhere 参阅查询条件操作符
  • key 指定要返回的列
  • 1 表示要显示

实例

db.worker.find({},{age:1}) 查询指定列

10.3 findOne #

查询匹配结果的第一条数据
语法

db.collection_name.findOne()

实例

db.worker.findOne()

11. 条件操作符 #

条件操作符用于比较两个表达式并从mongoDB集合中获取数据

11.1 大于操作符 #

语法

db.collectoin_name.find({<key>:{$gt:<value>}})

参数

  • collectoin_name 集合名称
  • key 字段
  • value 值

实例

db.worker.find({age:{$gt:30}}) 查询age 大于 30的数据

11.2 大于等于操作符 #

语法

db.collectoin_name.find({<key>:{$gte:<value>}})

参数

  • collectoin_name 集合名称
  • key 字段
  • value 值

实例

db.worker.find({age: {$gte: 30}}) 查询age 3大于等于30 的数据

11.3 小于操作符 #

语法

db.collectoin_name.find( {<key>:{$lt:<value>}})

参数

  • collectoin_name集合名称
  • key 字段
  • value 值

实例

db.worker.find({age: {$lt: 30}}) 查询age 小于30的数据

11.4 小于等于操作符 #

语法

db.collectoin_name.find({<key>:{$lte:<value>}})

参数

  • collectoin_name集合名词
  • key字段
  • value值

实例

db.worker.find({age: {$lte: 30}}) 查询age 小于等于30的数据

11.5 同时使用 $gte和$lte #

语法

db.collectoin_name.find({<key>:{$gte:<value>},<key>:{$lte:<value>}})

参数

  • collectoin_name 集合名称
  • key 字段
  • value 值

实例
查询age 大于等于 30 并且 age 小于等于 50 的数据

db.worker.find({age: {$gte: 30, $lte: 50}})

11.6 等于 #

语法

db.collectoin_name.find({<key>:<value>,<key>:<value>})

参数

  • collectoin_name集合名词
  • key字段
  • value值

实例
查询age = 30的数据

db.worker.find({"age": 30})`

11.7 使用 _id进行查询 #

语法

db.collectoin_name.find({"_id" : ObjectId("value")})

参数

  • value _id的值

实例
查询_id是 562af23062d5a57609133974 数据

db.worker.find({"_id" : ObjectId("562af23062d5a57609133974")})

11.8 查询结果集的条数 #

语法

db.collectoin_name.find().count()

参数

  • collectoin_name 集合名称

实例

db.worker.find().count()

11.9 正则匹配 #

语法

db.collection.find({key:/value/})

参数

  • collectoin_name 集合名称
  • key 字段
  • value 值

实例
查询name里包含zhang的数据

db.worker.find({name:/value/})

查询某个字段的值当中是否以另一个值开头

db.worker.find({name:/^zhang/})

12. 与和或 #

12.1 and #

find方法可以传入多个键(key),每个键(key)以逗号隔开

语法

db.collection_name.find({key1:value1, key2:value2})

实例
查询name是zhangRenYang并且age是30的数据

db.worker.find({name:'zhangRenYang',age:30})

12.2 or #

语法

db.collection_name.find(
   {
      $or: [
         {key1: value1}, {key2:value2}
      ]
   }
)

实例
查询age = 30 或者 age = 50 的数据

db.worker.find({$or:[{age = 30},{age = 50}]})

12.3 and和or联用 #

语法

db.collection_name.find(
   {
     key1:value1,
     key2:value2,
     $or: [
         {key1: value1},
         {key2:value2}
     ]
   }
)

实例
查询 name是zhangRenYang 并且 age是30 或者 age是 50 的数据

db.worker.find({name:'zhangRenYang',$or:[{age:30},{age:50}]})

13. 分页查询 #

13.1 limit #

读取指定数量的数据记录
语法

db.collectoin_name.find().limit(number)

参数

  • collectoin_name集合
  • number读取的条数

实例
查询前3条数据

db.worker.find().limit(3)

13.2 skip #

跳过指定数量的数据,skip方法同样接受一个数字参数作为跳过的记录条数
语法

db.collectoin_name.find().skip(number)

参数

  • collectoin_name集合
  • number跳过的条数

实例
查询3条以后的数据

db.worker.find().skip(3)

13.3 skip+limit #

通常用这种方式来实现分页功能
语法

db.collectoin_name.find().skip(skipNum).limit(limitNum)

参数

  • collectoin_name 集合名称
  • skipNum 跳过的条数
  • limitNum 限制返回的条数

实例
查询在4-6之间的数据

db.worker.find().sort({age:-1})

13.4 sort排序 #

sort()方法可以通过参数指定排序的字段,并使用 1 和 -1 来指定排序的方式,其中 1 为升序排列,而-1是用于降序排列。
语法

db.collectoin_name.find().sort({key:1})
db.collectoin_name.find().sort({key:-1})

参数

  • collectoin_name集合
  • key表示字段

实例
查询出并升序排序 {age:1} age表示按那个字段排序 1表示升序

db.worker.find().sort({age:1})

使用原理

所谓“面向集合”(Collection-Oriented),意思是数据被分组存储在数据集中,被称为一个集合(Collection)。每个集合在数据库中都有一个唯一的标识名,并且可以包含无限数目的文档。集合的概念类似关系型数据库(RDBMS)里的表(table),不同的是它不需要定义任何模式(schema)。Nytro MegaRAID技术中的闪存高速缓存算法,能够快速识别数据库内大数据集中的热数据,提供一致的性能改进。

模式自由(schema-free),意味着对于存储在mongodb数据库中的文件,我们不需要知道它的任何结构定义。如果需要的话,你完全可以把不同结构的文件存储在同一个数据库里。

存储在集合中的文档,被存储为键-值对的形式。键用于唯一标识一个文档,为字符串类型,而值则可以是各种复杂的文件类型。我们称这种存储形式为BSON(Binary Serialized Document Format)。

MongoDB已经在多个站点部署,其主要场景如下:

1)网站实时数据处理。它非常适合实时的插入、更新与查询,并具备网站实时数据存储所需的复制及高度伸缩性。

2)缓存。由于性能很高,它适合作为信息基础设施的缓存层。在系统重启之后,由它搭建的持久化缓存层可以避免下层的数据源过载。

3)高伸缩性的场景。非常适合由数十或数百台服务器组成的数据库,它的路线图中已经包含对MapReduce引擎的内置支持。

不适用的场景如下:1)要求高度事务性的系统。

2)传统的商业智能应用。

3)复杂的跨文档(表)级联查询。

延伸:mongoDB和mysql的对比

与关系型数据库相比,MongoDB的优点:

①弱一致性(最终一致),更能保证用户的访问速度:

举例来说,在传统的关系型数据库中,一个COUNT类型的操作会锁定数据集,这样可以保证得到“当前”情况下的精确值。这在某些情况下,例 如通过ATM查看账户信息的时候很重要,但对于Wordnik来说,数据是不断更新和增长的,这种“精确”的保证几乎没有任何意义,反而会产生很大的延 迟。他们需要的是一个“大约”的数字以及更快的处理速度。

但某些情况下MongoDB会锁住数据库。如果此时正有数百个请求,则它们会堆积起来,造成许多问题。我们使用了下面的优化方式来避免锁定:
每次更新前,我们会先查询记录。查询操作会将对象放入内存,于是更新则会尽可能的迅速。在主/从部署方案中,从节点可以使用“-pretouch”参数运行,这也可以得到相同的效果。
使用多个mongod进程。我们根据访问模式将数据库拆分成多个进程。

②文档结构的存储方式,能够更便捷的获取数据。

对于一个层级式的数据结构来说,如果要将这样的数据使用扁平式的,表状的结构来保存数据,这无论是在查询还是获取数据时都十分困难。
举例1:
就拿一个“字典项”来说,虽然并不十分复杂,但还是会关系到“定义”、“词性”、“发音”或是“引用”等内容。大部分工程师会将这种模型使用关系型数据库 中的主键和外键表现出来,但把它看作一个“文档”而不是“一系列有关系的表”岂不更好?使用 “dictionary.definition.partOfSpeech=’noun’”来查询也比表之间一系列复杂(往往代价也很高)的连接查询方便 且快速。

举例2:在一个关系型数据库中,一篇博客(包含文章内容、评论、评论的投票)会被打散在多张数据表中。在MongoDB中,能用一个文档来表示一篇博客, 评论与投票作为文档数组,放在正文主文档中。这样数据更易于管理,消除了传统关系型数据库中影响性能和水平扩展性的“JOIN”操作。

CODE↓
> db.blogposts.save({ title : “My First Post”, author: {name : “Jane”, id :1},
comments : [{ by: “Abe”, text: “First” },
{ by : “Ada”, text : “Good post” }]
})

> db.blogposts.find( { “author.name” : “Jane” } )

> db.blogposts.findOne({ title : “My First Post”, “author.name”: “Jane”,
comments : [{ by: “Abe”, text: “First” },
{ by : “Ada”, text : “Good post” } ]
})
> db.blogposts.find( { “comments.by” : “Ada” } )

> db.blogposts.ensureIndex( { “comments.by” : 1 } );

举例③:

MongoDB是一个面向文档的数据库,目前由10gen开发并维护,它的功能丰富,齐全,完全可以替代MySQL。在使用MongoDB做产品原型的过程中,我们总结了MonogDB的一些亮点:
使用JSON风格语法,易于掌握和理解:MongoDB使用JSON的变种BSON作为内部存储的格式和语法。针对MongoDB的操作都使用JSON风格语法,客户端提交或接收的数据都使用JSON形式来展现。相对于SQL来说,更加直观,容易理解和掌握。
Schema-less,支持嵌入子文档:MongoDB是一个Schema-free的文档数据库。一个数据库可以有多个Collection,每 个Collection是Documents的集合。Collection和Document和传统数据库的Table和Row并不对等。无需事先定义 Collection,随时可以创建。
Collection中可以包含具有不同schema的文档记录。 这意味着,你上一条记录中的文档有3个属性,而下一条记录的文档可以有10个属 性,属性的类型既可以是基本的数据类型(如数字、字符串、日期等),也可以是数组或者散列,甚至还可以是一个子文档(embed document)。这 样,可以实现逆规范化(denormalizing)的数据模型,提高查询的速度。

③内置GridFS,支持大容量的存储。

GridFS是一个出色的分布式文件系统,可以支持海量的数据存储。
内置了GridFS了MongoDB,能够满足对大数据集的快速范围查询。

④内置Sharding。

提供基于Range的Auto Sharding机制:一个collection可按照记录的范围,分成若干个段,切分到不同的Shard上。
Shards可以和复制结合,配合Replica sets能够实现Sharding+fail-over,不同的Shard之间可以负载均衡。查询是对 客户端是透明的。客户端执行查询,统计,MapReduce等操作,这些会被MongoDB自动路由到后端的数据节点。这让我们关注于自己的业务,适当的 时候可以无痛的升级。MongoDB的Sharding设计能力最大可支持约20 petabytes,足以支撑一般应用。
这可以保证MongoDB运行在便宜的PC服务器集群上。PC集群扩充起来非常方便并且成本很低,避免了“sharding”操作的复杂性和成本。

⑤第三方支持丰富。(这是与其他的NoSQL相比,MongoDB也具有的优势)

现在网络上的很多NoSQL开源数据库完全属于社区型的,没有官方支持,给使用者带来了很大的风险。
而开源文档数据库MongoDB背后有商业公司10gen为其提供供商业培训和支持。
而且MongoDB社区非常活跃,很多开发框架都迅速提供了对MongDB的支持。不少知名大公司和网站也在生产环境中使用MongoDB,越来越多的创新型企业转而使用MongoDB作为和Django,RoR来搭配的技术方案。

⑥性能优越:
在使用场合下,千万级别的文档对象,近10G的数据,对有索引的ID的查询不会比mysql慢,而对非索引字段的查询,则是全面胜出。 mysql实际无法胜任大数据量下任意字段的查询,而mongodb的查询性能实在让我惊讶。写入性能同样很令人满意,同样写入百万级别的数 据,mongodb比我以前试用过的couchdb要快得多,基本10分钟以下可以解决。补上一句,观察过程中mongodb都远算不上是CPU杀手。

与关系型数据库相比,MongoDB的缺点:

①mongodb不支持事务操作。

所以事务要求严格的系统(如果银行系统)肯定不能用它。(这点和优点①是对应的)

②mongodb占用空间过大。

关于其原因,在官方的FAQ中,提到有如下几个方面:

  • 1、空间的预分配:为避免形成过多的硬盘碎片,mongodb每次空间不足时都会申请生成一大块的硬盘空间,而且申请的量从64M、128M、256M那 样的指数递增,直到2G为单个文件的最大体积。随着数据量的增加,你可以在其数据目录里看到这些整块生成容量不断递增的文件。
  • 2、字段名所占用的空间:为了保持每个记录内的结构信息用于查询,mongodb需要把每个字段的key-value都以BSON的形式存储,如果 value域相对于key域并不大,比如存放数值型的数据,则数据的overhead是最大的。一种减少空间占用的方法是把字段名尽量取短一些,这样占用 空间就小了,但这就要求在易读性与空间占用上作为权衡了。我曾建议作者把字段名作个index,每个字段名用一个字节表示,这样就不用担心字段名取多长 了。但作者的担忧也不无道理,这种索引方式需要每次查询得到结果后把索引值跟原值作一个替换,再发送到客户端,这个替换也是挺耗费时间的。现在的实现算是 拿空间来换取时间吧。
  • 3、删除记录不释放空间:这很容易理解,为避免记录删除后的数据的大规模挪动,原记录空间不删除,只标记“已删除”即可,以后还可以重复利用。
  • 4、可以定期运行db.repairDatabase()来整理记录,但这个过程会比较缓慢

③MongoDB没有如MySQL那样成熟的维护工具,这对于开发和IT运营都是个值得注意的地方。

~~~

未经允许不得转载:WEB前端开发 » 数据库之MongoDB使用方法/教程

赞 (0)