面向文档的数据库引擎MongoDB在3月16日发布了1.8版本。关键的变更包括新增Journaling日志、提升分片性能以及Shell的Tab补全。
Journaling日志通过预写式的Redo日志为MongoDB增加了额外的可靠性。开启该功能时,变更会先写入Journaling日志, 定期集中提交(目前是每100ms提交一次),然后在真实数据上进行这些变更。如果服务器安全关闭,日志会被清除。在服务器启动时,如果存在 Journaling日志,则会进行回放。这保证了那些已写入,但在服务器崩溃前还没有回放的日志能在用户连接前被执行。两次提交之间那 100ms的时间窗口在未来的版本中有望被缩小。
MongoDB是一种 NoSQL数据库,不同于SQL Server这样的关系型数据库,MongoDB中数据的基本单位是文档。类似于JavaScript对象,文档中包含一系列带有类型的键值对,这些类型可以是字符串、对象、数组、正则表达式和代码。这些文档以BSON格式存 储,根据文档类型被分组到集合(类似于SQL Server里的表)中。Schema的设计取决于哪些文档应该有自己的集合,哪些应该被嵌入到其他集合中去。嵌入的文档就像类里的成员对象。在关系 型系统中,你会用一张表来存储订单,另一张外键的表来存储订单项。在MongoDB中,针对同样的场景,推荐的做法是用一个集合来保存订单,每个订单中 保存一个订单项的数组,嵌入其中。
水平扩展是通过自动分片来 做的,它允许有序的集合数据分布。每个分片都是一组配置成Replica集的机器,这意味着分片里的每台机器都拥有分片数据的完整拷贝。分片 中会自动进行故障转移。MongoDB会自动将查询引导到合适的分片上,因此应用程序并不需要了解哪个分片持有什么数据元素。新的Replica集身份 认证功能允许Replica集的成员之间进行自动身份认证,其中使用了密钥文件和 –keyfile 选项。
Covered索引和Sparse索引也是该版本中新增加的特性。Covered索引允许在索引本身里存储数据,而Sparse索引则会排除掉不包含索引字段的文档。Covered索引在查询所请求的全部字段都包含在Covered索引中时能提升性能,因为不再需要取出完整的文档记录。Sparse索引在所检索的字段并非经常出现在集合中时能提升性能。目前,Sparse索引只能有一个字段。
在MongoDB的工具集中也有一些变化。mongostat 增加了discover模式(–discover),它会自动从集群的节点中取回统计信息。通过mongodump –oplog 和mongorestore –oplogReplay提供了高级事务日志转储和恢复功能。
欲更多地了解该版本中的新特性,请查看MongoDB 1.8 Webinar。
查看英文原文:MongoDB 1.8 Improves Reliability with Journaling