mongodb分片性能差，mongodb分片和副本集

小程序：扫一扫查出行
【扫一扫了解最新限行尾号】
复制小程序

MongoDB分片片键如何选择

（1）使用片键的取值范围指定数据块设置分片的时候，需要从集合里选出一个字段，用该字段的值作为数据拆分的依据，这个字段称为片键（shard key)，文档中的数据按照这个字段排序切分成块，分布到各个片上。

在分片后的数据库操作中，写入必须包含分片键，而查询、更新和删除操作则根据是否包含分片键有不同的路由策略。非增删改查命令也有其特定的处理逻辑，例如listDatabases命令会涉及所有Shard和Config Server的交互。总的来说，MongoDB的分片技术通过精细的路由和数据分布，实现了数据库的横向扩展和性能优化。

块：是位于一个分片中的一段连续的分片键范围，可以理解为若干个块组成分片，分片组成MongoDB的全部数据 (3)拆分与迁移块的拆分：初始化时只有一个块，达到最大块尺寸64MB或100000个文档就会触发块的拆分。把原来的范围一分为二，这样就有了两个块，每个块都有相同数量的文档。

分片(shard)是集群中存储集合数据子集的一台或者多台服务器。在生产环境中一个分片通常是一个副本集(replica set)。片键(key)，MongoDB以其作为依据来确定需要在不同分片服务器之间移动的数据。

相比之下，MongoDB 在可扩展性方面具有显著的优势。它具有两个用于扩展的关键功能：副本集 — 包含相同数据的 MongoDB 服务器备份分片 — 将数据分布在不同的服务器上MongoDB 允许创建分片集群，因此我们的部分数据将在多个服务器上复制。

默认_id索引：MongoDB在创建集合的过程中，在 _id 字段上创建一个唯一的索引，默认名字为 id ，该索引可防止客户端插入两个具有相同值的文档，您不能在_id字段上删除此索引。注意：该索引是唯一索引，因此值不能重复，即 _id 值不能重复的。在分片集群中，通常使用 _id 作为片键。

Mongodb添加数据后在分片数据失去平衡解决方案和原因

在MongoDB很早的版本，0之前，没有journal，加上默认不是安全写，系统一宕机就可能出现数据丢失，因为数据没有刷盘，也没有恢复日志恢复机制。这个问题倒默认启用journal以及安全写之后，没有问题了。选举机制造成的数据丢失。这里主要说这个。简单讲，MongoDB目前的选举机制是有缺陷的。

缺点是随机划分导致数据过于分散，当要查询某个范围内的数据时比如年龄大于20小于25的所有男生信息，如果直接使用范围划分的话，由于其具有良好的数据局部性特点，可能只要访问几个相邻的数据块就行了，但是如果要使用哈希划分的方法很可能要访问所有的数据块。

您好，我来为您解你可以查一下，mongodb的bug，你插入保存以后需要调一下getlasterror()，否则MongoDB就不会在确认数据库写操作完成就返回了，不知道是不是这个原因。

如何正确的使用MongoDB并优化其性能

在MongoDB中我们将与主键没有直接关系的图书单独提取到另一个集合，用存储主键的方式进行关联查询。当我们要查询文章和评论时需要先查询到所需的文章，再从文章中获取评论id，最后用获得的完整的文章及其评论。在这种情况下查询性能显然是不理想的。

在mongo中也提供了一个explain()方法，该方法能够提供大量与查询相关的信息。对于速度比较慢的查询来说，它是最重要的性能分析工具之一。通过查看一个查询的explain()输出信息，可以知道查询使用了哪个索引，以及是如何使用的。

MongoDB核心服务器主要是通过mongod程序启动的，而且在启动时不需对MongoDB使用的内存进行配置，因为其设计哲学是内存管理最好是交给操作系统，缺少内存配置是MongoDB的设计亮点，另外，还可通过mongos路由服务器使用分片功能。

更新频繁的并不是mongodb的优势，建议使用缓存数据库和mongodb搭配使用，更新频繁的数据使用缓存存储，一定时间再同步到mongodb中。

mongodb-分片shard-原理

按照片键取值范围来作为数据块划分的区间依据，优点是按范围查询的时候它的效率很高，当给定一个查询范围，根据mongos中的映射表可以很快的定位到分片上的数据块。

分片是将MongoDB中的数据集分割成多个数据片，每片数据存放在不同的MongoDB实例中，可以理解为将一个MongoDB数据集拆分成多个小型数据集，而小数据集分布在相同或者不同的物理机器上，分割只是从物理层面进行分割，逻辑上仍然属于同一个数据集合。

在实际操作中，路由器根据用户查询智能地将请求路由到相应的数据shard节点，然后汇总结果返回给客户端。常见的划分算法有轮询（Round-Robin，如EMC Greenplum）、一致性哈希（Consistent Hashing，如Dynamo）以及基于范围的分区（Range-based Partitioning，MongoDB采用），它们都是实现高效分片的关键手段。

mongodb查询速度慢是什么原因

你查看一下，如果数据文件大于系统内存，查询速度会下降几个数量级，因为mongodb是内存数据库。我以前测试过，1000万数据的时候没有索引情况下查询可能会几秒钟甚至更久。这种情况，你最好给经常查询的项创建索引，有索引以后查询速度会非常非常非常的快。另外一点是数据索引如果大于内存，速度也会下降很多。

因为mongodb使用memory-mapped file，所以mongodb运行时os会不停的把mongodb需要的数据库文件的部分内容读入物理内存里，所以：如果没有合适的index，query的时候os需要把整个mongodb需要的文档全部读进物理内存，数据的大小超过物理内存的时候就会变慢。

回头看mongodb的查询慢、偶发性占用cpu 1600%只是表象，因为mongodb需要往硬盘写数据，这个时候硬盘被mysql占用，导致mongodb线程只能等io，mongodb写硬盘的请求积累，cpu也没释放，故cpu占用率高。

对于速度比较慢的查询来说，它是最重要的性能分析工具之一。通过查看一个查询的explain()输出信息，可以知道查询使用了哪个索引，以及是如何使用的。对于任意查询，都可以在最后添加一个explain()调用（与调用sort()或者limit()一样，不过explain()必须放在最后）。

避免使用冗余数据和重复数据。创建合适的索引，以加速查询速度。配置 MongoDB 的缓存大小，以提高写入性能。使用 wiredTiger 引擎，以提高写入性能。配置 MongoDB 的日志级别，以避免过多的日志记录对性能的影响。配置 MongoDB 的 oplog 副本集，以提高数据的可靠性和一致性。

关于mongodb分片性能差和mongodb分片和副本集的介绍到此就结束了，不知道你从中找到你需要的信息了吗？如果你还想了解更多这方面的信息，记得收藏关注本站。