我有一个solr云(5.2.1),5个碎片,2个节点。
在这个集群中,我有163.463.543项。 我索引了200.000多项目,现在群集的两个节点之间的版本/ sizeInBytes不再一致。
shard1 | sizeInBytes | segmentCount | version | -------------------------------------------------- replica1 | 71325055021 | 14 | 11877844 | replica2 | 71330161457 | 8 | 11877874 | shard2 | sizeInBytes | segmentCount | version | -------------------------------------------------- replica2 | 71658372259 | 9 | 11965329 | replica1 | 71660446852 | 17 | 11965305 | shard3 | sizeInBytes | segmentCount | version | -------------------------------------------------- replica1 | 72328398189 | 24 | 11978919 | replica2 | 72329934372 | 20 | 11978971 | shard4 | sizeInBytes | segmentCount | version | -------------------------------------------------- replica1 | 71398290694 | 10 | 11882893 | replica2 | 71398972036 | 16 | 11883065 | shard5 | sizeInBytes | segmentCount | version | -------------------------------------------------- replica2 | 71635961292 | 16 | 11920521 | replica1 | 71636668652 | 9 | 11920667 |
当我在网页gui云状态页面看起来一切似乎都很好。 任何想法发生了什么事情/如何解决它?
我在这个问题上做了大量的研究,唯一可以find的是Solr邮件列表中的邮件: 链接
SolrCloud的工作原理与旧的主从复制完全不同。 索引不会从领导者复制到其他副本,除非在极端的恢复情况下。
每个副本独立于其他构build自己的索引副本。 由于索引操作中存在细微的时间差异,并且节点重新启动时与事务日志重放相关的可能操作,每个副本可能会以不同的索引布局结束。 被删除文件的数量也可能有所不同。 除非出现真正的错误,否则所有副本应包含相同的实时文档。
谢谢,肖恩
我也以我自己的经验看到了同样的事情。 我刚刚创build了10个新的Solr集合,其中包含两个副本,每个集合载入了数十万个文档,并且版本不再匹配。 看来版本是从SolrCloud日子之前的搁置,并且不需要匹配。