[置顶]如何在Mongodb集合中统计去重之后的数据

来源：动视网责编：小采时间：2020-11-09 16:29:11

[置顶]如何在Mongodb集合中统计去重之后的数据

[置顶]如何在Mongodb集合中统计去重之后的数据:比方说我们有个Mongodb集合，以这个简单的集合为例，我们需要集合中包含多少不同的手机号码，首先想到的应该就是使用distinct关键字， db.tokencaller.distinct('Caller').length 如果想查看具体的而不同的手机号码，那么可以省略后面的length属性，因

推荐度：

点击下载本文 文档为doc格式

导读[置顶]如何在Mongodb集合中统计去重之后的数据:比方说我们有个Mongodb集合，以这个简单的集合为例，我们需要集合中包含多少不同的手机号码，首先想到的应该就是使用distinct关键字， db.tokencaller.distinct('Caller').length 如果想查看具体的而不同的手机号码，那么可以省略后面的length属性，因

比方说我们有个Mongodb集合，以这个简单的集合为例，我们需要集合中包含多少不同的手机号码，首先想到的应该就是使用distinct关键字， db.tokencaller.distinct('Caller').length 如果想查看具体的而不同的手机号码，那么可以省略后面的length属性，因为 db

比方说我们有个Mongodb集合，

以这个简单的集合为例，我们需要集合中包含多少不同的手机号码，首先想到的应该就是使用distinct关键字，
db.tokencaller.distinct('Caller').length
如果想查看具体的而不同的手机号码，那么可以省略后面的length属性，因为db.tokencaller.distinct('Caller')返回的是由所有去重手机号码组成的数组。

但是，这种方式对于所有情况都是满足的嘛？并不如此，如果要统计的集合记录数较大，如千万级别的，那么在这么统计的时候往往会报10044错误，提示信息“exception : distinct too big , 16mb cap”. 后面我们将通过其他方式进行解决。
另外一种方式可以使用runCommand结合distinct进行使用，
db.runCommand({"distinct":"tokencaller","key":"Caller"})