MongoDB中各类类型的索引

上篇文章中咱们介绍了MongoDB中索引的简单操做,建立、查看、删除等基本操做,不过上文咱们只介绍了一种类型的索引,本文咱们来看看其余类型的索引。 json

本文是MongoDB系列的第十篇文章,了解前面的文章有助于更好的理解本文:数组


1.Linux上安装MongoDB
2.MongoDB基本操做
3.MongoDB数据类型
4.MongoDB文档更新操做
5.MongoDB文档查询操做(一)
6.MongoDB文档查询操做(二)
7.MongoDB文档查询操做(三)
8.MongoDB查看执行计划
9.初识MongoDB中的索引spa


_id索引

咱们在上文介绍过,咱们往集合中添加文档时,默认状况下MongoDB都会帮助咱们建立一个名为_id的字段,这个字段就是一个索引。默认状况下,通常的集合都会帮咱们建立这个字段做为索引,但也有一些集合不会将_id默认做为索引,好比固定集合,这个咱们后面的文章会详细说到这个问题。3d

复合索引

若是咱们的查询条件有多个的话,咱们能够对这多个查询条件都创建索引,好比咱们能够对文档中的x和y字段都创建索引,以下:code

db.sang_collect.ensureIndex({x:1,y:-1})

此时执行以下查询语句时就会用到这个复合索引:排序

db.sang_collect.find({x:1,y:999})

小伙伴们也能够经过查看查询计划来肯定确实使用到了上文建立好的索引。索引

过时索引

顾名思义,过时索引就是一种会过时的索引,在索引过时以后,索引对应的数据会被删除,建立方式以下:游戏

db.sang_collect.ensureIndex({time:1},{expireAfterSeconds:30})

expireAfterSeconds表示索引的过时时间,单位为秒。time表示索引的字段,time的数据类型必须是ISODate或者ISODate数组,不然的话,当索引过时以后,time的数据就不会被删除。图片

全文索引

全文索引虽然好用,惋惜不支持中文,咱们这里就先作一个简单的了解。 文档

好比,个人数据集以下:

{
    "_id" : ObjectId("59f5a3da1f9e8e181ffc3189"),
    "x" : "Java C# Python PHP"
}
{
    "_id" : ObjectId("59f5a3da1f9e8e181ffc318a"),
    "x" : "Java C#"
}
{
    "_id" : ObjectId("59f5a3da1f9e8e181ffc318b"),
    "x" : "Java Python"
}
{
    "_id" : ObjectId("59f5a3da1f9e8e181ffc318c"),
    "x" : "PHP Python"
}
{
    "_id" : ObjectId("59f5a4541f9e8e181ffc318d"),
    "x" : "C C++"
}

咱们能够给x字段创建一个全文索引,建立方式以下:

db.sang_collect.ensureIndex({x:"text"})

MongoDB会自动对x字段的数据进行分词,而后咱们就能够经过以下语句进行查询:

db.sang_collect.find({$text:{$search:"Java"}})

此时x中包含Java的文档都会被查询出来。若是想查询既包含Java又包含C#的文档,操做以下:

db.sang_collect.find({$text:{$search:"\"Java C#\""}})

用一对双引号将查询条件括起来,若是想查询包含PHP或者Python的文档,操做以下:

db.sang_collect.find({$text:{$search:"PHP Python"}})

若是想查询既有PHP,又有Python,可是又不包括Java的文档,以下:

db.sang_collect.find({$text:{$search:"PHP Python -Java"}})

创建了全文索引以后,咱们也能够查看查询结果的类似度,使用$meta,以下:

db.sang_collect.find({$text:{$search:"PHP Python"}},{score:{$meta:"textScore"}})

此时查询结果中会多出一个score字段,该字段的值越大,表示类似度越高,咱们能够根据score利用sort来对其进行排序,以下:

db.sang_collect.find({$text:{$search:"PHP Python"}},{score:{$meta:"textScore"}}).sort({score:{$meta:"textScore"}})

全文索引目前看起来功能仍是很强大,惋惜暂时不支持中文,不过网上对此也有不少解决方案,小伙伴们能够自行搜索查看。

地理空间索引

地理空间索引类型

地理空间索引能够分为两类:

1.2d索引,能够用来存储和查找平面上的点。
2.2d sphere索引,能够用来存储和查找球面上的点。

2d索引

2d索引通常咱们能够用在游戏地图中。
向集合中插入一条记录点的数据:

db.sang_collect.insert({x:[90,0]})

插入数据的格式为[经度,纬度],取值范围,经度[-180,180],纬度[-90,90]。数据插入成功以后,咱们先经过以下命令建立索引:

db.sang_collect.ensureIndex({x:"2d"})

而后经过$near咱们能够查询某一个点附近的点,以下:

db.sang_collect.find({x:{$near:[90,0]}})

默认状况下返回该点附近100个点,咱们能够经过$maxDistance来设置返回的最远距离:

db.sang_collect.find({x:{$near:[90,0],$maxDistance:99}})

咱们也能够经过$geoWithin查询某个形状内的点,好比查询矩形中的点:

db.sang_collect.find({x:{$geoWithin:{$box:[[0,0],[91,1]]}}})

两个坐标点用来肯定矩形的位置。

查询圆中的点:

db.sang_collect.find({x:{$geoWithin:{$center:[[0,0],90]}}})

参数分别表示圆的圆心和半径。

查询多边形中的点:

db.sang_collect.find({x:{$geoWithin:{$polygon:[[0,0],[100,0],[100,1],[0,1]]}}})

这里能够填入任意多个点,表示多边形中的各个点。

2d sphere索引

2dsphere适用于球面类型的地图,它的数据类型是GeoJSON格式的,咱们能够在http://geojson.org/地址上查看...,好比咱们描述一个点,GeoJSON以下:

{
    "_id" : ObjectId("59f5e0571f9e8e181ffc3196"),
    "name" : "shenzhen",
    "location" : {
        "type" : "Point",
        "coordinates" : [ 
            90.0, 
            0.0
        ]
    }
}

描述线,GeoJSON格式以下:

{
    "_id" : ObjectId("59f5e0d01f9e8e181ffc3199"),
    "name" : "shenzhen",
    "location" : {
        "type" : "LineString",
        "coordinates" : [ 
            [ 
                90.0, 
                0.0
            ], 
            [ 
                90.0, 
                1.0
            ], 
            [ 
                90.0, 
                2.0
            ]
        ]
    }
}

描述多边形,GeoJSON格式以下:

{
    "_id" : ObjectId("59f5e3f91f9e8e181ffc31d0"),
    "name" : "beijing",
    "location" : {
        "type" : "Polygon",
        "coordinates" : [ 
            [ 
                [ 
                    0.0, 
                    1.0
                ], 
                [ 
                    0.0, 
                    2.0
                ], 
                [ 
                    1.0, 
                    2.0
                ], 
                [ 
                    0.0, 
                    1.0
                ]
            ]
        ]
    }
}

还有其余的类型,具体小伙伴们能够参考http://geojson.org/。有了数据以后,咱们能够经过以下操做来建立地理空间索引了:

db.sang_collect.ensureIndex({location:"2dsphere"})

好比我想查询和深圳这个区域有交集的文档,以下:

var shenzhen = db.sang_collect.findOne({name:"shenzhen"})
db.sang_collect.find({location:{$geoIntersects:{$geometry:shenzhen.location}}})

这里的查询结果是和深圳这个区域有交集的都会查到(好比通过深圳的高速公路、铁路等),咱们也能够只查询深圳市内的区域(好比深圳市内全部的学校),以下:

var shenzhen = db.sang_collect.findOne({name:"shenzhen"})
db.sang_collect.find({location:{$within:{$geometry:shenzhen.location}}})

也能够查询腾讯附近的其余位置,以下:

var QQ = db.sang_collect.findOne({name:"QQ"})
db.sang_collect.find({location:{$near:{$geometry:QQ.location}}})

复合地理空间索引

位置每每只是咱们查询的一个条件,好比我要查询深圳市内全部的学校,那我得再增长一个查询条件,以下:

var shenzhen = db.sang_collect.findOne({name:"shenzhen"})
db.sang_collect.find({location:{$within:{$geometry:shenzhen.location}},name:"QQ"})

其余的查询条件跟在后面就好了。

好了,MongoDB中的索引问题咱们就说到这里,小伙伴们有问题欢迎留言讨论。

参考资料:

1.《MongoDB权威指南第2版》

更多资料请关注公众号:

图片描述