Django+MongoDB
bala bala NoSQL & MongoDB
目前NoSQL还没有一个标准的定义,最常见的解释是"non-relational",也有很多人解释为“Not Only SQL”。NoSQL通常意味着非关系型、分布式的数据存储,具备大数据量下的高性能,横向扩展能力,以及灵活的数据模型。也许,还意味着开源。
MongoDB是一种以文档形式存储的NoSQL。其主要的特性:
API: BSON
Protocol: lots of langs
Query Method: dynamic object-based language & MapReduce
Replication: Master Slave & Auto-Sharding
Written in: C++
Concurrency: Update in Place
Misc: Indexing, GridFS Links
Django对NoSQL的支持
是的,Django将原生支持NoSQL,但是不是现在。
你可能听说过django-nonrel 。即Django none relationship,非关系型的Django。django-nonrel提供了一层adapter,配合特定的backend,可以连接各种NoSQL。比如连接MongoDB的django-mongodb-engine。但是,django-nonrel 的实现是在内存中模拟SQL数据库操作,这种思路没有得到Django核心的支持,所以只能是一个外部版本。
query-refactor是GSoC(Google Summer of Code)的Django项目之一,已经进入Django的官方分支。query-refactor的作者Alex早已公布了query-refactor的“最终状态”。但是,由于该分支的完成时间与Django1.3的发布时间过于接近,所以没有赶上,在Django1.4的新特性清单docs.djangoproject.com—1.4中也没有找query-refactor的身影。如果有消息灵通人士不妨透露一下。
注:Alex并不是无名小卒,我们知道Django在1.2之前是不支持多数据库的,正是由于Alex的努力,我们才能享用Django的多数据库特性。
Django + MongoDB的抉择
最直接的方式是使用PyMongo——MongoDB提供的Python Driver。但是用惯了Django的Model层,实在不愿意自己去维护数据库连接,写一大堆CRUD的语句。
而django-nonrel,如前所述,未必是一个好的选择。同样的原因,django-mongodb-engine是基于django-nonrel的MongoDB backend实现,也不予考虑。
MongoEngine,在Django官方的支持出来之前,我认为这是最好的选择。因为MongoEngine可以提供与Django Model(ORM)非常类似的体验,可以快速上手。看一下官网首页的例子:
from mongoengine import * # To define a schema for a
# document, we create a
class Metadata(EmbeddedDocument): # class that inherits from
tags = ListField(StringField()) # Document.
revisions = ListField(IntField()) #
# Fields are specified by
class WikiPage(Document): # adding field objects as
title = StringField(required=True) # class attributes to the
text = StringField() # document class.
metadata = EmbeddedDocumentField(Metadata) #
# Querying is achieved by
>>> page.title = “Hello, World!” # calling the objects
>>> for page in WikiPage.objects: # attribute on a document
>>> print page.title # class.
Django+MongoEngine
首先安装MongoEngine(依赖pymongo)。之后在python shell中实验一下:
from mongoengine import *
connect('employeeDB')
class Employee(Document):
name = StringField(max_length=50)
age = IntField(required=False)
john = Employee(name="John Doe", age=25)
john.save()
jane = Employee(name="Jane Doe", age=27)
jane.save()
for e in Employee.objects.all():
print e["id"], e["name"], e["age"]
在Django中使用也很容易,只需在models.py(如果你十分介意,也可以单独放在docs.py中)这样写:
from mongoengine import *
from mysite.settings import DBNAME
connect(DBNAME)
class Employee(Document):
name = StringField(max_length=50)
age = IntField(required=False)
其中,DBNAME在settings.py中指定。
然后,在视图中就可以使用“文档模型“了。
其他
1.Mongo Engine的Field类型与Django ORM的Field类型有所不同,下面是一个简单的对比:
MongoEngine Django
StringField CharField
URLField URLField
EmailField EmailField
IntField IntegerField
FloatField FloatField
DecimalField DecimalField
BooleanField BooleanField
DateTimeField DateTimeField
EmbeddedDocumentField --
DictField --
ListField --
SortedListField --
BinaryField --
ObjectIdField --
FileField FileField
2.尽管看起来像是ORM,但MongoDB绝对不是RDB。我想MongoEngine这样的设计是为了方便上手,但是使用的时候,一定要按照NoSQL的方式去思考问题。
作者 Holbrook