DocumentDB - Datenmodellierung

Während schemafreie Datenbanken wie DocumentDB das Übernehmen von Änderungen an Ihrem Datenmodell sehr einfach machen, sollten Sie dennoch einige Zeit damit verbringen, über Ihre Daten nachzudenken.

  • Sie haben viele Möglichkeiten. Natürlich können Sie nur JSON-Objektdiagramme oder sogar rohe Zeichenfolgen von JSON-Text bearbeiten, aber Sie können auch dynamische Objekte verwenden, mit denen Sie zur Laufzeit an Eigenschaften binden können, ohne zur Kompilierungszeit eine Klasse zu definieren.

  • Sie können auch mit echten C # -Objekten oder Entitäten arbeiten, wie sie genannt werden. Dies können Ihre Geschäftsdomänenklassen sein.

Beziehungen

Werfen wir einen Blick auf die hierarchische Struktur des Dokuments. Es verfügt über einige Eigenschaften der obersten Ebene wie die erforderliche ID sowie lastName und isRegistered, aber auch über verschachtelte Eigenschaften.

{ 
   "id": "AndersenFamily", 
   "lastName": "Andersen", 
	
   "parents": [ 
      { "firstName": "Thomas", "relationship": "father" }, 
      { "firstName": "Mary Kay", "relationship": "mother" } 
   ],
	
   "children": [ 
      { 
         "firstName": "Henriette Thaulow", 
         "gender": "female", 
         "grade": 5, 
         "pets": [ { "givenName": "Fluffy", "type": "Rabbit" } ] 
      } 
   ], 
	
   "location": { "state": "WA", "county": "King", "city": "Seattle"}, 
   "isRegistered": true 
}
  • Beispielsweise wird die Eigenschaft parent als JSON-Array bereitgestellt, wie in eckigen Klammern angegeben.

  • Wir haben auch ein anderes Array für Kinder, obwohl es in diesem Beispiel nur ein Kind im Array gibt. Auf diese Weise modellieren Sie das Äquivalent von Eins-zu-Viele-Beziehungen innerhalb eines Dokuments.

  • Sie verwenden einfach Arrays, bei denen jedes Element im Array ein einfacher Wert oder ein anderes komplexes Objekt sein kann, sogar ein anderes Array.

  • Eine Familie kann also mehrere Eltern und mehrere Kinder haben. Wenn Sie sich die untergeordneten Objekte ansehen, haben sie die Eigenschaft eines Haustieres, die selbst ein verschachteltes Array für eine zu viele Beziehung zwischen Kindern und Haustieren ist.

  • Für die Location-Eigenschaft kombinieren wir drei verwandte Eigenschaften, das Bundesland, den Landkreis und die Stadt, zu einem Objekt.

  • Das Einbetten eines Objekts auf diese Weise anstelle des Einbettens eines Arrays von Objekten ähnelt einer Eins-zu-Eins-Beziehung zwischen zwei Zeilen in separaten Tabellen in einer relationalen Datenbank.

Daten einbetten

Wenn Sie mit der Modellierung von Daten in einem Dokumentenspeicher wie DocumentDB beginnen, versuchen Sie, Ihre Entitäten als in JSON dargestellte in sich geschlossene Dokumente zu behandeln. Bei der Arbeit mit relationalen Datenbanken normalisieren wir immer Daten.

  • Um Ihre Daten zu normalisieren, müssen Sie in der Regel eine Entität wie einen Kunden in diskrete Daten wie Kontaktdaten und Adressen aufteilen.

  • Um einen Kunden mit all seinen Kontaktdaten und Adressen zu lesen, müssen Sie JOINS verwenden, um Ihre Daten zur Laufzeit effektiv zu aggregieren.

Lassen Sie uns nun einen Blick darauf werfen, wie wir dieselben Daten wie eine in sich geschlossene Entität in einer Dokumentendatenbank modellieren würden.

{
   "id": "1", 
   "firstName": "Mark", 
   "lastName": "Upston", 
	
   "addresses": [ 
      {             
         "line1": "232 Main Street", 
         "line2": "Unit 1", 
         "city": "Brooklyn", 
         "state": "NY", 
         "zip": 11229
      }
   ],
	
   "contactDetails": [ 
      {"email": "[email protected]"}, 
      {"phone": "+1 356 545-86455", "extension": 5555} 
   ]
}

Wie Sie sehen, haben wir den Kundendatensatz denormalisiert, in dem alle Informationen des Kunden in ein einziges JSON-Dokument eingebettet sind.

In NoSQL haben wir ein kostenloses Schema, sodass Sie Kontaktdaten und Adressen auch in verschiedenen Formaten hinzufügen können. In NoSQL können Sie einen Kundendatensatz in einem einzigen Lesevorgang aus der Datenbank abrufen. In ähnlicher Weise ist das Aktualisieren eines Datensatzes auch eine einzelne Schreiboperation.

Im Folgenden finden Sie die Schritte zum Erstellen von Dokumenten mit dem .Net SDK.

Step 1- DocumentClient instanziieren. Anschließend fragen wir nach der myfirstdb-Datenbank und nach der MyCollection-Sammlung, die wir in dieser privaten Variablensammlung speichern, damit sie in der gesamten Klasse zugänglich ist.

private static async Task CreateDocumentClient() { 
   // Create a new instance of the DocumentClient
	
   using (var client = new DocumentClient(new Uri(EndpointUrl), AuthorizationKey)) { 
      database = client.CreateDatabaseQuery("SELECT * FROM c WHERE c.id =
         'myfirstdb'").AsEnumerable().First(); 
			
      collection = client.CreateDocumentCollectionQuery(database.CollectionsLink,
         "SELECT * FROM c WHERE c.id = 'MyCollection'").AsEnumerable().First();  
			
      await CreateDocuments(client); 
   }

}

Step 2 - Erstellen Sie einige Dokumente in der Aufgabe "CreateDocuments".

private async static Task CreateDocuments(DocumentClient client) {
   Console.WriteLine(); 
   Console.WriteLine("**** Create Documents ****"); 
   Console.WriteLine();
	
   dynamic document1Definition = new {
      name = "New Customer 1", address = new { 
         addressType = "Main Office", 
         addressLine1 = "123 Main Street", 
         location = new { 
            city = "Brooklyn", stateProvinceName = "New York"
         }, 
         postalCode = "11229", countryRegionName = "United States" 
      }, 
   };
	
   Document document1 = await CreateDocument(client, document1Definition); 
   Console.WriteLine("Created document {0} from dynamic object", document1.Id); 
   Console.WriteLine(); 
}

Das erste Dokument wird aus diesem dynamischen Objekt generiert. Dies mag wie JSON aussehen, ist es aber natürlich nicht. Dies ist C # -Code und wir erstellen ein echtes .NET-Objekt, aber es gibt keine Klassendefinition. Stattdessen werden die Eigenschaften aus der Art und Weise abgeleitet, wie das Objekt initialisiert wird. Sie können auch feststellen, dass wir für dieses Dokument keine ID-Eigenschaft angegeben haben.

Step 3 - Schauen wir uns nun das CreateDocument an und es sieht aus wie das gleiche Muster, das wir beim Erstellen von Datenbanken und Sammlungen gesehen haben.

private async static Task<Document> CreateDocument(DocumentClient client,
   object documentObject) {
   var result = await client.CreateDocumentAsync(collection.SelfLink, documentObject); 
	
   var document = result.Resource; 
   Console.WriteLine("Created new document: {0}\r\n{1}", document.Id, document); 
	
   return result; 
}

Step 4- Dieses Mal rufen wir CreateDocumentAsync auf und geben den SelfLink der Sammlung an, zu der wir das Dokument hinzufügen möchten. Wir erhalten eine Antwort mit einer Ressourceneigenschaft zurück, die in diesem Fall das neue Dokument mit seinen vom System generierten Eigenschaften darstellt.

In der folgenden Aufgabe "CreateDocuments" haben wir drei Dokumente erstellt.

  • Im ersten Dokument ist das Document-Objekt eine definierte Klasse im SDK, die von der Ressource erbt. Daher verfügt es über alle allgemeinen Ressourceneigenschaften, enthält jedoch auch die dynamischen Eigenschaften, die das schemafreie Dokument selbst definieren.

private async static Task CreateDocuments(DocumentClient client) {
   Console.WriteLine(); 
   Console.WriteLine("**** Create Documents ****"); 
   Console.WriteLine();
	
   dynamic document1Definition = new {
      name = "New Customer 1", address = new {
         addressType = "Main Office", 
         addressLine1 = "123 Main Street", 
         location = new {
            city = "Brooklyn", stateProvinceName = "New York" 
         }, 
         postalCode = "11229", 
         countryRegionName = "United States" 
      }, 
   };
	
   Document document1 = await CreateDocument(client, document1Definition); 
   Console.WriteLine("Created document {0} from dynamic object", document1.Id); 
   Console.WriteLine();
	
   var document2Definition = @" {
      ""name"": ""New Customer 2"", 
		
      ""address"": { 
         ""addressType"": ""Main Office"", 
         ""addressLine1"": ""123 Main Street"", 
         ""location"": { 
            ""city"": ""Brooklyn"", ""stateProvinceName"": ""New York"" 
         }, 
         ""postalCode"": ""11229"", 
         ""countryRegionName"": ""United States"" 
      } 
   }"; 
	
   Document document2 = await CreateDocument(client, document2Definition); 
   Console.WriteLine("Created document {0} from JSON string", document2.Id);
   Console.WriteLine();
	
   var document3Definition = new Customer {
      Name = "New Customer 3", 
		
      Address = new Address {
         AddressType = "Main Office", 
         AddressLine1 = "123 Main Street", 
         Location = new Location {
            City = "Brooklyn", StateProvinceName = "New York" 
         }, 
         PostalCode = "11229", 
         CountryRegionName = "United States" 
      }, 
   };
	
   Document document3 = await CreateDocument(client, document3Definition); 
   Console.WriteLine("Created document {0} from typed object", document3.Id); 
   Console.WriteLine(); 
}
  • Dieses zweite Dokument funktioniert nur mit einer rohen JSON-Zeichenfolge. Jetzt treten wir in eine Überladung für CreateDocument ein, die den JavaScriptSerializer verwendet, um die Zeichenfolge in ein Objekt zu de-serialisieren, das dann an dieselbe CreateDocument-Methode weitergeleitet wird, mit der wir das erste Dokument erstellt haben.

  • Im dritten Dokument haben wir das in unserer Anwendung definierte C # -Objekt Customer verwendet.

Werfen wir einen Blick auf diesen Kunden. Er hat eine ID- und Adresseneigenschaft, bei der die Adresse ein verschachteltes Objekt mit eigenen Eigenschaften ist, einschließlich des Standorts, bei dem es sich um ein weiteres verschachteltes Objekt handelt.

using Newtonsoft.Json; 

using System; 
using System.Collections.Generic; 
using System.Linq; 
using System.Text; 
using System.Threading.Tasks;

namespace DocumentDBDemo {
 
   public class Customer { 
      [JsonProperty(PropertyName = "id")] 
      public string Id { get; set; }
      // Must be nullable, unless generating unique values for new customers on client  
      [JsonProperty(PropertyName = "name")] 
      public string Name { get; set; }  
      [JsonProperty(PropertyName = "address")] 
      public Address Address { get; set; } 
   }
	
   public class Address {
      [JsonProperty(PropertyName = "addressType")] 
      public string AddressType { get; set; }  
		
      [JsonProperty(PropertyName = "addressLine1")] 
      public string AddressLine1 { get; set; }  
		
      [JsonProperty(PropertyName = "location")] 
      public Location Location { get; set; }  
		
      [JsonProperty(PropertyName = "postalCode")] 
      public string PostalCode { get; set; }  
		
      [JsonProperty(PropertyName = "countryRegionName")] 
      public string CountryRegionName { get; set; } 
   }
	
   public class Location { 
      [JsonProperty(PropertyName = "city")] 
      public string City { get; set; }  
		
      [JsonProperty(PropertyName = "stateProvinceName")]
      public string StateProvinceName { get; set; } 
   } 
}

Wir haben auch JSON-Eigenschaftsattribute eingerichtet, da wir auf beiden Seiten des Zauns die richtigen Konventionen beibehalten möchten.

Also erstelle ich einfach mein neues Kundenobjekt zusammen mit den verschachtelten untergeordneten Objekten und rufe CreateDocument erneut auf. Obwohl unser Kundenobjekt eine ID-Eigenschaft hat, haben wir keinen Wert dafür angegeben. Daher hat DocumentDB einen Wert basierend auf der GUID generiert, genau wie bei den beiden vorherigen Dokumenten.

Wenn der obige Code kompiliert und ausgeführt wird, erhalten Sie die folgende Ausgabe.

**** Create Documents ****  
Created new document: 575882f0-236c-4c3d-81b9-d27780206b2c 
{ 
  "name": "New Customer 1", 
  "address": { 
    "addressType": "Main Office", 
    "addressLine1": "123 Main Street", 
    "location": { 
      "city": "Brooklyn", 
      "stateProvinceName": "New York" 
    }, 
    "postalCode": "11229", 
    "countryRegionName": "United States" 
  }, 
  "id": "575882f0-236c-4c3d-81b9-d27780206b2c", 
  "_rid": "kV5oANVXnwDGPgAAAAAAAA==", 
  "_ts": 1450037545, 
  "_self": "dbs/kV5oAA==/colls/kV5oANVXnwA=/docs/kV5oANVXnwDGPgAAAAAAAA==/", 
  "_etag": "\"00006fce-0000-0000-0000-566dd1290000\"", 
  "_attachments": "attachments/" 
} 
Created document 575882f0-236c-4c3d-81b9-d27780206b2c from dynamic object  
Created new document: 8d7ad239-2148-4fab-901b-17a85d331056 
{ 
  "name": "New Customer 2", 
  "address": {
    "addressType": "Main Office", 
    "addressLine1": "123 Main Street", 
    "location": { 
      "city": "Brooklyn", 
      "stateProvinceName": "New York" 
    }, 
    "postalCode": "11229", 
    "countryRegionName": "United States" 
  }, 
  "id": "8d7ad239-2148-4fab-901b-17a85d331056", 
  "_rid": "kV5oANVXnwDHPgAAAAAAAA==", 
  "_ts": 1450037545, 
  "_self": "dbs/kV5oAA==/colls/kV5oANVXnwA=/docs/kV5oANVXnwDHPgAAAAAAAA==/", 
  "_etag": "\"000070ce-0000-0000-0000-566dd1290000\"", 
  "_attachments": "attachments/" 
} 
Created document 8d7ad239-2148-4fab-901b-17a85d331056 from JSON string  
Created new document: 49f399a8-80c9-4844-ac28-cd1dee689968 
{ 
  "id": "49f399a8-80c9-4844-ac28-cd1dee689968", 
  "name": "New Customer 3", 
  "address": { 
    "addressType": "Main Office", 
    "addressLine1": "123 Main Street", 
    "location": { 
      "city": "Brooklyn", 
      "stateProvinceName": "New York" 
    }, 
    "postalCode": "11229", 
    "countryRegionName": "United States" 
  }, 
  "_rid": "kV5oANVXnwDIPgAAAAAAAA==", 
  "_ts": 1450037546, 
  "_self": "dbs/kV5oAA==/colls/kV5oANVXnwA=/docs/kV5oANVXnwDIPgAAAAAAAA==/", 
  "_etag": "\"000071ce-0000-0000-0000-566dd12a0000\"", 
  "_attachments": "attachments/" 
}
Created document 49f399a8-80c9-4844-ac28-cd1dee689968 from typed object