ArangoDB - przykładowe zapytania AQL

W tym rozdziale rozważymy kilka przykładowych zapytań AQL na platformie Actors and MoviesBaza danych. Te zapytania są oparte na wykresach.

Problem

Biorąc pod uwagę zbiór aktorów i kolekcję filmów oraz kolekcję actIn edge (z właściwością year), aby połączyć wierzchołek, jak wskazano poniżej -

[Actor] <- act in -> [Movie]

Jak otrzymujemy -

  • Wszyscy aktorzy, którzy wystąpili w filmie „film1” LUB „film2”?
  • Wszyscy aktorzy, którzy wystąpili zarówno w „film1”, jak i „filmie2”?
  • Wszystkie popularne filmy między „actor1” i „actor2”?
  • Wszyscy aktorzy, którzy wystąpili w 3 lub więcej filmach?
  • Wszystkie filmy, w których grało dokładnie 6 aktorów?
  • Liczba aktorów według filmu?
  • Liczba filmów aktora?
  • Liczba filmów granych przez aktora w latach 2005–2010?

Rozwiązanie

Podczas procesu rozwiązywania i uzyskiwania odpowiedzi na powyższe pytania użyjemy Arangosha do stworzenia zestawu danych i uruchomienia zapytań na ten temat. Wszystkie zapytania AQL są ciągami znaków i można je po prostu skopiować do ulubionego sterownika zamiast do Arangosha.

Zacznijmy od stworzenia testowego zestawu danych w Arangosh. Najpierw pobierz ten plik -

# wget -O dataset.js
https://drive.google.com/file/d/0B4WLtBDZu_QWMWZYZ3pYMEdqajA/view?usp=sharing

Wynik

...
HTTP request sent, awaiting response... 200 OK
Length: unspecified [text/html]
Saving to: ‘dataset.js’
dataset.js [ <=> ] 115.14K --.-KB/s in 0.01s
2017-09-17 14:19:12 (11.1 MB/s) - ‘dataset.js’ saved [117907]

Na powyższym wyjściu widać, że pobraliśmy plik JavaScript dataset.js.Ten plik zawiera polecenia Arangosha służące do tworzenia zestawu danych w bazie danych. Zamiast kopiować i wklejać polecenia jeden po drugim, użyjemy rozszerzenia--javascript.executeopcja na Arangosh, aby wykonać wiele poleceń bez interakcji. Potraktuj to polecenie ratujące życie!

Teraz wykonaj następujące polecenie w powłoce -

$ arangosh --javascript.execute dataset.js

Po wyświetleniu monitu podaj hasło, jak widać na powyższym zrzucie ekranu. Teraz zapisaliśmy dane, więc skonstruujemy zapytania AQL, aby odpowiedzieć na konkretne pytania postawione na początku tego rozdziału.

Pierwsze pytanie

Spójrzmy na pierwsze pytanie: All actors who acted in "movie1" OR "movie2". Załóżmy, że chcemy znaleźć nazwiska wszystkich aktorów, którzy grali w „TheMatrix” LUB „TheDevilsAdvocate” -

Zaczniemy od jednego filmu na raz, aby poznać nazwiska aktorów -

127.0.0.1:8529@_system> db._query("FOR x IN ANY 'movies/TheMatrix' actsIn
OPTIONS {bfs: true, uniqueVertices: 'global'} RETURN x._id").toArray();

Wynik

Otrzymamy następujący wynik -

[
   "actors/Hugo",
   "actors/Emil",
   "actors/Carrie",
   "actors/Keanu",
   "actors/Laurence"
]

Teraz kontynuujemy tworzenie UNION_DISTINCT dwóch zapytań NEIGHBORS, które będą rozwiązaniem -

127.0.0.1:8529@_system> db._query("FOR x IN UNION_DISTINCT ((FOR y IN ANY
'movies/TheMatrix' actsIn OPTIONS {bfs: true, uniqueVertices: 'global'} RETURN
y._id), (FOR y IN ANY 'movies/TheDevilsAdvocate' actsIn OPTIONS {bfs: true,
uniqueVertices: 'global'} RETURN y._id)) RETURN x").toArray();

Wynik

[
   "actors/Charlize",
   "actors/Al",
   "actors/Laurence",
   "actors/Keanu",
   "actors/Carrie",
   "actors/Emil",
   "actors/Hugo"
]

Drugie Pytanie

Rozważmy teraz drugie pytanie: All actors who acted in both "movie1" AND "movie2". To jest prawie identyczne z pytaniem powyżej. Ale tym razem nie interesuje nas UNIA, ale PRZECIĄŻENIE -

127.0.0.1:8529@_system> db._query("FOR x IN INTERSECTION ((FOR y IN ANY
'movies/TheMatrix' actsIn OPTIONS {bfs: true, uniqueVertices: 'global'} RETURN
y._id), (FOR y IN ANY 'movies/TheDevilsAdvocate' actsIn OPTIONS {bfs: true,
uniqueVertices: 'global'} RETURN y._id)) RETURN x").toArray();

Wynik

Otrzymamy następujący wynik -

[
   "actors/Keanu"
]

Trzecie pytanie

Rozważmy teraz trzecie pytanie: All common movies between "actor1" and "actor2". W rzeczywistości jest to identyczne z pytaniem o zwykłych aktorów w filmie 1 i filmie 2. Musimy tylko zmienić początkowe wierzchołki. Na przykład znajdźmy wszystkie filmy, w których wystąpili Hugo Weaving („Hugo”) i Keanu Reeves -

127.0.0.1:8529@_system> db._query(
   "FOR x IN INTERSECTION (
      (
         FOR y IN ANY 'actors/Hugo' actsIn OPTIONS 
         {bfs: true, uniqueVertices: 'global'}
          RETURN y._id
      ),
      
      (
         FOR y IN ANY 'actors/Keanu' actsIn OPTIONS 
         {bfs: true, uniqueVertices:'global'} RETURN y._id
      )
   ) 
   RETURN x").toArray();

Wynik

Otrzymamy następujący wynik -

[
   "movies/TheMatrixReloaded",
   "movies/TheMatrixRevolutions",
   "movies/TheMatrix"
]

Pytanie czwarte

Rozważmy teraz czwarte pytanie. All actors who acted in 3 or more movies. To pytanie jest inne; nie możemy tu wykorzystać funkcji sąsiadów. Zamiast tego użyjemy indeksu krawędzi i instrukcji COLLECT języka AQL do grupowania. Podstawową ideą jest pogrupowanie wszystkich krawędzi według ichstartVertex(który w tym zbiorze danych jest zawsze aktorem). Następnie usuwamy wszystkich aktorów z mniej niż 3 filmami z wyniku, ponieważ tutaj uwzględniliśmy liczbę filmów, w których aktor zagrał -

127.0.0.1:8529@_system> db._query("FOR x IN actsIn COLLECT actor = x._from WITH
COUNT INTO counter FILTER counter >= 3 RETURN {actor: actor, movies:
counter}"). toArray()

Wynik

[
   {
      "actor" : "actors/Carrie",
      "movies" : 3
   },
   
   {
      "actor" : "actors/CubaG",
      "movies" : 4
   },

   {
      "actor" : "actors/Hugo",
      "movies" : 3
   },

   {
      "actor" : "actors/Keanu",
      "movies" : 4
   },

   {
      "actor" : "actors/Laurence",
      "movies" : 3
   },

   {
      "actor" : "actors/MegR",
      "movies" : 5
   },

   {
      "actor" : "actors/TomC",
      "movies" : 3
   },
   
   {
      "actor" : "actors/TomH",
      "movies" : 3
   }
]

W przypadku pozostałych pytań omówimy tworzenie zapytania i udostępnimy tylko zapytania. Czytelnik powinien samodzielnie uruchomić zapytanie na terminalu Arangosh.

Piąte pytanie

Rozważmy teraz piąte pytanie: All movies where exactly 6 actors acted in. Ten sam pomysł, co w poprzednim zapytaniu, ale z filtrem równości. Jednak teraz potrzebujemy filmu zamiast aktora, więc zwracamy plik_to attribute -

db._query("FOR x IN actsIn COLLECT movie = x._to WITH COUNT INTO counter FILTER
counter == 6 RETURN movie").toArray()

Liczba aktorów według filmu?

Pamiętamy w naszym zbiorze danych _to na brzegu odpowiada filmowi, więc liczymy, jak często to samo _topojawia się. To jest liczba aktorów. Zapytanie jest prawie identyczne z wcześniejszymi, alewithout the FILTER after COLLECT -

db._query("FOR x IN actsIn COLLECT movie = x._to WITH COUNT INTO counter RETURN
{movie: movie, actors: counter}").toArray()

Szóste pytanie

Rozważmy teraz szóste pytanie: The number of movies by an actor.

Sposób, w jaki znaleźliśmy rozwiązania naszych powyższych zapytań, pomoże Ci znaleźć rozwiązanie również dla tego zapytania.

db._query("FOR x IN actsIn COLLECT actor = x._from WITH COUNT INTO counter
RETURN {actor: actor, movies: counter}").toArray()