ArangoDB-AQL 예제 쿼리

이 장에서는 몇 가지 AQL 예제 쿼리를 Actors and Movies데이터 베이스. 이러한 쿼리는 그래프를 기반으로합니다.

문제

배우 컬렉션과 영화 컬렉션, 그리고 아래 표시된대로 정점을 연결하기위한 actIn 가장자리 컬렉션 (연도 속성 포함)이 주어집니다.

[Actor] <- act in -> [Movie]

우리는 어떻게-

  • "movie1"또는 "movie2"에서 연기 한 모든 배우?
  • "movie1"과 "movie2"둘 다에서 연기 한 모든 배우?
  • "actor1"과 "actor2"사이의 모든 일반적인 영화?
  • 3 편 이상의 영화에서 연기 한 모든 배우?
  • 정확히 6 명의 배우가 출연 한 모든 영화?
  • 영화 배우의 수는?
  • 배우별 영화 수?
  • 2005 년에서 2010 년 사이에 배우가 연기 한 영화의 수는?

해결책

위 쿼리를 해결하고 답을 얻는 과정에서 Arangosh를 사용하여 데이터 세트를 만들고 이에 대한 쿼리를 실행합니다. 모든 AQL 쿼리는 문자열이며 Arangosh 대신 선호하는 드라이버로 간단히 복사 할 수 있습니다.

Arangosh에서 테스트 데이터 세트를 생성하여 시작하겠습니다. 첫째, 다운로드 이 파일을 -

# wget -O dataset.js
https://drive.google.com/file/d/0B4WLtBDZu_QWMWZYZ3pYMEdqajA/view?usp=sharing

산출

...
HTTP request sent, awaiting response... 200 OK
Length: unspecified [text/html]
Saving to: ‘dataset.js’
dataset.js [ <=> ] 115.14K --.-KB/s in 0.01s
2017-09-17 14:19:12 (11.1 MB/s) - ‘dataset.js’ saved [117907]

위의 출력에서 ​​JavaScript 파일을 다운로드 한 것을 볼 수 있습니다. dataset.js.이 파일에는 데이터베이스에 데이터 세트를 생성하는 Arangosh 명령이 포함되어 있습니다. 명령을 하나씩 복사하여 붙여 넣는 대신--javascript.executeArangosh의 옵션을 사용하여 여러 명령을 비대화 형으로 실행합니다. 생명의 은인 명령이라고 생각하십시오!

이제 쉘에서 다음 명령을 실행하십시오-

$ arangosh --javascript.execute dataset.js

위의 스크린 샷에서 볼 수 있듯이 메시지가 표시되면 암호를 제공하십시오. 이제 데이터를 저장 했으므로이 장의 시작 부분에서 제기 된 특정 질문에 답하기 위해 AQL 쿼리를 구성 할 것입니다.

첫 번째 질문

첫 번째 질문을하겠습니다. All actors who acted in "movie1" OR "movie2". "TheMatrix"또는 "TheDevilsAdvocate"에서 연기 한 모든 배우의 이름을 찾고 싶다고 가정 해 보겠습니다.

배우의 이름을 얻기 위해 한 번에 하나의 영화로 시작합니다.

127.0.0.1:8529@_system> db._query("FOR x IN ANY 'movies/TheMatrix' actsIn
OPTIONS {bfs: true, uniqueVertices: 'global'} RETURN x._id").toArray();

산출

다음과 같은 출력을 받게됩니다.

[
   "actors/Hugo",
   "actors/Emil",
   "actors/Carrie",
   "actors/Keanu",
   "actors/Laurence"
]

이제 우리는 솔루션이 될 두 개의 NEIGHBORS 쿼리의 UNION_DISTINCT를 계속 형성합니다.

127.0.0.1:8529@_system> db._query("FOR x IN UNION_DISTINCT ((FOR y IN ANY
'movies/TheMatrix' actsIn OPTIONS {bfs: true, uniqueVertices: 'global'} RETURN
y._id), (FOR y IN ANY 'movies/TheDevilsAdvocate' actsIn OPTIONS {bfs: true,
uniqueVertices: 'global'} RETURN y._id)) RETURN x").toArray();

산출

[
   "actors/Charlize",
   "actors/Al",
   "actors/Laurence",
   "actors/Keanu",
   "actors/Carrie",
   "actors/Emil",
   "actors/Hugo"
]

두 번째 질문

이제 두 번째 질문을 고려해 보겠습니다. All actors who acted in both "movie1" AND "movie2". 이것은 위의 질문과 거의 동일합니다. 하지만 이번에는 UNION이 아니라 INTERSECTION에 관심이 있습니다.

127.0.0.1:8529@_system> db._query("FOR x IN INTERSECTION ((FOR y IN ANY
'movies/TheMatrix' actsIn OPTIONS {bfs: true, uniqueVertices: 'global'} RETURN
y._id), (FOR y IN ANY 'movies/TheDevilsAdvocate' actsIn OPTIONS {bfs: true,
uniqueVertices: 'global'} RETURN y._id)) RETURN x").toArray();

산출

다음과 같은 출력을 받게됩니다.

[
   "actors/Keanu"
]

세 번째 질문

이제 세 번째 질문을 고려해 보겠습니다. All common movies between "actor1" and "actor2". 이것은 실제로 movie1과 movie2의 일반적인 배우에 대한 질문과 동일합니다. 시작 정점 만 변경하면됩니다. 예를 들어, Hugo Weaving ( "Hugo")과 Keanu Reeves가 공동 출연하는 모든 영화를 찾아 보겠습니다.

127.0.0.1:8529@_system> db._query(
   "FOR x IN INTERSECTION (
      (
         FOR y IN ANY 'actors/Hugo' actsIn OPTIONS 
         {bfs: true, uniqueVertices: 'global'}
          RETURN y._id
      ),
      
      (
         FOR y IN ANY 'actors/Keanu' actsIn OPTIONS 
         {bfs: true, uniqueVertices:'global'} RETURN y._id
      )
   ) 
   RETURN x").toArray();

산출

다음과 같은 출력을 받게됩니다.

[
   "movies/TheMatrixReloaded",
   "movies/TheMatrixRevolutions",
   "movies/TheMatrix"
]

네 번째 질문

이제 네 번째 질문을 고려해 보겠습니다. All actors who acted in 3 or more movies. 이 질문은 다릅니다. 여기서는 이웃 기능을 사용할 수 없습니다. 대신 우리는 그룹화를 위해 에지 인덱스와 AQL의 COLLECT 문을 사용할 것입니다. 기본 아이디어는 모든 모서리를startVertex(이 데이터 세트에서 항상 액터입니다). 그런 다음 여기에 배우가 연기 한 영화 수를 포함 했으므로 결과에서 영화가 3 개 미만인 모든 배우를 제거합니다.

127.0.0.1:8529@_system> db._query("FOR x IN actsIn COLLECT actor = x._from WITH
COUNT INTO counter FILTER counter >= 3 RETURN {actor: actor, movies:
counter}"). toArray()

산출

[
   {
      "actor" : "actors/Carrie",
      "movies" : 3
   },
   
   {
      "actor" : "actors/CubaG",
      "movies" : 4
   },

   {
      "actor" : "actors/Hugo",
      "movies" : 3
   },

   {
      "actor" : "actors/Keanu",
      "movies" : 4
   },

   {
      "actor" : "actors/Laurence",
      "movies" : 3
   },

   {
      "actor" : "actors/MegR",
      "movies" : 5
   },

   {
      "actor" : "actors/TomC",
      "movies" : 3
   },
   
   {
      "actor" : "actors/TomH",
      "movies" : 3
   }
]

나머지 질문에 대해서는 쿼리 형성에 대해 논의하고 쿼리 만 제공합니다. 독자는 Arangosh 터미널에서 쿼리를 직접 실행해야합니다.

다섯 번째 질문

이제 다섯 번째 질문을 고려해 보겠습니다. All movies where exactly 6 actors acted in. 이전 쿼리와 동일하지만 같음 필터가 있습니다. 그러나 이제 배우 대신 영화가 필요하므로_to attribute

db._query("FOR x IN actsIn COLLECT movie = x._to WITH COUNT INTO counter FILTER
counter == 6 RETURN movie").toArray()

영화 배우의 수는?

데이터 세트에서 기억합니다. _to 가장자리는 영화에 해당하므로 얼마나 자주 _to나타납니다. 이것은 배우의 수입니다. 쿼리는 이전 쿼리와 거의 동일하지만without the FILTER after COLLECT

db._query("FOR x IN actsIn COLLECT movie = x._to WITH COUNT INTO counter RETURN
{movie: movie, actors: counter}").toArray()

여섯 번째 질문

이제 여섯 번째 질문을 고려해 보겠습니다. The number of movies by an actor.

위 쿼리에 대한 솔루션을 찾은 방법은이 쿼리에 대한 솔루션을 찾는데도 도움이됩니다.

db._query("FOR x IN actsIn COLLECT actor = x._from WITH COUNT INTO counter
RETURN {actor: actor, movies: counter}").toArray()