PhantomJS - Automatisation des pages

PhantomJS, à l'aide de ses API de module de page Web, peut manipuler des pages Web et effectuer des opérations telles que la manipulation DOM, en cliquant sur des boutons, etc.

Récupérer des images d'une page

Le programme suivant montre comment utiliser PhantomJS pour récupérer des images d'une page.

var wpage = require('webpage').create();
wpage.onConsoleMessage = function(str) {
   console.log(str.length);
}
wpage.open("http://phantomjs.org", function(status) {
   console.log(status);
   var element = wpage.evaluate(function() {
      var imgdata =  document.querySelectorAll('img');
      var imgsrc = [];
      
      if (imgdata) {
         for (var i in imgdata) {
            imgsrc.push(imgdata[0].src);
         }
      }
      return imgsrc;
   });
   console.log(JSON.stringify(element));
});

Le programme ci-dessus génère les éléments suivants output.

Success 
["http://phantomjs.org/img/phantomjslogo.png","http://phantomjs.org/img/phantom 
js-logo.png","http://phantomjs.org/img/phantomjslogo.png","http://phantomjs.org 
/img/phantomjs-logo.png"]

Il est possible d'inclure du JavaScript externe dans une page en utilisant le injectJS webpage method. Il existe de nombreuses propriétés et méthodes qui peuvent aider à l'automatisation des pages et faire beaucoup d'autres choses. Vous pouvez vous référer au module de page Web où les propriétés et les méthodes sont expliquées en détail.