PhantomJS - Automatisation des pages
PhantomJS, à l'aide de ses API de module de page Web, peut manipuler des pages Web et effectuer des opérations telles que la manipulation DOM, en cliquant sur des boutons, etc.
Récupérer des images d'une page
Le programme suivant montre comment utiliser PhantomJS pour récupérer des images d'une page.
var wpage = require('webpage').create();
wpage.onConsoleMessage = function(str) {
console.log(str.length);
}
wpage.open("http://phantomjs.org", function(status) {
console.log(status);
var element = wpage.evaluate(function() {
var imgdata = document.querySelectorAll('img');
var imgsrc = [];
if (imgdata) {
for (var i in imgdata) {
imgsrc.push(imgdata[0].src);
}
}
return imgsrc;
});
console.log(JSON.stringify(element));
});
Le programme ci-dessus génère les éléments suivants output.
Success
["http://phantomjs.org/img/phantomjslogo.png","http://phantomjs.org/img/phantom
js-logo.png","http://phantomjs.org/img/phantomjslogo.png","http://phantomjs.org
/img/phantomjs-logo.png"]
Il est possible d'inclure du JavaScript externe dans une page en utilisant le injectJS webpage method. Il existe de nombreuses propriétés et méthodes qui peuvent aider à l'automatisation des pages et faire beaucoup d'autres choses. Vous pouvez vous référer au module de page Web où les propriétés et les méthodes sont expliquées en détail.