Envoyé par : abcabc07
Date : 01/02/2010 09:16
Bonjour, Je souhaite tout simplement récuperer le texte d'une page web. Pour cela je fais un :
var text = window.content.document.body.textContent
qui marche très bien lorsqu'il n'y a pas de javascript. Mais lorsqu'il y a du javascript, ma variable texte le récupère. (Ex : la page d'accueil de Google) Comment faire pour avoir seulement le texte et pas le javascript. Merci
Envoyé par : Barsy
Date : 02/02/2010 16:34
Je pense qu'en utilisant une expression réguliere pour enlever tout ce qui se trouve entre les balise <script> et </script>, ça pourrait t'aider...
Envoyé par : laurentj
Date : 15/02/2010 10:52
Il faut utiliser un treeWalker (cf DOM) que tu va utiliser pour récupérer tout les noeuds textes
Il n'est plus possible de poster des messages dans ce forum.
Copyright © 2003-2013 association xulfr, 2013-2016 Laurent Jouanneau - Informations légales.
Mozilla® est une marque déposée de la fondation Mozilla.
Mozilla.org™, Firefox™, Thunderbird™, Mozilla Suite™ et XUL™
sont des marques de la fondation Mozilla.