récupérer une liste d'adresses e-mail d'un site.

CCharless

Membre actif
24 Avril 2005
177
1
Bonjour,

Je cherche à automatiser la tâche suivante :

Il y a une page internet sur laquelle sont repris une centaine de lien vers des "fiches individuelle".

Sur chaque fiche individuelle se trouve un lien "envoyer un e-mail" qui, lorsqu'on clique dessus, ouvre un nouveau message dans le client mail en remplissant le champ "envoyer à" avec l'adresse mail de la personne dont on est dans la "fiche".

J'aimerais réunir les adresses e-mail de toutes ces fiches sur un seul document.

J'ai essayé avec automator et scripts mais je ne suis pas spécialiste et je n'y suis pas arrivé.

Quelqu'un pourrait-il me guider ? (si la chose est possible)

Merci.
 
A part les "copier/coller" un par un à la mimine, je ne vois pas !
 
J'ai bien réussi, grâce à automator, à récupérer en une fois tous les url des "fiches". Mais de là, je bloque : impossible d'automatiser la récupération les adresses mails vers lesquelles pointent les lien "mailto:xxx". Que veux tu dire par
Leopard sait le faire dans les mails...
mais Tiger :nailbiting:
J Il sair faire quoi exactement Leopard dans les mails, que ne sait pas faire Tiger ?
 
Regarde la vidéo (la deuxième partie).
Ben oui c'est sympa : mail reconnait les adresses et numéros de téléphone comme tels mais je vois mal en quoi ça concerne mon problème :
J'ai une page internet sur laquelles se trouvent un centaine de liens, chaqu'un de ces liens pointe vers une page qui, elle-même contient (entre autre) un lien de type "adresser un courrier éléctronique à [email protected]", ce sont toutes ces adresses mails que je voudrais récupérer en une fois.
 
Je reprends :

tu as une page internet donc tu as accès au code html ?
et tu veux donc épurer tout ce code pour ne conserver que les [email protected] ?

ça devrait être possible avec des expressions régulières dans un éditeur de texte… A réfléchir.
 
Ben si le système peut identifier une adresse web du reste, il est alors d'agir avec elle. Par ex. l'ajouter au carnet, ou développer un module automator à ce sujet... :rolleyes:

Il est vrai qu'en atttendant :nailbiting: :(
 
Ben si le système peut identifier une adresse web du reste, il est alors d'agir avec elle. Par ex. l'ajouter au carnet, ou développer un module automator à ce sujet... :rolleyes:

Il est vrai qu'en atttendant :nailbiting: :(
Oui mais dans mon cas il ne s'agit pas d'agir avec une adresse web mais avec un lien "mailto:" (qui n'est pas reconnu comme lien url (seul type de lien reconnu par automator)).
Bref... Y a pas l'air d'avoir de solution, à part, comme dit Pascal 77 ""copier/coller" un par un à la mimine."
si quelqu'un a encore une idée...
 
Y a pas l'air d'avoir de solution, à part, comme dit Pascal 77 ""copier/coller" un par un à la mimine."
si quelqu'un a encore une idée...
M'étonnerait bien qu'un AppleScript ne soit pas capable de reconnaître le caractère @ (ou la chaîne "mailto:") dans un texte, de récupérer le mot dans lequel il est contenu et d'en supprimer les 7 premiers caractères.

Je ne suis pas vraiment capable de donner les instructions comme ça de tête, je regarderai ça de plus près ce soir si j'ai le temps. Est-ce que tu as fait quelques recherches de ce côté-là (en particulier sur le forum dédié) ?
 
M'étonnerait bien qu'un AppleScript ne soit pas capable de reconnaître le caractère @ (ou la chaîne "mailto:") dans un texte, de récupérer le mot dans lequel il est contenu et d'en supprimer les 7 premiers caractères.
Ce serait super si c'était possible en effet. Je rappelle que le texte "mailto:[email protected]" n'apparaît pas directement, c'est un lien.

Je ne suis pas vraiment capable de donner les instructions comme ça de tête, je regarderai ça de plus près ce soir si j'ai le temps.
Merci.

Est-ce que tu as fait quelques recherches de ce côté-là (en particulier sur le forum dédié) ?
Oui mais je n'y ai rien trouvé qui puisse m'aider...
 
Ce serait super si c'était possible en effet. Je rappelle que le texte "mailto:[email protected]" n'apparaît pas directement, c'est un lien.
Comment ça ? Qu'est-ce qui apparaît alors dans le fichier source ?

Pour ce que j'en sais, le moyen de faire apparaître une adresse dans une page sans que ça figure dans le fichier source, c'est soit de coller une image affichant l'adresse (basique mais efficace et à peu près imparable, mais ça oblige à saisir à la main, en effet) soit de passer par un script qui permet (justement) d'encoder la commande de façon à ce que les robots des spammeurs ne puissent pas récupérer les adresses (voir l'outil du Caspam, par ex.) Ce n'est tout de même pas ça que tu cherches à faire ?
 
Comment ça ? Qu'est-ce qui apparaît alors dans le fichier source ?
Sur la page, il est écrit : "envoyer un email". Quand on clique dessus, un mail s'ouvre avec l'adresse mail dans le champ "à". si je passe mon curseur sur "envoyer un email" et que je regarde la barre d'état (tout en dessous de fenêtre), il est écrit "addresser un courier éléctronique à [email protected]" (dans Safari) ou "mailto:[email protected]" (dans FireFox)

Pour ce que j'en sais, le moyen de faire apparaître une adresse dans une page sans que ça figure dans le fichier source, c'est soit de coller une image affichant l'adresse (basique mais efficace et à peu près imparable, mais ça oblige à saisir à la main, en effet) soit de passer par un script qui permet (justement) d'encoder la commande de façon à ce que les robots des spammeurs ne puissent pas récupérer les adresses (voir l'outil du Caspam, par ex.) Ce n'est tout de même pas ça que tu cherches à faire ?
Ben j'en sais rien... C'est un script "mailto:" ?
 
Sur la page, il est écrit : "envoyer un email". Quand on clique dessus, un mail s'ouvre avec l'adresse mail dans le champ "à". si je passe mon curseur sur "envoyer un email" et que je regarde la barre d'état (tout en dessous de fenêtre), il est écrit "addresser un courier éléctronique à [email protected]" (dans Safari) ou "mailto:[email protected]" (dans FireFox)
Oui, ça c'est le comportement dans la fenêtre du navigateur. Ce qu'il faut voir, car c'est ce que tu peux (éventuellement) récupérer, c'est ce qu'il y a dans le fichier source. Dans Firefox, menu "Affichage", tu demandes "Code source de la page". Du coup, tu auras une page en format texte avec le tout le code. Et c'est là dedans qu'il faut retrouver l'adresse. Si tu fais, par exemple Pomme-F et que tu recherches le caractère "@" ou la chaîne "mailto:" tu devrais retrouver le texte correspondant à l'adresse. Et c'est exactement ce que pourra faire un outil du genre AppleScript.

Ben j'en sais rien... C'est un script "mailto:" ?
Pas forcément, justement. Regarde comment fonctionne l'outil du Caspam, précisément pour empêcher qu'on puisse retrouver l'adresse dans le code source : tout est encodé et donc pas directement visible, mais ça n'empêche pas que le fonctionnement soit identique à un simple lien mailto: (et pour cause).
 
Dans Firefox, menu "Affichage", tu demandes "Code source de la page". Du coup, tu auras une page en format texte avec le tout le code. Et c'est là dedans qu'il faut retrouver l'adresse.
Quand je demande "code source de la page", l'adresse ne se trouve pas dans la page.

Par contre j'ai constaté qu'à l'endroit où aurait du se trouver "mailto:[email protected]", il y a une succession de "groupes de signes" constitué de
&# + 2 ou 3 chiffres séparés par des ;

Chaque "groupe de signe" correspond en fait à une lettre bien précise.
Les 7 premiers groupes par exemple correspondent à "mailto:" J'ai déduit cela du fait que les 2 premiers groupes se retrouvent plus loin là où auraient dû se trouver les lettres "m" et "a" de l'adresse mail.

Il suffirait donc, pour obtenir les adresses mails, de récupérer ces successions de groupes et de remplacer ensuite chaque "groupe de signe" par la lettre lui correspondant.

PS : c'est marrant parce que si, dans le message que je suis en train d'écrire, je tape le "groupe" correspondant à une lettre (par exemple &# + 109 + ; ) et que je fais "prévisualisation du message", c'est la lettre correspondante ("m" dans mon exemple) qui apparaît à la place du "groupe de signes".
 
Quand je demande "code source de la page", l'adresse ne se trouve pas dans la page.

Par contre j'ai constaté qu'à l'endroit où aurait du se trouver "mailto:[email protected]", il y a une succession de "groupes de signes" constitué de
&# + 2 ou 3 chiffres séparés par des ;
Il s'agit peut-être d'une protection (un peu rudimentaire ?) pour se protéger des captures en vue de s'éviter le spam (voir plus haut l'exemple du Caspam). Dans ces conditions, on peut supposer que c'est justement pour éviter les captures du genre de celle que tu es en train de tenter...
 
Il s'agit peut-être d'une protection (un peu rudimentaire ?) pour se protéger des captures en vue de s'éviter le spam (voir plus haut l'exemple du Caspam). Dans ces conditions, on peut supposer que c'est justement pour éviter les captures du genre de celle que tu es en train de tenter...
Je comprends.
Mieux vaut laisser tomber alors... je suppose.
Merci d'avoir pris le temps de te pencher sur le problème en tous cas.