récupérer une liste d'adresses e-mail d'un site.

CCharless

Membre confirmé
24 Avril 2005
177
1
Bonjour,

Je cherche à automatiser la tâche suivante :

Il y a une page internet sur laquelle sont repris une centaine de lien vers des "fiches individuelle".

Sur chaque fiche individuelle se trouve un lien "envoyer un e-mail" qui, lorsqu'on clique dessus, ouvre un nouveau message dans le client mail en remplissant le champ "envoyer à" avec l'adresse mail de la personne dont on est dans la "fiche".

J'aimerais réunir les adresses e-mail de toutes ces fiches sur un seul document.

J'ai essayé avec automator et scripts mais je ne suis pas spécialiste et je n'y suis pas arrivé.

Quelqu'un pourrait-il me guider ? (si la chose est possible)

Merci.
 

Pascal 77

ex modéraptor
Club MacG
28 Octobre 2004
44 525
3 548
68
Sous la limite KT
A part les "copier/coller" un par un à la mimine, je ne vois pas !
 

CCharless

Membre confirmé
24 Avril 2005
177
1
J'ai bien réussi, grâce à automator, à récupérer en une fois tous les url des "fiches". Mais de là, je bloque : impossible d'automatiser la récupération les adresses mails vers lesquelles pointent les lien "mailto:xxx". Que veux tu dire par
Leopard sait le faire dans les mails...
mais Tiger :nailbiting:
J Il sair faire quoi exactement Leopard dans les mails, que ne sait pas faire Tiger ?
 

CCharless

Membre confirmé
24 Avril 2005
177
1
Regarde la vidéo (la deuxième partie).
Ben oui c'est sympa : mail reconnait les adresses et numéros de téléphone comme tels mais je vois mal en quoi ça concerne mon problème :
J'ai une page internet sur laquelles se trouvent un centaine de liens, chaqu'un de ces liens pointe vers une page qui, elle-même contient (entre autre) un lien de type "adresser un courrier éléctronique à blablabla@blabla.xx", ce sont toutes ces adresses mails que je voudrais récupérer en une fois.
 

da capo

abonné absent
Club MacG
12 Août 2001
17 433
3 685
Je reprends :

tu as une page internet donc tu as accès au code html ?
et tu veux donc épurer tout ce code pour ne conserver que les xxxxx@xxx.xxx ?

ça devrait être possible avec des expressions régulières dans un éditeur de texte… A réfléchir.
 

etudiant69

Vétéran
Club MacG
6 Mai 2004
7 931
715
Lyon
Ben si le système peut identifier une adresse web du reste, il est alors d'agir avec elle. Par ex. l'ajouter au carnet, ou développer un module automator à ce sujet... :rolleyes:

Il est vrai qu'en atttendant :nailbiting: :(
 

CCharless

Membre confirmé
24 Avril 2005
177
1
Ben si le système peut identifier une adresse web du reste, il est alors d'agir avec elle. Par ex. l'ajouter au carnet, ou développer un module automator à ce sujet... :rolleyes:

Il est vrai qu'en atttendant :nailbiting: :(
Oui mais dans mon cas il ne s'agit pas d'agir avec une adresse web mais avec un lien "mailto:" (qui n'est pas reconnu comme lien url (seul type de lien reconnu par automator)).
Bref... Y a pas l'air d'avoir de solution, à part, comme dit Pascal 77 ""copier/coller" un par un à la mimine."
si quelqu'un a encore une idée...
 

BernardRey

Membre d’élite
Club MacG
20 Janvier 2004
1 260
60
Y a pas l'air d'avoir de solution, à part, comme dit Pascal 77 ""copier/coller" un par un à la mimine."
si quelqu'un a encore une idée...
M'étonnerait bien qu'un AppleScript ne soit pas capable de reconnaître le caractère @ (ou la chaîne "mailto:") dans un texte, de récupérer le mot dans lequel il est contenu et d'en supprimer les 7 premiers caractères.

Je ne suis pas vraiment capable de donner les instructions comme ça de tête, je regarderai ça de plus près ce soir si j'ai le temps. Est-ce que tu as fait quelques recherches de ce côté-là (en particulier sur le forum dédié) ?
 

CCharless

Membre confirmé
24 Avril 2005
177
1
M'étonnerait bien qu'un AppleScript ne soit pas capable de reconnaître le caractère @ (ou la chaîne "mailto:") dans un texte, de récupérer le mot dans lequel il est contenu et d'en supprimer les 7 premiers caractères.
Ce serait super si c'était possible en effet. Je rappelle que le texte "mailto:www@www.xx" n'apparaît pas directement, c'est un lien.

Je ne suis pas vraiment capable de donner les instructions comme ça de tête, je regarderai ça de plus près ce soir si j'ai le temps.
Merci.

Est-ce que tu as fait quelques recherches de ce côté-là (en particulier sur le forum dédié) ?
Oui mais je n'y ai rien trouvé qui puisse m'aider...
 

BernardRey

Membre d’élite
Club MacG
20 Janvier 2004
1 260
60
Ce serait super si c'était possible en effet. Je rappelle que le texte "mailto:www@www.xx" n'apparaît pas directement, c'est un lien.
Comment ça ? Qu'est-ce qui apparaît alors dans le fichier source ?

Pour ce que j'en sais, le moyen de faire apparaître une adresse dans une page sans que ça figure dans le fichier source, c'est soit de coller une image affichant l'adresse (basique mais efficace et à peu près imparable, mais ça oblige à saisir à la main, en effet) soit de passer par un script qui permet (justement) d'encoder la commande de façon à ce que les robots des spammeurs ne puissent pas récupérer les adresses (voir l'outil du Caspam, par ex.) Ce n'est tout de même pas ça que tu cherches à faire ?
 

CCharless

Membre confirmé
24 Avril 2005
177
1
Comment ça ? Qu'est-ce qui apparaît alors dans le fichier source ?
Sur la page, il est écrit : "envoyer un email". Quand on clique dessus, un mail s'ouvre avec l'adresse mail dans le champ "à". si je passe mon curseur sur "envoyer un email" et que je regarde la barre d'état (tout en dessous de fenêtre), il est écrit "addresser un courier éléctronique à www@www.xx" (dans Safari) ou "mailto:www@www.xx" (dans FireFox)

Pour ce que j'en sais, le moyen de faire apparaître une adresse dans une page sans que ça figure dans le fichier source, c'est soit de coller une image affichant l'adresse (basique mais efficace et à peu près imparable, mais ça oblige à saisir à la main, en effet) soit de passer par un script qui permet (justement) d'encoder la commande de façon à ce que les robots des spammeurs ne puissent pas récupérer les adresses (voir l'outil du Caspam, par ex.) Ce n'est tout de même pas ça que tu cherches à faire ?
Ben j'en sais rien... C'est un script "mailto:" ?
 

BernardRey

Membre d’élite
Club MacG
20 Janvier 2004
1 260
60
Sur la page, il est écrit : "envoyer un email". Quand on clique dessus, un mail s'ouvre avec l'adresse mail dans le champ "à". si je passe mon curseur sur "envoyer un email" et que je regarde la barre d'état (tout en dessous de fenêtre), il est écrit "addresser un courier éléctronique à www@www.xx" (dans Safari) ou "mailto:www@www.xx" (dans FireFox)
Oui, ça c'est le comportement dans la fenêtre du navigateur. Ce qu'il faut voir, car c'est ce que tu peux (éventuellement) récupérer, c'est ce qu'il y a dans le fichier source. Dans Firefox, menu "Affichage", tu demandes "Code source de la page". Du coup, tu auras une page en format texte avec le tout le code. Et c'est là dedans qu'il faut retrouver l'adresse. Si tu fais, par exemple Pomme-F et que tu recherches le caractère "@" ou la chaîne "mailto:" tu devrais retrouver le texte correspondant à l'adresse. Et c'est exactement ce que pourra faire un outil du genre AppleScript.

Ben j'en sais rien... C'est un script "mailto:" ?
Pas forcément, justement. Regarde comment fonctionne l'outil du Caspam, précisément pour empêcher qu'on puisse retrouver l'adresse dans le code source : tout est encodé et donc pas directement visible, mais ça n'empêche pas que le fonctionnement soit identique à un simple lien mailto: (et pour cause).
 

CCharless

Membre confirmé
24 Avril 2005
177
1
Dans Firefox, menu "Affichage", tu demandes "Code source de la page". Du coup, tu auras une page en format texte avec le tout le code. Et c'est là dedans qu'il faut retrouver l'adresse.
Quand je demande "code source de la page", l'adresse ne se trouve pas dans la page.

Par contre j'ai constaté qu'à l'endroit où aurait du se trouver "mailto:xxx@xxx.xx", il y a une succession de "groupes de signes" constitué de
&# + 2 ou 3 chiffres séparés par des ;

Chaque "groupe de signe" correspond en fait à une lettre bien précise.
Les 7 premiers groupes par exemple correspondent à "mailto:" J'ai déduit cela du fait que les 2 premiers groupes se retrouvent plus loin là où auraient dû se trouver les lettres "m" et "a" de l'adresse mail.

Il suffirait donc, pour obtenir les adresses mails, de récupérer ces successions de groupes et de remplacer ensuite chaque "groupe de signe" par la lettre lui correspondant.

PS : c'est marrant parce que si, dans le message que je suis en train d'écrire, je tape le "groupe" correspondant à une lettre (par exemple &# + 109 + ; ) et que je fais "prévisualisation du message", c'est la lettre correspondante ("m" dans mon exemple) qui apparaît à la place du "groupe de signes".
 

BernardRey

Membre d’élite
Club MacG
20 Janvier 2004
1 260
60
Quand je demande "code source de la page", l'adresse ne se trouve pas dans la page.

Par contre j'ai constaté qu'à l'endroit où aurait du se trouver "mailto:xxx@xxx.xx", il y a une succession de "groupes de signes" constitué de
&# + 2 ou 3 chiffres séparés par des ;
Il s'agit peut-être d'une protection (un peu rudimentaire ?) pour se protéger des captures en vue de s'éviter le spam (voir plus haut l'exemple du Caspam). Dans ces conditions, on peut supposer que c'est justement pour éviter les captures du genre de celle que tu es en train de tenter...
 

CCharless

Membre confirmé
24 Avril 2005
177
1
Il s'agit peut-être d'une protection (un peu rudimentaire ?) pour se protéger des captures en vue de s'éviter le spam (voir plus haut l'exemple du Caspam). Dans ces conditions, on peut supposer que c'est justement pour éviter les captures du genre de celle que tu es en train de tenter...
Je comprends.
Mieux vaut laisser tomber alors... je suppose.
Merci d'avoir pris le temps de te pencher sur le problème en tous cas.