Workflow de récupération de données

digisi

Membre confirmé
26 Avril 2020
43
0
36
Bonjour à tous,

Je me permets de vous écrire ce message, car j'effectue une tâche journalière qui consiste à copier et à coller dans un tableur (Numbers ou Excel) des données qui proviennent de sites internet.

Je souhaitais savoir s'il était possible à l'aide d'Apple script et Automator de mettre en place un scénario pour effectuer cette tâche qui me prend pas mal de temps dans la journée.

Ma seule contrainte, c'est que chaque site étant différent et que les informations qui m'intéressent ne sont pas forcément au même endroit.

Je pense que ce "scénario" devrait être adaptable à chacun de mes sites cible.

Du coup, je voulais savoir, selon vous quel serait le moyen de parvenir à ce résultat sans le faire manuellement ou me donner éventuellement une piste.

Merci d'avance pour vos réponses.

Bonne journée,
 
Bonjour,
tu peux d'inspirer de ce post .


Edit: sinon la commande shell Curl te permet de récupérer tout le site puis tu tris avec la commande grep ...
 
Dernière édition:
Bonjour,
tu peux d'inspirer de ce post .


Edit: sinon la commande shell Curl te permet de récupérer tout le site puis tu tris avec la commande grep ...
Merci pour ta réponse, j'ai commencé a adapté le script mais je rencontre un soucis.

Voila mon code :

Bloc de code:
tell application "Safari"
    open location "http://www.fspf.fr/la-federation/syndicats-departementaux/syndicat-pharmaciens-nord-pas-calais"
    delay 4
    set letexte to (the text of the front document)
end tell
set lesmots to words of letexte
set syndicatTitle to ""
set mail to ""
set bureau to ""
repeat with i from 1 to count of lesmots
    if item i of lesmots is "syndicat-title" then set syndicatTitleStart to i
    if item i of lesmots is "mail" then set mailStart to i
    if item i of lesmots is "row-syndicat-bloc-info" then set bureauStart to i
end repeat
repeat with j from syndicatTitleStart to mailStart - 1
    set syndicatTitle to syndicatTitle & item j of lesmots & " "
end repeat
repeat with j from mailStart to bureauStart - 1
    set mail to mail & item j of lesmots & " "
end repeat
repeat with j from bureauStart to count of lesmots
    set bureau to bureau & item j of lesmots & " "
end repeat
tell application "Microsoft Excel"
    activate
    open "/Users/sam/Desktop/TEST.xlsx"
    set theTable to the active sheet
    tell theTable
        set theValue of the last cell of the first column to syndicatTitle
        set theValue of the last cell of the second column to mail
        set theValue of the last cell of the third column to bureau
    end tell
end tell

Une image de mon tableur :

Capture d’écran 2023-01-13 à 17.01.18.png

Et voila l'erreur que j'ai :

Capture d’écran 2023-01-13 à 16.57.30.png Capture d’écran 2023-01-13 à 17.02.56.png

Aurais-tu une idée pour résoudre ce problème stp ?
 
Dernière édition par un modérateur:
Pourtant le message est clair !
ta ligne:
Bloc de code:
if item i of lesmots is "syndicat-title" then set syndicatTitleStart to i
Tu définis cette variable s'il trouve le mot "syndicat-title" , hors ce mot n'est pas dans le texte récupéré .

Edit:
pour voir le texte que tu récupères ajoute la ligne
Bloc de code:
display dialog letexte
juste après le 1er bloc (après le 1er "end tell")
 
Dernière édition:
Pourtant le message est clair !
ta ligne:
Bloc de code:
if item i of lesmots is "syndicat-title" then set syndicatTitleStart to i
Tu définis cette variable s'il trouve le mot "syndicat-title" , hors ce mot n'est pas dans le texte récupéré .

Edit:
pour voir le texte que tu récupères ajoute la ligne
Bloc de code:
display dialog letexte
juste après le 1er bloc (après le 1er "end tell")
Merci pour ton aide.
J'ai ajouté la ligne juste après le 1er bloc (après le 1er "end tell") et voila ce qui en ressort :
Capture d’écran 2023-01-13 à 18.33.12.png
Alors que mon objectif dans cet exemple, serait de récupérer dans le fichier excel :
  • Colonne Société : Syndicat des pharmaciens du Nord.......
  • Colonne Contact : Catherine.......
  • Colonne Email : [email protected]
 
Ta copie d'écran ne montre pas tout le texte
le texte complet est:
Bloc de code:
Skip to main menu Aller au contenu principal Skip to search
FSPF
Rss Youtube Twitter Facebook SE CONNECTER
FSPF
Ensemble, prescrivons l’avenir


ACCUEIL
LA FÉDÉRATION
Qui sommes-nous ?
Nos convictions
Le Bureau
Carte des Syndicats
Carte des Fédérations
Vie syndicale
Adhérer
FSPF SERVICES
Réalisations
Partenaires
Circulaires
Fiches pratiques
Questions fréquentes
Fil d'actus
Docuthèque
Liens utiles
MÉTIER PHARMACIEN
Médicaments & Produits de santé
Inscription et modification nouveau médicament
Inscription, modification, prise en charge LPP
Modifications de taux de remboursement
Règles d'exercice
Formation du pharmacien
Convention assurance maladie
Convention complémentaire santé
Politique générale
ENTREPRISE OFFICINE
Protection sociale du titulaire
Economie
Règles d’installation
Politique générale
Droit du travail
TOUR DE FRANCE
EXTRANET
Vous êtes ici
FSPF»La Fédération»Syndicats départementaux»Syndicat des pharmaciens du Nord et Pas-de-Calais
SYNDICAT DES PHARMACIENS DU NORD ET PAS-DE-CALAIS


 CARTE DE FRANCE   ADHÉRER   PLAN D'ACCÈS
Contact

Syndicat des pharmaciens du Nord et Pas-de-Calais

Adresse :
68/70 rue René LANOY
62300 LENS
Tél : 03 21 28 36 35
Fax : 03 21 28 13 36
Courriel : [email protected]
Bureau

Vice-présidente : Catherine BLOT
Search this site

VOTRE GLOSSAIRE
Ad'AP
Agenda d'accessibilité programmée
Plus de définitions

Nous suivre : Rss Youtube Twitter Facebook
Copyright © 2023 FSPF. Tous droits réservés.
Contact Crédits Mentions légales Données personnelles Politique Cookies
Nous utilisons des cookies afin de fournir une expérience utilisateur fluide et conviviale sur notre site.
En naviguant sur ce site, vous acceptez la politique d'utilisation des cookies. J'accepte  En savoir plus

Mais je comprend pas l'intérêt de faire un script pour récupérer ça, ce sont des données fixes qui ne changent pas tous les jours, et le script n'est pas utilisable tel quel sur un autre site qui sera structuré autrement.

Tu peux aussi récupérer tous le site avec la commande curl
dans le terminal tu ecris:
Bloc de code:
curl http://www.fspf.fr/la-federation/syndicats-departementaux/syndicat-pharmaciens-nord-pas-calais
tu envois, en retour tu auras au format HTTP le site, Un copier coller dans un fichier texte te permettra d'étudier comment est structuré le site et pouvoir y chercher les infos désirées

Mais je ne vois pas l'utilité du truc !
 
Ta copie d'écran ne montre pas tout le texte
le texte complet est:
Bloc de code:
Skip to main menu Aller au contenu principal Skip to search
FSPF
Rss Youtube Twitter Facebook SE CONNECTER
FSPF
Ensemble, prescrivons l’avenir


ACCUEIL
LA FÉDÉRATION
Qui sommes-nous ?
Nos convictions
Le Bureau
Carte des Syndicats
Carte des Fédérations
Vie syndicale
Adhérer
FSPF SERVICES
Réalisations
Partenaires
Circulaires
Fiches pratiques
Questions fréquentes
Fil d'actus
Docuthèque
Liens utiles
MÉTIER PHARMACIEN
Médicaments & Produits de santé
Inscription et modification nouveau médicament
Inscription, modification, prise en charge LPP
Modifications de taux de remboursement
Règles d'exercice
Formation du pharmacien
Convention assurance maladie
Convention complémentaire santé
Politique générale
ENTREPRISE OFFICINE
Protection sociale du titulaire
Economie
Règles d’installation
Politique générale
Droit du travail
TOUR DE FRANCE
EXTRANET
Vous êtes ici
FSPF»La Fédération»Syndicats départementaux»Syndicat des pharmaciens du Nord et Pas-de-Calais
SYNDICAT DES PHARMACIENS DU NORD ET PAS-DE-CALAIS


 CARTE DE FRANCE   ADHÉRER   PLAN D'ACCÈS
Contact

Syndicat des pharmaciens du Nord et Pas-de-Calais

Adresse :
68/70 rue René LANOY
62300 LENS
Tél : 03 21 28 36 35
Fax : 03 21 28 13 36
Courriel : [email protected]
Bureau

Vice-présidente : Catherine BLOT
Search this site

VOTRE GLOSSAIRE
Ad'AP
Agenda d'accessibilité programmée
Plus de définitions

Nous suivre : Rss Youtube Twitter Facebook
Copyright © 2023 FSPF. Tous droits réservés.
Contact Crédits Mentions légales Données personnelles Politique Cookies
Nous utilisons des cookies afin de fournir une expérience utilisateur fluide et conviviale sur notre site.
En naviguant sur ce site, vous acceptez la politique d'utilisation des cookies. J'accepte  En savoir plus

Mais je comprend pas l'intérêt de faire un script pour récupérer ça, ce sont des données fixes qui ne changent pas tous les jours, et le script n'est pas utilisable tel quel sur un autre site qui sera structuré autrement.

Tu peux aussi récupérer tous le site avec la commande curl
dans le terminal tu ecris:
Bloc de code:
curl http://www.fspf.fr/la-federation/syndicats-departementaux/syndicat-pharmaciens-nord-pas-calais
tu envois, en retour tu auras au format HTTP le site, Un copier coller dans un fichier texte te permettra d'étudier comment est structuré le site et pouvoir y chercher les infos désirées

Mais je ne vois pas l'utilité du truc !
Merci pour ta réponse je vais essayé de creuser !