Comment créer un script de scraping ?

337 views
Skip to first unread message

Jean-Philippe Encausse

unread,
Sep 23, 2012, 6:38:39 AM9/23/12
to sarah_d...@googlegroups.com

Soita

unread,
Oct 24, 2012, 2:53:13 AM10/24/12
to sarah_d...@googlegroups.com
Le scraping c'est pas toujours simple !!!....

Comment faire, par exemple, pour lire un Element d'un fichier xml sur le web ? Je m'explique.

Pour rendre SARAH plus vivante et interactive, le but finale serait de la joindre à un bot. C'est un moyen de personnaliser aisément SA SARAH pour répondre à son besoin domotique.

Il se trouve que l'interaction peut se faire via une commande http (à une adresse donnée) qui retourne le contenu d'un fichier xml.

exemple :

dans un navigateur, si je tape :

 http://site_web_du_bot/input="Bonjour"

Le navigateur affiche une page en réponse avec l'arbre du document xml :

<result status="0" botid="ec841e4e5e3497e1" custid="d2a28004a9f45ca3">
      <input>"quel est ton nom"</input>
      <that>Je m'appelle SARAH.</that>
</result>

Comment faire pour :

1 - envoyer la phrase dite (je pense via un xml GRAMMAR de SARAH : http://site_web_du_bot/input="Bonjour")

2 - faire dire à SARAH la phrase contenu entre les balises THAT du xml ( là, je cale !!!)

Jean-Philippe Encausse

unread,
Oct 24, 2012, 3:16:24 AM10/24/12
to sarah_d...@googlegroups.com
Alors on est plus dans le Scraping,

Le scraping c'est 
  • lancer un navigateur web virtuelle 
  • qui va ouvrir une page web
  • faire des actions sur la page
  • et lire le résultat
Dans ton cas c'est plus simple, mais je n'ai pas d'exemple :-P

Il faut que le Script NodeJS envoie une bête requete HTTP à un serveur de bot et parse le XML de la réponse avec un parseur XML. En général pour ce gnere de service c'est plutot du JSON que retourne les serveur (car plus simple à parser)

Pour la petite histoire j'ai prévu de faire un mini bot en me basant sur les phrase du bot ALICE



2012/10/24 Soita <soit...@gmail.com>


--
Vous recevez ce message, car vous êtes abonné au groupe Google Groupes SARAH.
Pour envoyer un message à ce groupe, adressez un e-mail à sarah_d...@googlegroups.com.

Visitez ce groupe à l'adresse http://groups.google.com/group/sarah_domotique?hl=fr .
 
 



--
Jean-Philippe Encausse - JLabs / R&D Jalios SA
Jp [at] encausse.net - http://www.encausse.net - http://arm-avocats.fr/
GTalk: jp.encausse [at] gmail.com - Twitter: @JpEncausse - ٩(̾●̮̮̃̾•̃̾)۶
Mob: +33 6 82 12 56 99  - Tel: +33 1 39 18 90 15
Do it Once, Use it Twice ~ Do it Twice, Make It Once ~ May the 4th be with you

Soita

unread,
Oct 24, 2012, 3:19:53 AM10/24/12
to sarah_d...@googlegroups.com
 ^^ C'est précisemment sur ce bot que mon exemple est basé. J'ai créé un bot de type ALICE.
Reply all
Reply to author
Forward
0 new messages