Extraction mots clefs d'un texte

Bonjour,
savez vous s'il existe une bibliothèque de fonctions permettant à partir d'un texte, d'en extraire les mots clefs les plus représentatifs ?
ça m'étonnerai que ça existe comme ça, c'est tout une branche de l'informatique le data mining (tu le sais d'ailleurs, cf la filère de l'UTC* dans la branche GI).

À moins que je m'embrouille et que ça n'est pas de rapport :)


Mais sinon tu peux peutr-être lire avec des expressions régulières les mot qui reviennent le plus souvent, en faire une liste puis trier cette liste en éliminant les mot comme "le", "la" etc... puis retourner la liste final :)



*À propos je monte à Compiègne bientôt (de marseille ! :s) pour l'entretien d'admission à l'UTC, je t'envoie un MP pour te poser quelque question ;)
 
Tu as bien raison Pablo... et d'ailleurs, plus précisément, je cherche à faire du Web Mining.

Ta méthode est interressante, j'ai pensé aussi à une autre comptant les occurrences de chaque mot... seulement j'aimerais bien trouver quelque chose de plus fin, jouant un peu sur la sémantique. Ca existe apparemment en Perl (d'après une autre source) je vais voir si c'est adaptable...
 
Tu as bien raison Pablo... et d'ailleurs, plus précisément, je cherche à faire du Web Mining.

Ta méthode est interressante, j'ai pensé aussi à une autre comptant les occurrences de chaque mot... seulement j'aimerais bien trouver quelque chose de plus fin, jouant un peu sur la sémantique. Ca existe apparemment en Perl (d'après une autre source) je vais voir si c'est adaptable...
De toute façon Perl est le langage fait pour ça.

Je ne l'ai pas dis dans mon post, mais je pensais faire ceci en Perl.

Practical Extraction and Report Language ;)
 
Ce qui est formidable, c'est qu'on peut faire du Perl au sein d'un programme C/CPP ! Je suis donc un homme comblé. Même si je vais devoir commencer par me mettre au perl... :-S
http://www.perl.org/ (évidemment...)
http://en.wikipedia.org/wiki/Perl (évidemment aussi)
http://www.cpan.org/ ("No problem should ever have to be solved twice.")
http://www.oreilly.fr/catalogue/2841772535 (in-dis-pen-sable)
http://sylvain.lhullier.org/publications/intro_perl/ (tuto en français et bien foutu)


Que les portes du bonheur d'ouvrent à toi :rateau: