Moteur de recherche

noAr

Membre actif
6 Décembre 2002
443
50
49
Paname
Hello,

Quelqu'un connait-il un moteur de recherche qui ne prendrait pas en compte les sites marchands ?

Je connais les systèmes de préférences customisables mais il y a trop de sites.

Existe-t-il une sorte de liste des sites marchands comparable à celles relevant tous les serveurs de spam ?

Cordialement,



noAr
 
WebOliver a dit:
Il s'agit plutôt d'un répertoire, non exhaustif, ce que tu recherches. Comme le faisait à l'époque Yahoo!

Pas exactement. Je voudrais faire une recherche "ouverte".
Pas trouver un listing des design > agence > france > etc.

En fait pas une recherche "juste de" une recherche "sans".
Je me fais comprendre ? :)

Mais bon. Je sens que je trouverais pas. :)
 
noAr a dit:
Pas exactement. Je voudrais faire une recherche "ouverte".
Pas trouver un listing des design > agence > france > etc.

Mais bon. Je sens que je trouverais pas. :)

Comment un moteur de recherche pourrait-il de lui-même ne pas recenser certains sites, en l'occurence des sites marchands, sans intervention humaine. Et dans ce cas, on se retrouve avec un index de site, non exhaustif.
 
En fait le problème n'est pas que les sites marchands soient référencés mais qu'ils apparaîssent systématiquement et sur des pages et des pages. Bref l'information intéressante est noyée au milieu de commercial ... mais c'est ça le business :( Pauvre Mr Google, il faut bien qu'il vive. :D
Pour répondre à la question, il faudrait trouver de bonnes âmes qui fassent un moteur de recherche non commercial ... :confused: Bonne chance, moi j'en connais pas. :zen:
 
Un moteur de recherche trouve et indexe TOUS les sites (enfin c'est son boulot normalement...)? C'est pas le problème d'être commercial ou non...
Surtout que l'indexation des pages se fait automatiquement par un robot.
La seule solution est d'utiliser la syntaxe de recherche et les exclusions pour affiner une recherche (éventuellement en excluant les noms des principaux marchands et comparateurs de prix connus). Ci dessous, un petit résumé pour Google :
http://outils.abondance.com/google.html

Mais c'est vrai que c'est de plus en plus difficile.
 
Le problème n'est pas d'être indexé ou non, mais l'ordre dans lequel sont affichés les résultats. Google met les sites commerciaux en tête, ce qui n'était pas le cas il y a quelques années quand il ne dominait pas encore le marché. :siffle:
 
zoulou03200 a dit:
Un moteur de recherche trouve et indexe TOUS les sites (enfin c'est son boulot normalement...)? C'est pas le problème d'être commercial ou non...
Surtout que l'indexation des pages se fait automatiquement par un robot.
La seule solution est d'utiliser la syntaxe de recherche et les exclusions pour affiner une recherche (éventuellement en excluant les noms des principaux marchands et comparateurs de prix connus). Ci dessous, un petit résumé pour Google :
http://outils.abondance.com/google.html

Mais c'est vrai que c'est de plus en plus difficile.

l'annuaire DMOZ est pas mal dans son genre vu que l'acceptation se fait humainement, en théorie il n'y a que les bons sites .. ;)
 
ntx a dit:
Le problème n'est pas d'être indexé ou non, mais l'ordre dans lequel sont affichés les résultats. Google met les sites commerciaux en tête, ce qui n'était pas le cas il y a quelques années quand il ne dominait pas encore le marché. :siffle:

L'ordre dans lequel sont affichés les résultats (positionnement) dépend du pagerank.
Pour qu'un pagerank soit élevé, il faut que la "notoriété" du site soit importante. Cela dépend principalement des liens (backlinks) : nombre, avec qui, quelles pages liées....
Le problème, c'est que souvent seuls les (gros) sites commerciaux ont les moyens de faire travailler à temps plein des agences pour vérifier, améliorer et optimiser le référencement.
De plus, on ne prête qu'aux riches. C'est à dire qu'un gros site très connu a plus de chances d'obtenir des bons liens qu'un petit site perso qui démarre.
C'est comme ça qu'on retrouve les poids lourds : ebay, kelkoo, monsieurprix, ciao...
installés dans les premières pages.
Le souci de Noar n'est pas isolé. Les algorithmes utilisés par Google (et les autres...) commencent à prouver leurs limites.
Peut être que les prochaines technologies (recherches en langage naturel) amélioreront ça...
 
Oui oui pour la distinction annuaire/moteur.
Oui oui pour la logique Gogole et son Pagerank.
Oui oui.

Mais on filtre bien le contenu pour adulte.
On se sert de listes prédéfinies pour exclure certains serveurs dans les filtres antispam.

Donc bon.

On pourrait appliquer quelque chose de ces genre là réunis pour filtrer le contenu commercial.

Et que tartenpion, sous pretexte qu'il est une forme de vie supérieure à base de carbone décide à ma place si le site est bon ou pas, ne me convient pas. Gogole sait le faire pour les chinois qui lancent la requête Tien An Men. Et ces "bons sites" ne me satisfont pas.

J'imaginais tout à l'heure une soirée ou dès que quelqu'un ouvre la bouche et parle de "fougère", trente types débarquent et se jettent sur la personne pour lui demander s'il en veut ou s'i il en a à vendre.

C'est devenu ca internet. En tout cas dans la perception qu'on peut en avoir sur deux-trois requêtes de base ou le seul truc qui semble occuper le réseau est de vendre ou d'acheter l'objet de la requête.

J'ai eu un exemple aujourd'hui qui m'a passablement irrité. D'ou ce thread. Je me suis rappelé d'il y a quelques années maintenant ou Babel semblait encore avoir posé un permis de construire.

…

Enfin bon, si quelqu'un se rendait compte que cela peut particulariser et générer du trafic sur un moteur qui ne ferait que proposer cette option ce serait pas mal…


Bonne nuit.

noAr
 
noAr a dit:
C'est devenu ca internet. En tout cas dans la perception qu'on peut en avoir sur deux-trois requêtes de base ou le seul truc qui semble occuper le réseau est de vendre ou d'acheter l'objet de la requête.
Malheureusement oui, et ce la ne va pas arranger. Il est peut être temps de mettre un route un autre internet, pour ceux dont la préoccupation principale n'est pas de vendre mais de communiquer ce qui était le but d'internet au départ :(
 
ntx a dit:
Il est peut être temps de mettre un route un autre internet, pour ceux dont la préoccupation principale n'est pas de vendre […]

Cette recherche de base sur boîtier CD ramène 4 700 000 sites.

Quand on vire acheter, vendre, boutique, catalogue etc. on arrive à cela.

Soit 400 000 réponses. et environ 10% de ce que Gogole ramenait initialement.

Et sachant que c'est pas encore vraiment clean. Alors d'accord, on peut se taper à chaque fois 70 mots-clef à exclure. Mais combien de sites non exclusivement marchands (comme du comparatif sérieux de matériel qui incluerait une boutique par exemple) ont été violemment saqués au passage ?

Alors oui, il me semble que le web est un peu défiguré…


Cordialement,
noAr
 
noAr a dit:
Oui oui pour la distinction annuaire/moteur.
Oui oui pour la logique Gogole et son Pagerank.
Oui oui.

Mais on filtre bien le contenu pour adulte.
On se sert de listes prédéfinies pour exclure certains serveurs dans les filtres antispam.

Donc bon.

On pourrait appliquer quelque chose de ces genre là réunis pour filtrer le contenu commercial.

Et que tartenpion, sous pretexte qu'il est une forme de vie supérieure à base de carbone décide à ma place si le site est bon ou pas, ne me convient pas. Gogole sait le faire pour les chinois qui lancent la requête Tien An Men. Et ces "bons sites" ne me satisfont pas.

J'imaginais tout à l'heure une soirée ou dès que quelqu'un ouvre la bouche et parle de "fougère", trente types débarquent et se jettent sur la personne pour lui demander s'il en veut ou s'i il en a à vendre.

C'est devenu ca internet. En tout cas dans la perception qu'on peut en avoir sur deux-trois requêtes de base ou le seul truc qui semble occuper le réseau est de vendre ou d'acheter l'objet de la requête.

J'ai eu un exemple aujourd'hui qui m'a passablement irrité. D'ou ce thread. Je me suis rappelé d'il y a quelques années maintenant ou Babel semblait encore avoir posé un permis de construire.

…

Enfin bon, si quelqu'un se rendait compte que cela peut particulariser et générer du trafic sur un moteur qui ne ferait que proposer cette option ce serait pas mal…


Bonne nuit.

noAr

Eh oui.... internet est devenu un vaste supermarché !!
Vous pensez vraiment que Google traite 8 milliards de pages indexées sans que cela ne coût un centime ? Et comment croyez vous qu'ils gagnent de l'argent ? avec Adwords et Adsense, c'est à dire, la pub...
Vous pensez que s'ils donnent la possibilité de "supprimer" les sites marchands d'une recherche, ça plaira à leurs gros clients annonceurs (ebay, kelkoo, monsieurprix....) ?
Et c'est pareil pour yahoo et les autres.
Le développement et la gestion de technologies de recherches, le stockage de millards de pages, les infrastructures informatiques coûtent TRES cher.
Internet est devenu beaucoup trop gros pour qu'une approche "désintéressée" soit possible.
A mon avis, pour ce que tu cherches, les annuaires peuvent répondre plus efficacement que les moteurs de recherche.
 
Pour compléter, il y a une notion qui est assez intéressante : l'internet caché.
C'est la partie immergée de l'iceberg, celle qu'on ne voit jamais et qui est inaccessible par les moteurs (car souvent non indexée). Et exempte de toute logique commerciale.
Je sais que des algorithmes ont été développés par des chercheurs pour cela, et que des moteurs spécifiques existent.
Mais là, il faudrait un vrai spécialiste ;)
 
zoulou03200 a dit:
Pour compléter, il y a une notion qui est assez intéressante : l'internet caché.
C'est la partie immergée de l'iceberg, celle qu'on ne voit jamais et qui est inaccessible par les moteurs (car souvent non indexée). Et exempte de toute logique commerciale.
Je sais que des algorithmes ont été développés par des chercheurs pour cela, et que des moteurs spécifiques existent.
Mais là, il faudrait un vrai spécialiste ;)

j'ai aussi entendu parler du net caché, de ces sites 'secrets' ou on parle de vrai chose .. personne aurait un lien vers unn exemple ? :D
 
zoulou03200 a dit:
Le développement et la gestion de technologies de recherches, le stockage de millards de pages, les infrastructures informatiques coûtent TRES cher.

Il y a une réponse extrèmement simple à cette vision souveraine : cela n'a pas toujours été le cas.
Tu confonds simplement le fait que cela soit devenu un énorme business avec le fait que cela soit nécessairement un aussi gros businness.

Ce ne sont pas les gros groupes internationaux machins qui ont inventé internet. Le web a une histoire. Les choses n'ont pas été comme elles le sont de toute éternité.

Pour enfoncer le clou, si cela coûte si cher a monsieur Gogole d'indexer 90% de pages desquelles je me secoue, c'est son problème, ce système n'est pas économique… :) Il prend les risques qu'il veut et je m'en tape. Je vais pas me mettre à plaindre mon problème. Il y avait déjà des pauvres petits malheureux de moteurs de recherche sans le sou avec moins de parasitage commercial tout à fait efficaces avant lui. Gogole n'a pas inventé le moteur de recherche non plus… Cela n'a grosso modo rien à voir avec le fait de proposer à l'utilisateur d'avoir accès aux ressources du réseau hors "acheter/vendre".

Quand au web caché, j'avoue qu'à part flatter certains penchants voyeuristes, je ne vois guère l'intérêt. J'ai moi-même certains contenus en ligne ainsi "cachés" et ce sont simplement des contenus disponibles sur invitation (aurte chose mais en rapport, regardez hell.com, par exemple, des vieux de la vieille (ces gens m'ont fait pleurer – comme entropy8zuper ou antiorp aussi, bref, autre sujet, mais j'étais partie sur une vague nostalgie, j'avoue…)).

Etre soi-même son média ne signifie pas nécessairemnt être un média de masse.

Qu'un couillon se croit malin en faisant l'indexation de ce type de contenu m'évoque une simple, bête et méchante atteinte à la vie privée.

Indépendamment des moteurs de reherche, il y a eu aussi des navigateurs un peu particuliers autour de ces thématiques d'une exploration différente du réseau et de son contenu. Là aussi on retrouve des "figures imposées" de ce que doit être un navigateur web et de la manière dont il doit "rendre compte" de ce qu'il mouline. Il suffit de voir autre chose pour ce rendre compte quelquefois des choix qui ont prédéterminé notre perception. Là non plus, cela n'a pas toujours été la seule possiblité et ce qui nous apparait est déjà marqué par un choix et non une nécessité (peut-être pas notre choix d'ailleurs, mais TINA… :) ).


Bonne nuit,

noAr
 
Noar, tu peux râler contre ce qu'est devenu le web, tu peux râler contre le "méchant" Google, il n'empêche que si Google a pris cette importance, c'est aussi parce que c'est un des plus efficaces.
Je peux t'assurer que quand Google est arrivé en 98, par rapport aux moteurs existants à l'époque, c'était le jour et la nuit !! Il reste encore un des meilleurs...
Mais un moteur de recherche n'a pas vocation à répondre à TOUS les besoins.
Encore une fois, pour ce que tu veux, les annuaires sont beaucoup plus efficaces.
De la même façon, quand je cherche le prix d'un disque dur, je ne cherche pas dans Google, je vais directement dans les comparateurs de prix.
Le Web offre aujourd'hui les sources d'information que l'on veut, il suffir de choisir le bon média.
Maintenant, si le sujet, c'est de refaire le modèle économique du web et le monde par la même occasion, c'est un autre sujet...;)
 
zoulou03200 a dit:
Noar, tu peux râler contre ce qu'est devenu le web, tu peux râler contre le "méchant" Google, il n'empêche que si Google a pris cette importance, c'est aussi parce que c'est un des plus efficaces.
Je peux t'assurer que quand Google est arrivé en 98, par rapport aux moteurs existants à l'époque, c'était le jour et la nuit !! Il reste encore un des meilleurs...
Mais un moteur de recherche n'a pas vocation à répondre à TOUS les besoins.
Encore une fois, pour ce que tu veux, les annuaires sont beaucoup plus efficaces.
De la même façon, quand je cherche le prix d'un disque dur, je ne cherche pas dans Google, je vais directement dans les comparateurs de prix.
Le Web offre aujourd'hui les sources d'information que l'on veut, il suffir de choisir le bon média.
Maintenant, si le sujet, c'est de refaire le modèle économique du web et le monde par la même occasion, c'est un autre sujet...;)

un moteur de recherche n'est vraiment 'génial' que lorsqu'il n'est pas connu ..
google bien que toujours bon devient de moins en moins précis sur les requétes ...
l'algorythme doit continuellement mis a jour pour contrer les techniques des pirates du referencement .. bref ... :rolleyes:
 
zoulou03200 a dit:
Noar, tu peux râler contre ce qu'est devenu le web, tu peux râler contre le "méchant" Google,
Cher Zoulou#
Je peux effectivement râler si j'en ai envie. C'est tout à fait juste. Et si s'en est une, merci de ton autorisation bienveillante.

Par ailleurs, je n'ai jamais parlé d'un "méchant" Gogole, tu as dû lire quelqu'un d'autre. Ce n'est pas très grave, l'objet du thread n'est pas là.

zoulou03200 a dit:
il n'empêche que si Google a pris cette importance, c'est aussi parce que c'est un des plus efficaces.
Il n'empêche que j'en doute justement quand je vois 90% de résultats sans pertinence. Tu te laisse impressionner par la quantité.

zoulou03200 a dit:
Je peux t'assurer que quand Google est arrivé en 98, par rapport aux moteurs existants à l'époque, c'était le jour et la nuit !!
Me voila bien rassuré. Toutefois, avec tout le respect du a ton immense sagesse j'étais également né à l'arrivée de Google et je "pratiquais" Internet depuis déjà quelques temps…

zoulou03200 a dit:
Encore une fois, pour ce que tu veux, les annuaires sont beaucoup plus efficaces.
C'est faux. D'ou ce thread.

zoulou03200 a dit:
De la même façon, quand je cherche le prix d'un disque dur, je ne cherche pas dans Google, je vais directement dans les comparateurs de prix.
Mon souci est de tomber sur 10 pages de comparateurs de prix quand je n'ai rien à acheter.

zoulou03200 a dit:
Le Web offre aujourd'hui les sources d'information que l'on veut, il suffir de choisir le bon média.
zoulou03200 a dit:
Mais un moteur de recherche n'a pas vocation à répondre à TOUS les besoins.
Intéressant.
Depuis maintenant quelques petites dizaines d'années, notre société de consommation s'emploie à répondre de manière toujours plus particularisée au besoin du consommateur. Peut-être roules-tu dans une vieille Ford noire comme tous tes collègues, je comprendrais… :)

zoulou03200 a dit:
Maintenant, si le sujet, c'est de refaire le modèle économique du web et le monde par la même occasion, c'est un autre sujet...;)
L'objet de ce thread était l'option – intégrée ou non, à un moteur de recherche existant ou non – permettant de filtrer le contenu purement commercial. Je ne vois trace nulle part d'un modèle économique à refondre quelconque… Là aussi tu dois confondre… Décidément… C'est dommage de devoir perdre le fil comme ca…

Je n'ai, par ailleurs, remarqué aucune révolution dans notre modèle économique des dix dernières années, informe moi si j'ai trop peu lu la presse. Il devait bien s'agir d'un internet assez proche de celui que nous connaissons, et donc du même sujet…

Dans ce cas, il n'y a rien de bien bouleversant à se demander si un filtre pour le contenu commercial ne répondrait pas à l'attente de nombreux utilisateurs d'internet. Rassure-toi il ne s'agit pas de t'empêcher d'acheter ce que tu veux sur ces fameux comparateurs de prix…

Mais j'imagine bien que l'objet reste essentiellement de noyer le poisson, changer de sujet, troller etc.

Passons donc à autre chose.


PS : N'hésites pas à ouvrir ton "autre sujet", je tenterais volontiers de caser mon option de filtre dans la discussion !
 
Je crois qu'on t'a expliqué dès le début que ça n'existait pas et que de toute façon ce n'est pas le but recherché par les moteurs.
J'avais pensé naïvement qu'on pouvait continuer la discussion sur ce sujet, qui n'est pas inintéressant.
Mais rien ne t'empêche bien évidemment d'être persuadé du contraire.