A proposQuestions fréquentes
 
 
A propos de Nutch

Le projet Nutch a pour but le développement d'un moteur de recherche open source pour le web.

Bien que les moteurs de recherche soient indispensables pour naviguer sur Internet, leur nombre est en diminution. Ce qui aujourd'hui est un oligopole pourrait se changer rapidement en monopole, où une seule entreprise contrôlerait presque toute la recherche sur le web pour son profit commercial. Cela ne serait pas bon pour les utilisateurs d'Internet.

Nutch constitue une alternative transparente aux moteurs de recherche commerciaux. Seuls les résultats d'un système de recherche open source peuvent être garantis comme n'étant pas faussés (ou du moins le biais serait publique). Tous les principaux moteurs de recherche ont des formules de classement propriétaires et n'expliqueront jamais pourquoi telle ou telle page a été classée d'une certaine façon. De plus, certains moteurs de recherche choisissent les sites à indexer en échange d'une rémunération plus que sur la valeur intrinsèque du site. Nutch, lui, n'a rien à cacher et n'a aucune raison de fausser ses résultats ou son crawling si ce n'est pour donner à chaque utilisateur les meilleurs résultats possibles.

Nutch a pour but de permettre à quiconque de mettre en place un moteur de recherche web facilement et à moindre frais. Ce n'est pas une mince affaire. Pour y parvenir, le logiciel Nutch doit être capable de :

  • récupérer plusieurs milliards de pages par mois
  • maintenir un index de ces pages
  • faire des recherches sur cet index jusqu'à un millier de fois par seconde
  • offrir des résultats de très haute qualité
  • fonctionner à moindre coût

C'est un défi de taille. Si vous croyez dans les mérites de ce projet, merci d'y contribuer en tant que développeur ou bien en faisant un don.



    Creative Commons License
Except where otherwise noted,
this site is licensed under a Creative Commons License.
ca | de | en | es | fi | fr | hu | jp | ms | nl | pl | pt | sv | th | zh