1 Introduction
Depuis quelques années, nous avons connu un développement incroyable d'Internet. Créé dans un premier temps, dans un but militaire pour le partage d'informations de façon discrète entre différents points géographiques, il s'est banalisé, et est actuellement, de plus en plus, ouvert à tous. Il offre un certain nombre d'outils, tels que la messagerie ou le transfert de fichiers. Pourtant, pour la majorité des utilisateurs de ce «réseau», l'outil qui caractérise le mieux Internet, et qui a sûrement contribué à son succès, est en fait le WORLD WIDE WEB. Il est vrai que les médias simplifient, la plupart du temps, Internet par cet outil, qui n'est pourtant pas le seul.
C'est ainsi que nous avons suivi le formidable accroissement de cet instrument de diffusion d'informations, communément appelé «Web». Le nombre des serveurs et des sites n'a cessé d'augmenter, multipliant ainsi les données stockées. C'est pour cela, que l'accès à ces informations devient de plus en plus difficile. Ce problème est dû principalement au manque d'organisation initiale de la hiérarchie du Web. Même si une information est présente sur un site, sa consultation n'est pas toujours évidente, voir impossible, si l'adresse de serveur contenant ces données n'est pas connue au départ.
C'est donc, pour répondre à ce besoin de classer les informations du Web, que les premiers moteurs de recherche ont été développés. En fait, ces robots qui parcourent automatiquement les différents serveurs, peuvent avoir d'autres utilités. Mais le principal service reste aujourd'hui l'indexation.
Dans le cadre du stage de D.E.A., une autre utilisation des robots va être faite. En effet, nous allons nous intéresser à la politique de mise à jour des sites Web. Le principe de ce stage est, tout d'abord, de développer un robot qui rapatriera les dates de modification des serveurs, et ensuite, de faire une analyse de ces résultats pour tirer des conclusions sur cette mise à jour des sites étudiés.
Nous allons voir, dans la section suivante, dans quel état sont les recherches sur ce domaine. Une étude du travail effectué sera ensuite donnée dans les chapitres suivants.