![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
Idée générale |
Le moteur de recherche suivant a été mis au point par moi-même et ne correspond donc qu'à une idée possible de moteur de recherche simple, ne gérant qu'un seul mot clé.
Le concept du fonctionnement de ce moteur est de créer une base de donnée contenant les mots clés de chaque page du site stockés dans des balises spéciales appelées méta tags. Un premier script permet donc de "scanner" l'ensemble des répertoires (et sous-répertoires) d'un site à la recherche de fichiers dont l'extension est .htm ou .html, puis de scruter leur contenu à la recherche des balises méta keywords (les mots-cés), title (le titre de la page), puis de stocker ces données, ainsi que l'emplacement du fichier sur le serveur, dans une base de données. Chaque fichier du site devant être indexer devra comporter les balises méta suivantes:
<head>
<META NAME="ROBOTS" content="all">
<META NAME="keywords" content="mot clé 1,mot cle 2,Mot clé 3, Mots clefs">
<META NAME="title" content="titre de votre page">
<title>titre de votre page</title>
</head>
La balises ROBOTS permet de spécifier si le fichier doit être indexé ou non.
Si vous ne voulez pas qu'une page de votre site soit indexée, il suffit alors de lui incorporer
la balise méta suivante:
<head>
<META NAME="ROBOTS" content="none">
</head>
Les balises précédentes ont l'avantage d'être utilisées aussi par les
principaux moteurs du marché (Yahoo!,Altavista,Voilà,...)
Dans un second temps, un script PHP permet d'exploiter la base de données ainsi créée en cherchant dans celle-ci le mot clé saisi par l'utilisateur par l'intermédiaire d'un formulaire.
Création de la base de données |
Le but est de créer une table comportant les champs nécessaires au stockage des enregistrements, c'est-à-dire contenant les champs suivants:
<html>
<head>
<title>Creation de la table</title>
</head>
<body>
<?php
$host = "Votre serveur de base de données";
$user = "Votre nom d'utilisateur";
$password = "Votre mot de passe";
$bdd = "Votre base de données sur le serveur";
mysql_connect($host, $user, $password) or die ("Connexion au serveur impossible");
// on choisit la bonne base
mysql_select_db($bdd) or die ("Connexion a la base impossible");
$query = "CREATE TABLE search (
lien varchar(128) NOT NULL,
keyword blob,
titre varchar(128),
PRIMARY KEY (lien)
)";
mysql_query($query) or die ("Erreur de modification de la table");
// on ferme la base
mysql_close();
?>
</body>
</html>
Remplissage de la base de données |
Le script suivant est le script principal du moteur, car c'est lui qui permet de parcourir l'arborescence du site à la recherche des fichiers HTML, de les scruter afin d déterminer s'ils doivent être ajoutés à la base et, le cas échéant, stocker les données nécessaires à leur exploitation.
Afin de garantir une certaine "confidentialité" des données, l'exécution du script est protégé par un mot de passe. Cela signifie qu'à la première utilisation, le script vérifie la présence de la variable $password, et affiche un formulaire d'authentification si celle-ci n'est pas déclarée. Le formulaire s'envoie les variables $password et $user qui vont permettre l'authentification de l'utilisateur.
Une fois l'utilisateur authentifié, le script va dans un premier temps supprimer les anciens enregistrements de la table, puis lancer une procédure ayant pour rôle de parcourir l'arborescence à la recherche de fichier HTML.
Cette procédure est récursive, c'est-à-dire qu'elle s'appelle elle-même. Elle admet en paramètre le répertoire dans lequel elle doit rechercher des fichiers, ainsi que le chemin d'accès relatif à ce répertoire. La procédure examine chaque enregistrement du répertoire.
<?php
if (!$password) {
echo "
<p>\n
<table bgcolor=#EFF2FB border=\"0\" cellspacing=\"0\" cellpadding=\"1\" width=100%>\n
<tr><td>\n
<a name=\"#auth\"><h2>Authentification!</h2></a>\n
</td></tr>\n
</table>\n
<p>\n
Veuillez fournir votre identifiant:<p>\n
<form action=\"scan.php3\" method=\"post\">\n
<table border=\"0\" cellspacing=\"0\" cellpadding=\"0\">\n
<tr>\n
<td>Nom d'utilisateur:</td><td><input type=text size=\"30\" name=\"user\"></td>\n
</tr>\n
<tr>\n
<td>Mot de passe:</td><td><input type=password size=\"20\" name=\"password\"></td>\n
</tr>\n
<tr>\n
<td colspan=\"2\"><input type=submit value=\"Go!\"></td>\n
</tr>\n
</table>\n
</form>\n";
}
else{
echo "
<p>\n
<table bgcolor=#EFF2FB border=\"0\" cellspacing=\"0\" cellpadding=\"1\" width=100%>\n
<tr><td>\n
<a name=\"#index\"><h2>Indexation du site en cours</h2></a>\n
</td></tr>\n
</table>\n
<p>\n";
$host = "Le serveur de base de données";
$bdd = "Votre base de données";
/* Connexion avec MySQL */
mysql_connect($host,$user,$password) or die ("Impossible de se connecter
au serveur de base de donnees");
mysql_select_db($bdd) or die ("Impossible d'accéder à la base $bdd");
$query = "DELETE FROM search";
mysql_query($query) or die ("Erreur de modification de la table");
function ScanDir($Directory,$Courant){
$MyDirectory = opendir($Directory);
while($Entry = readdir($MyDirectory)) {
if(is_dir($Entry)&& $Entry != "." && $Entry != "..") {
ScanDir($Entry,$Courant.$Entry."/");
}
else {
if (eregi(".htm",$Entry)){
$MetaTags = get_meta_tags($Directory."/".$Entry);
if ($MetaTags["robots"] == "all") {
$MetaKey = $MetaTags["keywords"];
$MetaKey = strtoupper($MetaKey);
echo "Meta($Directory/$Entry): $MetaKey
\n";
$MetaTitre = $MetaTags["title"];
echo "Meta($Directory/$Entry): $MetaTitre
\n";
$query = "INSERT INTO search (lien,keyword,titre)
VALUES(\"$Directory/$Entry\",\"$MetaKey\",\"$MetaTitre\")";
$mysql_result = mysql_query($query) or die ("Erreur
de modification de la table par la requete \"$query\"");
}
}
}
}
closedir($MyDirectory);
}
$open_basedir=".";
ScanDir(".","");
mysql_close();
}
?>
Exploitation de la base de données |
Pour exploiter la base de données, il faut dans un premier temps créer un formulaire permettant à vos utilisateurs de saisir un mot clé à chercher. Voici un exemple de formulaire simple leur permettant d'effectuer leur recherche:
<form method="post" action="search.php3">
Entrez un mot clé:<br>
<input type="text" name="Mot" size="15">
<input type="button" value="Rechercher" alt="Lancer la recherche!">
</form>
Voici le résultat de ce code HTML:
Puis il s'agit de créer le script PHP (le dernier) recherchant l'ensemble des enregistrements de la base de données contenant la chaîne entrée par l'utilisateur. Ce script est simple, il effectue dans un premier temps une requête SQL sélectionnant les enregistrements contenant la chaîne. Puis il affiche le nombre d'enregistrements retournés, et une boucle while exploite ces enregistrements et les affiche les uns à la suite des autres.
<?php
$host = "Votre serveur de base de données";
$user = "Votre nom d'utilisateur";
$password = "Votre mot de passe";
$bdd = "Votre base de données sur le serveur";
mysql_connect($host, $user, $password) or die ("Connexion au serveur impossible");
// on choisit la bonne base
mysql_select_db($bdd) or die ("Connexion a la base impossible");
echo "
<html>
<head>
<title>Résultat de la recherche</title>
</head>
<body>";
if (($Mot == "")||($Mot == "%")) {
// Si aucun mot clé n'a été saisi, le script demande à l'utilisateur
// de bien vouloir préciser un mot clé
echo "
Veuillez entrer un mot clé s'il vous plaît!
<p>";
}
else {
// On selectionne les enregistrements contenant le mot clé dans les keywords ou le titre
$query = "SELECT distinct count(lien) FROM search
WHERE keyword LIKE \"%$Mot%\"
OR titre LIKE \"%$Mot%\"
";
$result = mysql_query($query);
$row = mysql_fetch_row($result);
$Nombre = $row[0];
// Si aucun enregistrement n'est retourné, on affiche un message adéquat
if ($Nombre == "0") {
echo "
<h2>Aucun résultat ne correspond à votre recherche</h2>
<p>
";
}
// Sinon, on affiche le nombre d'enregistrements correspondant et les résultats eux-mêmes
else {
$query = "SELECT distinct lien,keyword,titre FROM search
WHERE keyword LIKE \"%$Mot%\"
OR titre LIKE \"%$Mot%\" ORDER by titre ASC";
$result = mysql_query($query);
// Si un seul enregistrement est trouvé, on affiche un message au singulier
if ($Nombre == "1") {
echo "
<a name=\"#resultat\"><h2>Résultat: Un article trouvé</h2></a>
<p>";
}
// Dans le cas contraire le message est au pluriel...
else {
echo "
<a name=\"#resultat\"><h2>Résultat: $Nombre articles trouvés</h2></a>
<p>";
}
while($row = mysql_fetch_row($result))
{
echo "
<p>\n
<b>$row[2]</b>\n
<br><a href=\"../$row[0]\">Visualiser l'article</a>\n
<p>\n
";
}
}
}
// on ferme la base
mysql_close();
?>
</body>
</html>
Remarques |
Le moteur présenté ci-dessus permet de faire une recherche basique, il est donc possible de lui ajouter des fonctionnalités, permettant par exemple de faire une recherche à partir de plusieurs mots-clés (comme les moteurs de recherche courants). D'autre part, les résultats sont affichées de manière basique les uns à la suite des autres. Il vous revient d'adapter la présentation des résultats à votre site, ainsi que celle du formulaire ou des messages d'avertissement...