Les failles du Web : petite analyse d’un site web

Extrait de Sécurité informatique - Ethical Hacking

Un site Web est constitué d'une multitude de pages qui sont obligatoirement organisées suivant une arborescence. C'est le plan du site. Chaque page est généralement accessible par un lien hypertexte présent dans un menu ou sur une page. Chaque lien pointe vers une URL ou URI précisant l'endroit où se trouve la ressource. De plus, des médias sont souvent présents dans les pages et là encore il existe une URI pour chacun d'eux. Nous pouvons déjà à ce stade distinguer deux types de ressources, celles qui sont dans le même domaine que le site consulté et celles qui sont dans un autre domaine. Si nous voulons faire une cartographie du site, c'est-à-dire lister tous les éléments qui le composent, nous devons nous limiter au domaine où se trouve le site, car dans le cas contraire nous allons parcourir tout l'Internet, étant donné la multitude de liens qui existent entre les pages Web. Il est même parfois difficile de lister l'ensemble des pages d'un même domaine. En effet, depuis l'avènement de sites dynamiques, la construction des pages se fait en allant chercher de multiples informations sur de nombreuses sources. Ce phénomène multiplie le nombre de pages disponibles et celles-ci ne sont plus qu'une représentation de l'information. Par exemple, dans un site présentant des relevés météorologiques, les pages sont construites en allant chercher l'information dans la base de données des relevés. Si ceux-ci existent depuis 10 ans et que nous pouvons en demander une représentation par jour, mois ou année, le nombre de pages pouvant être généré devient impressionnant. Ce n'est donc pas la bonne méthode que de tenter d'analyser toutes les pages. En fait, il vaut mieux essayer d'analyser un comportement, il faut trouver le maximum d'informations que le site veut bien nous donner dans un fonctionnement normal. Nous pouvons alors plutôt parler de prise d'empreinte que de cartographie.

S'ABONNER
Egalement au sommaire n°: 148