ECOLE NATIONALE SUPERIEURE

DES TECHNIQUES INDUSTRIELLES

ET DES MINES D'ALES

6, avenue de Clavières

F - 30319 ALES CEDEX

Tél. (33) 66 78 50 00

Service Bureautique & Réseaux

Formation à l'Internet
version 1.0

du 12 juin 1995

Laurent PELLISSIER

lpelliss@ema.fr

Sommaire

1. L'Internet

Ce document a pour objet de présenter rapidement l'Internet au travers de sa mise en oeuvre et de ses fonctionnalités. L'utilisation des nombreux programmes informatiques qui permettent l'accès à l'Internet ne fait pas l'objet de ce document. De même la présentation technique d'Internet restera minime, seuls seront présentés les concepts importants qui permettront d'utiliser plus intelligemment l'Internet.

1.1. Origines et perspectives

1.1.1. Origines

Depuis quelques mois on parle beaucoup de l'Internet aussi bien dans la presse non spécialisée en informatique qu'à la radio ou à la télévision. Pourtant l'Internet est né au milieu des années 70 de l'interconnexion de plusieurs réseaux du DOD[1] américain. Ce réseau était alors appelé ARPAnet.

Au début, ARPAnet était un projet de recherche militaire dont l'objectif était de créer un réseau informatique expérimental qui pourrait résister à des dommages partiels (tel que la destruction de plusieurs noeuds). Le réseau devait donc pouvoir de façon automatique :

Pour ces raisons, l'Internet est fondé sur la commutation de paquets. L'information à transmettre est donc découpée en paquets de petites tailles qui transitent alors de noeuds en noeuds de l'émetteur vers le destinataire. Les chemins empruntés par chaque paquet d'un même message pouvant être différents, les paquets peuvent alors avoir un séquencement à l'arrivée différent de celui qu'ils avaient au départ. Le destinataire se charge alors de façon automatique et transparente pour l'utilisateur de rétablir l'ordre des paquets.

On parle souvent un peu abusivement de l'Internet comme d'un réseaux. En fait Internet est un réseau de réseau. Internet signifie d'ailleurs INTERconnection of NETworks.

Rapidement le besoin de relier les différents réseaux informatiques des centres de recherches publics américains se fit sentir. Le développement des réseaux locaux Ethernet, suivi de l'apparition de plus en plus nombreuses des stations de travail UNIX dans les universités imposa l'utilisation du protocole IP.

A la fin des années 80, la National Science Foundation (NSF) décida de relier les réseaux de ses 5 principaux centres de recherches entre eux. Le réseau NSFNET résultant utilisa le même protocole IP qu'ARPAnet. De plus certaines universités ou certains centres de recherches US possédaient des connexions point à point. Ainsi depuis une université, pour se connecter à un laboratoire externe il fallait utiliser un ordinateur alors que pour se connecter à un autre centre de recherche il fallait utiliser un autre ordinateur.

Très vite le besoin de relier entre eux tous ces réseaux amena à la création de l'Internet. Par l'utilisation d'un protocole très répandu et non propriétaire[2], l'Internet permis d'interconnecter des ordinateurs très différents les uns des autres et pour la plupart incompatibles entre eux.

1.1.2. Etat actuel

La caractéristique principale d'Internet est de n'appartenir à personne. Chaque centre de recherche connecté à l'Internet participe à son financement. De la même façon les protocoles de communications retenus ne sont pas issus de travaux d'organismes de normalisation internationaux tels que l'ISO[3]. Il n'y a donc pas non plus d'organisme central qui impose aux autres les protocoles. La définition technique des protocoles est décrite dans des documents de références appelés les RFC (Request For Comment). Ces documents sont librement disponibles pour la consultation sur l'Internet.

Initialement exclusivement réservé aux centres de recherches ou aux établissements de formations publics, maintenant Internet est de plus en plus ouvert aux entreprises privées. Actuellement aux États-Unis on estime que la moitié du trafic sur l'Internet est effectué par des entreprises privées.

Le réseau NSFNet qui constituait jusqu'alors le backbone[4] d'Internet aux États-Unis a été fermé en avril 1995 et remplacé par des backbones de sociétés commerciales tels que MCI, ...

Cette ouverture vers le secteur privé est devenue indispensable pour permettre le financement de l'extension planétaire d'Internet.

La situation Française en est toujours au monopole de l'État qui au travers de France Télécom a mis sur pied la branche Française d'Internet : RENATER (REseau NATional pour l'Enseignement et la Recherche).

Evolution du nombre de sites Français raccordés à RENATER.

Evolution du nombre de machines accessibles sur INTERNET (soure INTERNET Society)

Vous trouverez sur l'URL[5] http://www.urec.fr/Renater les informations les plus récentes sur RENATER.

RENATER : Un réseau national de réseaux régionaux

1.1.3. Perspectives

Depuis l'apparition de serveurs WWW, l'Internet commence à intéresser de plus en plus le grand public. On constate actuellement une demande croissante de particuliers qui désirent accéder à l'Internet depuis leurs domiciles. De nombreux opérateurs Français apparaissent pour répondre à cette nouvelle demande.

De nombreuses entreprises commencent également à s'intéresser à l'Internet. Après quelques années de retard, l'Internet en France et en Europe deviendra un gros marché commercial. Cela ne va pas sans poser quelques problèmes en France car RENATER, la branche Française de l'Internet a été exclusivement financée par l'État.

Quelques années après les USA, certains hommes politiques Français annoncent même que le développement des autoroutes de l'information doit être une priorité nationale. Nul doute que les années à venir vont bouleverser le développement de l'Internet.

Victime de son succès quasi populaire l'Internet commence à être très encombré. Le nombre sans cesse croissant de connexion impose d'augmenter la bande passante des principales artères (les backbones). Certains scientifiques se demandent même s'il ne serait pas temps pour eux de créer un autre réseau de réseaux qui serait exclusivement destiné à la recherche et à l'enseignement supérieur. Cette idée présente comme une impression de déjà vu...

1.2. Décrypter une adresse Internet

Chaque noeud[6] du réseau est repéré de façon unique par une adresse. En réalité l'adresse peut être exprimée sous 2 formes différentes :

Ces deux adresses[7] désignant le même noeud du réseau, il y a donc une bijection entre elles.

L'adresse IP est la forme la plus pratique pour un ordinateur. L'adresse symbolique est la plus pratique pour un être humain. Un serveur particulier, le DNS (Domain Name Service) permet d'établir la correspondance entre un numéro IP et le nom symbolique correspondant.

Par exemple le numéro IP 159.31.10.2 correspond à une station SUN qui a aussi pour adresse soleil.ema.fr. Les 2 formes sont rigoureusement équivalentes pourtant nous allons voir que la seconde apporte beaucoup plus d'informations à un être humain que la première.

1.2.1. Adresse d'un domaine

Le système d'administration des noms (DNS) réparti l'administration des noms en niveaux hiérarchiques. Chaque niveau est appelé domaine. Chaque domaine est responsable de l'administration des noms de ses sous-domaines. Ainsi tous les domaines Français ont comme suffixe fr. Un organisme Français s'occupe de l'attribution des noms du domaine fr ainsi que des intervalles de numéros IP attribués à chacun. A charge ensuite à chaque administrateur du domaine d'attribuer ses numéros IP comme bon lui semble. Il peut également décider de créer autant de sous domaine qu'il souhaite.

Par exemple l'ENSTIMA est un sous domaine du domaine fr, le nom que l'on a demandé est ema.fr. Il regroupe toutes les machines de l'école qui ont une adresse IP. Le numéro IP du domaine de l'EMA est 159.31.x.x. Un domaine correspond donc à un réseau qui est connecté à l'Internet.

Le nom d'un domaine est constitué d'au moins 2 parties séparées par un point :

* Un identifiant sur 2 caractères du pays ou le type du domaine sur 3 lettres. Par exemple voici quelques identifiants de pays :

                Suffixe         Pays                   Suffixe         Pays      
              de            Allemagne                it            Italie        
              au            Australie                jp            Japon         
              at            Autriche                 mx            Mexique       
              be            Belgique                 no            Norvège       
              br            Brésil                   nz            Nouvelle      
                                                                   Zélande       
              ca            Canada                   nl            Pays-Bas      
              dk            Danemark                 pl            Pologne       
              es            Espagne                  uk            Royaume Uni   
              us            Etats-Unis               se            Suède         
              fi            Finlande                 ch            Suisse        
              fr            France                   tw            Taiwan        
              hk            Honk Kong                su            URSS          
                                                                   (ancienne)    
              il            Israel                   ...           ...           

Il y a environ 300 codes de pays dont seuls 150 sont actuellement connecté à l'Internet.

* Le nom du domaine.

Quand on parcourt le nom de gauche à droite, chaque nom est englobé dans le sous domaine suivant. Ainsi ensm-ales est un domaine du domaine fr.

1.2.2. Le cas particulier des USA

En tant que créateur du réseau Internet, les USA ont établi des règles d'attributions de noms de leurs domaines quelques peu particulières. Ainsi à l'organisation géographique des attributions des noms de domaine (tel que ucla.ca.us), les USA ont préférés une notion organisationnelle (ucla.edu). Ils ont ainsi fait la distinction entre les sites :

Certains pays comme l'Angleterre ont essayé de reproduire de façon simplifiée la distinction faite entre les domaines privés et les domaines publics. Ainsi le domaine co.uk[8] accueille tous les sites commerciaux alors que ed.uk[9] acceuillera les domaines publics d'enseignement.

1.2.3. Sous domaine

On a vu que l'administrateur d'un domaine a le loisir de créer autant de sous-domaines que nécessaire. Ainsi à l'EMA on pourrait décider de créer autant de sous-domaines qu'il y a de sites :

Bien que possible une telle décomposition n'est utile que quand le nombre d'ordinateurs connectés est important. A l'heure actuelle une telle décomposition est inutile.

Certains domaines couvrent une étendue très vaste. Par exemple nasa.gov relie des sites de la NASA répartis sur tout le territoire des Etats-Unis.

1.2.4. Adresse d'une machine

L'adresse d'une machine s'obtient en ajoutant le nom de la machine au domaine dans lequel elle est définie. Ainsi la station neptune du domaine ema.fr a pour adresse symbolique neptune.ema.fr.

Cette même machine a pour l'instant aussi pour adresse www.ema.fr car elle abrite le serveur WEB de l'ENSTIMA et traditionnellement le serveur WEB se désigne par le nom www. Ainsi nous pourrons déplacer quand bon nous semble le serveur WEB de neptune vers toute autre machine sans que cela perturbe les autres utilisateurs. En effet l'adresse symbolique de notre serveur WEB n'aura pas changé.

1.2.5. Adresse d'un utilisateur

L'adresse d'un utilisateur est en fait son adresse e-mail. En effet un utilisateur n'est généralement pas attaché à une machine en particulier. Il est par contre rattaché à un domaine, c'est donc tout naturellement que l'adresse de l'utilisateur s'obtient en concaténant le nom de l'utilisateur à celui du domaine. Par exemple l'utilisateur lpelliss aura pour adresse lpelliss@ema.fr.

L'adresse du domaine est en fait celle dans lequel le serveur de messagerie (e-mail) se trouve, il peut y avoir plusieurs serveurs de messagerie sur un même domaine, dans ce cas il faut rajouter à l'adresse le nom de la machine qui abrite le serveur de messagerie avec lequel on veut communiquer.

Par exemple si l'on veut établir une passerelle entre la messagerie internationnale e-mail et notre messagerie locale QuickMail il faut déclarer un Macintosh sur lequel tournerait en permanence la passerelle e-mail/QuickMail cette machine pourrait se nommer quickmail.ema.fr. Si un utilisateur extérieur à l'école veut envoyer un message à l'utilisateur référencé Laurent PELLISSIER sur le serveur QuickMail, il devrait le faire à l'adresse laurent_pellissier@quickmail.ema.fr. Il est important de noter que l'adresse laurent_pellissier@ema.fr est invalide car non définie par le serveur e-mail principal du domaine (i.e. soleil.ema.fr).

Actuellement le serveur e-mail tourne sur la station soleil, son adresse est donc soleil.ema.fr. On peut donc tout à fait libeller une adresse e-mail ainsi : lpelliss@soleil.ema.fr. L'inconvénient de cette solution est que si le SETI change le serveur e-mail de station UNIX toutes les personnes qui écrivaient sur la station soleil ne pourront plus joindre leur correspondant. Ceux par contre qui utilisaient une adresse du type lpelliss@ema.fr pourront toujours le faire.

NB : On distingue facilement l'adresse d'un utilisateur de celle d'un ordinateur par la présence du symbole @ (qui se prononce at).

2. Les fonctionnalités de l'Internet

2.1. e-mail : le courrier électronique

Le courrier électronique est souvent le premier service d'Internet que l'on utilise. Il permet de s'affranchir des décalages entre les fuseaux horaires et permet de joindre une personne même si elle est absente.

2.1.1. Utilisation

Pour pouvoir envoyer ou recevoir du courrier électronique, il faut disposer d'une adresse e-mail ainsi que d'un logiciel permettant de communiquer avec le serveur e-mail du domaine. A l'ENSTIMA ce logiciel (que l'on appelle un client) est très souvent Eudora.

A la différence de QuickMail qui utilise le protocole réseau AppleTalk, Eudora utilise TCP/IP, il nécessite donc un ordinateur sur lequel MacTCP soit correctement installé et configuré.

2.1.1.1. Règles d'utilisation

Un certain nombre de règles doivent être respectées lors de la rédaction de courrier e-mail :

A l'ENSTIMA, une adresse e-mail est toujours associée à un compte sur une station UNIX. Vous bénéficiez ainsi des possibilités du système UNIX pour, par exemple, rediriger vos messages d'un compte vers un autre grâce au fichier .forward.

Le client Eudora vous propose un certain nombre de fonctions comme :

2.1.1.2. Messages d'erreurs

Il n'est actuellement pas possible de savoir si le message est arrivé à destination ni de savoir si le message a été lu. Un message envoyé arrive toujours à destination, sauf si l'adresse est fausse ou si une erreur survient sur le réseau. Dans ce cas le message est renvoyé à l'expéditeur en lui signalant dans le champ sujet la nature de l'erreur rencontrée :

2.1.1.3. En cas de réclamations

Si vous ne parvenez pas à envoyer un message à un correspondant et si vous êtes certain de son adresse e-mail vous pouvez le signaler à un utilisateur particulier du domaine distant : postmaster. Le courrier adressé à postmaster sera lu par l'administrateur de la messagerie du domaine que vous essayez de joindre, son adresse sera de la forme postmaster@nom_du_domaine. Par exemple postmaster@site-eerie.ema.fr. Vous pouvez par exemple lui demander si la personne que vous cherchez à joindre est toujours déclarée sur son domaine. Attention il faut écrire au postmaster dans sa langue d'origine ou éventuellement en Anglais.

2.1.1.4. Envoi de pièces jointes

L'envoi de fichiers en pièce jointe pose actuellement de nombreux problèmes car e-mail n'autorise de façon systématique que l'envoi de fichier texte pur (i.e. ne contenant pas de lettres accentuées). Il existe plusieurs normes qui permettent d'envoyer des fichiers de type quelconque mais aucune n'offre la garantie d'être en service sur tous les domaines :

* uuencode : c'est un programme d'origine UNIX existant sur plusieurs modèles d'ordinateurs qui permet d'encoder un fichier binaire sous la forme d'un fichier texte pur. Ce fichier texte peut alors être joint au message. Un autre programme assurera le décodage à la réception. Cette norme n'est pas supportée par Eudora.

Description: Exemple de uuencode d'une image

contenue dans le fichier

miniarizona.jpg

[Section: 1/1 File: minarizona.jpg UULite v2.0]

[Original File Size: 20378]

BEGIN-------cut here-------CUT HERE-------PART 01/01

begin 644 minarizona.jpg

M_]C_X``02D9)1@`!`0$`2`!(``#__@`,07!P;&5-87)K"O_;`(0`$0P-#PT+

M$0\.#Q02$14:*QP:&!@:-"8H'RL^-D%`/38\.T1-8E-$2%U).SQ5=%9=96AM

M;VU"4GB!=VI_8FMM:0$2%!0:%QHR'!PR:48\1FEI:6EI:6EI:6EI:6EI:6EI

M:6EI:6EI:6EI:6EI:6EI:6EI:6EI:6EI:6EI:6EI:6EI_\0!H@```04!`0$!

M`0$```````````$"`P0%!@<("0H+`0`#`0$!`0$!`0$!`````````0(#!`4&

M!P@)"@L0``(!`P,"!`,%!00$```!?0$"`P`$$042(3%!!A-180<B<10R@9&Ap> le reste du fichier a été tronqué car il est de la même forme

end

END-------cut here-------CUT HERE-------PART 01/01

Exemple de uuencodage d'un fichier binaire

* MIME (Multi-purpose Internet Mail Extensions) : permet de joindre tout type de document (son, image, document Word...) au sein d'un e-mail. Contrairement à uuencode le codage et le décodage sont totalement transparents pour l'utilisateur. Eudora dans sa version gratuite (1.x) ne supporte pas cette norme, la version commerciale (2.x) la supporte.

Ces 2 méthodes présentent l'inconvénient de n'être opérationnelles que si elles sont présentes de bout en bout de la chaîne d'information.

2.1.2. Sécurité

Il faut se garder d'envoyer tout type d'information confidentielle par e-mail. Il est déjà arrivé de rencontrer sur des serveurs de messageries des programmes qui tournaient en tâche de fond à la recherche de certains mots clés (tels que password) dans les fichiers contenant tous les messages reçus.

De part la structure même d'Internet, les messages transitent de noeud en noeud de l'émetteur jusqu'au destinataire. Aucun de ces noeuds ne peut garantir la confidentialité du message.

D'autre part il n'existe pas de garantie que le contenu des champs From: et Reply-to: soient valides. En effet rien ne vous empêche d'envoyer un message en indiquant comme adresse d'expéditeur ministre@culture.fr.

Il est cependant possible d'envoyer des messages confidentiels et même de garantir l'origine du message en utilisant un logiciel tel que PGP (Pretty Good Privacy). Ce nom qui signifie assez bonne confidentialité est particulièrement humoristique quand on connaît l'efficacité militaire du cryptage utilisé. Philip Zimmermann, l'auteur de ce logiciel fait l'objet de poursuites judiciaires de la part de l'administration américaine pour exportation illégale (en fait pour diffusion par Internet) de technologies militaires. Bien que PGP soit un logiciel d'utilisation totalement gratuite il est interdit d'utilisation en France car les services compétents de l'État ne pourront pas décrypter vos messages.

PGP utilise une combinaison de clé privée et de clé publique qui permettent d'authentifier et de crypter un message. Pour cela vous devez garder secret la clé privée et distribuer à des personnes de confiance vos clés publiques.

Une version Macintosh de ce logiciel existe et fonctionne parfaitement !

2.2. Listes de diffusions (mailing lists) : les utilisateurs se regroupent

On a vu qu'avec le logiciel Eudora on peut créer des listes de diffusions. Ainsi tout message envoyé à la liste sera envoyé à tous les membres de la liste. Le problème de ce système et qu'il oblige tous les membres à mettre à jour de façon synchrone leur liste d'abonnés en cas de modification, ajout ou suppression d'un des leurs.

Heureusement est arrivé le serveur de mailing list. Il permet de centraliser sur une seule machine toute la liste et offre de nombreux autres services.

2.2.1. Principe

Un ordinateur héberge un logiciel serveur de mailing lists, on communique avec ce serveur par 2 adresses différentes :