Quantifier le Net

La version originale de cet article a paru dans la revue Le Manager

No. 52, novembre 2000, pages 46-49


Par Mohamed Louadi, PhD

 

Les activités liées au commerce électronique rapporteront un chiffre d'affaires de près de 132 milliards de dollars d'ici la fin de l'année. Telle semble être une des conclusions d'un rapport émis par ActivMedia Research intitulé "Real Numbers Behind Net Profits 2000" en observant que ce chiffre est le double de ce qui a été estimé une année auparavant, alors que le commerce électronique valait encore 58 milliards de dollars1.

 

Le Yankee Group, un autre cabinet de recherche américain, estime que les transactions B2B (commerce électronique d'entreprise à entreprise) atteindra un volume de 134 milliards en l'an 2000, alors qu'il se situait aux alentours de un milliard en 1996.

 

Forrester Research quant à lui, prévoit que la valeur totale des biens et services échangés électroniquement sera de 327 milliards en 2002, tout en précisant que cette valeur se situait aux alentours de 105 milliards en 2000 et de 183 milliards en 2001.

 

Aucun article, aucun séminaire et aucune discussion portant de près ou de loin sur l'Internet ou sur son sous-ensemble, le Web, ne manque d'étaler des statistiques sur l'ampleur de ce phénomène du siècle. L'objectif de quantifier le réseau des réseaux, que ce soit en nombre de serveurs, en nombre d'utilisateurs, en nombre d'abonnés ou en volumes d'échanges commerciaux est de permettre à ceux qui n'en sont pas encore convaincus, d'apprécier l'importance de ce d'aucuns assimilent à une lame de fond, un phenomene qui n'a résolument pas son pareil dans l'histoire de l'humanité.

 

Pourtant, les écarts existant entre les différents cabinets d'études et de recherche américains qui évaluent l'Internet sont énormes. Prenant pour exemple la valeur des échanges électroniques prévus pour 2003 par huit cabinets différents, nous relevons une différence qui va du simple au quintuple! En effet, il est étonnant qu'IDC prévoie des revenus de 634 milliards pour 2003 alors que Computer Economics estime ces revenus à 3.161 milliards!

 

Pour beaucoup, quantifier le net est une affaire d'une bien plus grande importance et le jour où nous serons tous convaincus des bienfaits de l'Internet, il s'agira d'avoir une vue plus précise de son étendue.

 

Mais les choses ne sont pas si simples et ce, en raison de plusieurs difficultés liées aux métriques du Web.

 

La difficulté majeure réside dans la détermination du nombre total d'utilisateurs de l'Internet car l'estimation du taux de pénétration de l'Internet passe immanquablement par cette statistique.

 

Certains cabinets d'études se basent en premier lieu sur le nombre d'utilisateurs potentiels de l'Internet. Cette définition reste cependant vague et difficile à utiliser. D'autres se limitent à un univers de population limité à la population adulte. D'autres encore utilisent le nombre de personnes qui sont au courant de l'Internet (awareness) se basant sur la logique qui veut qu'un individu qui ne sait pas ce que l'Internet est, ou qui n'en a jamais entendu parler, ne peut possiblement pas en être l'utilisateur. Dans ce cas, certains procèdent en soustrayant de la population adulte la population qui ignore ce que l'Internet est pour obtenir le nombre d'utilisateurs potentiels.

 

D'autres méthodes se basent sur d'autres indicateurs dont, par exemple, le nombre de hosts, le nombre de domaines, le nombre d'abonnés, l'accessibilité à l'Internet ou le taux d'équipement des foyers. Souvent, l'on remarque que l'Internet est aussi quantifié par le biais du trafic qu'il génère en termes de mégaoctets ou de téraoctets en circulation.

 

Le nombre de hosts

 

Un des indicateurs les plus utilisés pour quantifier l'Internet est le nombre d'ordinateurs hotes (hosts). Selon Network Wizards, pionnier dans la psychométrie du net, un host est un nom de domaine qui a une adresse IP. Cette définition s'applique malheureusement à n'importe quel ordinateur connecté à l'Internet. La définition même du host est vague car une adresse IP peut inclure tous types d'ordinateurs, y compris les serveurs de courrier, les serveurs de fichiers et même d'autres périphériques.

 

La plus grande compilation de statistiques sur le nombre de hosts dans le monde est sans doute celle effectuée par Network Wizards pour le compte de Internet Software Consortium2 Les pionniers de cette méthode de quantification sont indiscutablement Mark Lottor, John Quarterman de MIDS3 et Larry Landweber (voir les tables de connectivité de Landweber) qui, à l'aide de sondes programmées sillonnent l'Internet à la recherche de sites actifs4.

 

Nombre de …

1992

2000

réseaux

10 000

100 000 000

routeurs

10 000

100 000 000

hosts

1 000 000

10 000 000 000

utilisateurs

5 000 000

1 000 000 000

 

La croissance de l'Internet telle que prévue en 1992 par Vinton Cerf, alors président de la Internet Society. L'on ne parlait pas de commerce électronique à l'époque.

 

Le fait qu'une même adresse IP puisse être partagée par plusieurs ordinateurs et qu'un même ordinateur puisse utiliser plusieurs adresses IP complique démesurément la tâche de comptabilisation. De plus, l'éventualité qu'un host puisse ne pas être connecté lors de la sonde fait que ce host passe complètement inaperçu. C'est d'ailleurs la raison pour laquelle le décompte du nombre mondial de hosts est régulièrement soumis à des révisions.

 

L'on a dès le début de ces compilation pris l'habitude d'estimer le nombre total d'utilisateurs en multipliant délibérément le nombre de hosts comptabilisés par un facteur variant entre quatre et six.

 

Une autre méthode de quantification de l'Internet est de compter le nombre de domaines par pays. Tout comme pour un host, à un domaine correspond une adresse IP. L'usage de la comptabilisation des domaines est surtout appliqué pour compter le nombre de hosts par pays car le nom de domaine contient dans sa partie terminale (le suffixe) un code identifiant un pays. Ce suffixe est un code ISO affecté à chaque pays (tn pour la Tunisie, ma pour le Maroc, de pour l'Allemagne, etc.) et est également appelé le TLD (ou Top Level Domain).

 

L'hypothèse des méthodes de quantification de l'Internet est que ce code identifie la localisation géographique du site. Or cela n'est pas tout à fait correct. Un site ayant un suffixe correspondant à un pays n'implique pas nécessairement que ce site s'y situe physiquement. En guise d'exemple, les Etats Unis qui comptent le plus grand nombre de domaines, ont une fois été classés 44ème en termes de pénétration de l'Internet parce que plusieurs domaines s'y situant réellement avaient un code ISO les classant dans un autre pays.

 

De plus, des domaines ayant les suffixes .edu, .org, .net ou .com peuvent être situés n'importe où dans le monde et échappent de ce fait à une classification géographique fiable.

 

Le nombre d'abonnés

 

Un indicateur favori par les psychométriciens de l'Internet est le nombre d'abonnés. En effet, le nombre total des utilisateurs de l'Internet est composé du nombre d'abonnés et du reste des utilisateurs. Le nombre d'abonnés à l'Internet est sans doute la statistique la plus vérifiable et la plus précise parce qu'elle est détenue par les fournisseurs d'accès à l'Internet (ISP, ou Internet Service Provider) ou les opérateurs de télécommunication. Mais elle n'est pas nécessairement la plus indicative du nombre d'utilisateurs, même si, comme pour le cas des hosts, on multiplie sa valeur par un facteur arbitraire pour obtenir un nombre estimatif des utilisateurs. Mais en tout état de cause, cette statistique demeure préférable à celle prétendant estimer directement le nombre des utilisateurs.

 

Le nombre d'abonnés constitue une sorte de borne minimum pour l'estimation du nombre total des utilisateurs. Si une personne a payé pour un service (l'abonnement), alors il est peu probable que cette personne n'utilise pas ce service. Il s'ensuit qu'un abonné est par extension un utilisateur. Malheureusement, dans le sens large du terme, un utilisateur n'est pas nécessairement un abonné; plusieurs utilisateurs ont accès à l'Internet gratuitement, soit à partir de l'école, du bureau, d'un publinet ou à travers le compte d'un ami, d'un collègue ou d'une institution. La difficulté réside essentiellement dans la comptabilisation de ce dernier type d'utilisateurs.

 

L'accessibilité à l'Internet

 

Un autre indicateur est l'accessibilité de l'Internet. L'accessibilité, ou la couverture, nous informe sur le nombre d'individus pour lesquels l'Internet est à la portée. Le degré d'accessibilité indique la portion de la population qui est susceptible d'utiliser l'Internet et qui le ferait si elle le voulait. C'est, d'après Michael Minges de l'Union internationale des Télécommunications, l'indicateur d'accès universel de choix.

 

Ainsi, un segment de la population disposant d'un cybercafé ou d'un publinet est catégorisé comme un segment couvert par l'accès à l'Internet. Cette mesure est cependant à modérer par la distance physique séparant la population ou le segment de population du point d'accès.

 

Le taux d'équipement des foyers

 

Un indicateur révélateur, et qui peut sans doute être utilisé en complément des autres, est le nombre (ou le pourcentage) de foyers qui sont équipés d'une ligne de téléphone, d'un ordinateur personnel et d'un modem. En général, le pourcentage de foyers équipés en micro-ordinateurs est toujours supérieur à celui des foyers dotés d'un modem, ce dernier est presque toujours inférieur à celui ayant accès à l'Internet et le pourcentage de foyers abonnés à l'Internet est toujours supérieur à celui des foyers ayant accès à l'Internet.

 

Cependant, la définition vague de la notion d'accès fait parfois que le pourcentage de ceux ayant accès et ceux disposant d'un modem soient sensiblement égaux. Mais cet état de fait correspondant rarement à la réalité car le fait d'avoir un modem ne veut pas nécessairement dire que l'Internet soit accessible. Ces subtilités dans les définitions font malheureusement défaut dans nombre de compilations statistiques publiés dans l'Internet et ailleurs.

 

Le concept de foyers équipés se rapproche donc de celui de l'accessibilité car l'on prend ici pour hypothèse le fait que très peu sépare un foyer équipé de l'Internet. La seule barrière subsistant est le coût de la connexion. Or si le coût de connexion à l'Internet est trop élevé, la barrière reste élevée même pour les foyers équipés.

 

Ainsi, il ne servira à rien de savoir le nombre de foyers pour lesquels l'Internet est potentiellement accessible s'ils ne peuvent s'offrir l'abonnement ou le coût de la connexion. Souvent d'ailleurs, une personne équipée préfèrera se rendre à un publinet plutôt que de connecter à domicile

 

Le nombre de foyers équipés ne prend de valeur que si la tarification téléphonique ou le coût de l'abonnement par exemple, ne posent pas problème. Par contre, si le coût de la connexion est élevé alors l'hypothèse qui veut que l'Internet soit accessible à un foyer équipé devient problématique.

 

Conclusion

 

Les indications fournies par les statistiques compilées par Network Wizards révèlent que l'Internet continue sa croissance exponentielle. Ces indications sont informatives parce que l'on sait que ces statistiques sous-estiment l'étendue réelle de l'Internet. Là réside une certitude: l'Internet est plus vaste que l'on ne croit (voir notre article Le Web profond). Mais l'on n'arrive toujours pas à estimer d'une manière ne serait-ce qu'approximative le nombre d'utilisateurs ni le taux de pénétration de l'Internet dans un pays donné.

 

La nécessité de disposer de telles statistiques devient de plus en plus cruciale car il ne s'agit plus de compter des ordinateurs connectés mais de quantifier un marché.

 

Les statistiques dont nous disposons aujourd'hui sont toutes des approximations.

 

Le commerce électronique, désormais une réalité, doit disposer de métriques comparables à celles dont dispose le commerce traditionnel: indices d'écoute pour les messages publicitaires télévisés, segmentation des marchés en classes de revenus, pyramides des âges, etc.

 

1. Voir sur http://www.activmediaresearch.com/body_free_newsroom.html.

2. www.isc.org/ds

3. www.mids.org

4. La méthode révisée de Mark Lottor est expliquée dans le document www.isc.org/ds/new-survey.html.