Ne faites pas du cinéma une cinématique

Attention. Ceci est un billet d’humeur écrit à chaud suite au visionnage du film Avatar: La Voie de l’Eau de James Cameron. Il décrit l’un des problèmes du film. Cet article ne sera pas objectif !

Alors voilà. Après treize ans d’attente, la suite d’Avatar est arrivée dans nos salles obscures. Et en entrant dans la salle, j’étais heureux: un retour à Pandora était plus que bienvenue pour un fanatique d’images de synthèses.

J’avais de grande attentes avant le visionnage de ce film: (re)découvrir un monde dans lequel onirisme et réalisme se côtoient dans une ode à la nature. Le tout dans un projet qui veut bousculer à lui seul le monde du cinéma.

Il y a deux annonces précédant la sortie du film qui m’ont intrigué:

– Une ambition artistique possible grâce à la technologie
– L’amélioration de la technique

Et ces deux éléments sont pour moi le problème et la solution à l’équation Avatar.

Au delà de l’acteur, le comédien

L’idée de la motion capture est désormais actée de tous: permettre à n’importe qui d’incarner n’importe quel personnage de fiction. Et faire incarner une jeune fille par une actrice confirmée est pour moi un retour de l’art théâtrale au cinéma.

Faire incarner des aliens par des acteurs était une première étape ambitieuse, mais ici le film va plus loin en permettant à l’acteur de s’émanciper de son âge, et c’est du génie !

L’introduction d’un personnage adolescent joué par une actrice de soixante-et-onze ans au travers de l’actrice légendaire Sigourney Weaver permet donc d’entrevoir une nouvelle étape dans le processus de casting d’un film qui se concentre sur la performance tout en mêlant de nouvelles manière de jouer le personnage. L’expérience d’un acteur qui s’entrechoque avec l’innocence de son personnage est un premier pas vers un retour des Comédiens au grand écran.

J’espère donc pouvoir entrevoir un cinéma qui abandonne ses têtes d’affiches pour des comédiens dont le talent ne se résume pas au CV.

Mais cette promesse est, hélas, également le moyen de ramener à la vie des acteurs d’outre tombe dont le visage rassure les équipes marketing.

Il faut cependant noter que la technologie de la « Mocap » utilisée en tant que telle dans le cinéma vient une fois de plus briser la frontière fine mais coriace entre le jeu vidéo et le cinéma.

L’art ne cesse de challenger la technique

Comme je le dis souvent, la créativité né de la contrainte. Mais ces dernières années, le numérique a abolit cette dynamique.

Pour la réalisation de ce film, de nouvelles technologies de motion capture sont venues remplacer le matériel vieillissant du premier film. Désormais, le matériel de capture faciale réduit le besoin en animateur pour retoucher les performances des acteurs altérées par l’outil primitif de 2009. D’ailleurs, la volonté de réalisme de Cameron a poussé les équipes de R&D de Lightstorm et ses prestataires à développer de nouveaux outils de captations de mouvements sous-marins.

Mais outre la prouesse technique permettant d’améliorer le tournage, les outils de productions visuelles sont aussi passés à l’étape supérieur.

Alors, outre les outils de rendus graphique perfectionnés, je pense qu’il est important de souligner que ce niveau de détail résulte à la fois de puissances de calculs grandissantes, mais aussi de l’augmentation du nombre de paramètres pour chacun des éléments graphiques du films. On imagine donc que le Pipeline derrière la production du film a du être conséquente au vu des enjeux titanesques du projets: data management au niveau production, pour l’animation, le lightning, la conception 3D (modeling, rigging, texturing, hair artists…), l’archivage au niveau du département artistique (concept arts, storyboard, montages previz…), et bien sûr les rendu et ses démons.

Et c’est ici que mon problème se pose.

Le cinéma est devenu cinématique

En décidant de faire de ce film une révolution du numérique, James Cameron a du faire des choix qui relèvent pour certains d’un avant-gardisme, et pour d’autres d’une grosse bêtise.

Avec le HFR (pour High Frame Rate), Cameron voulait rendre certaines séquences de son film plus impressionnante en démultipliant le nombre d’images diffusées en une seconde.
Au cinéma, la fréquence d’images est le plus souvent de vingt-quatre images par secondes. Le HFR veux bousculer cette tendance en doublant le nombre d’images (48 images par secondes).

Le HFR est née d’une volonté des développeurs de jeux vidéo en permettant au joueur de vivre l’aventure de son personnage avec une meilleure fréquence d’images: tuer des ennemis dans Doom devient plus joussif avec un gameplay frénétique qui profite pleinement de la cadence de productions d’images en temps réel des processeurs graphiques de votre ordinateur.

Et c’est pour cela que le HFR s’est ajoutée malgré lui dans la longue liste des innovations inutiles donc indispensables de l’Industrie du Cinéma.

Mais nous sommes en 2022, et le HFR accroit substantiellement le prix de la production d’un film.

Si on passe de 24 à 48 images par secondes d’un film, on double le nombre d’images. Et si on veut continuer d’exploiter le potentiel commercial de la 3D, on double une fois de plus le nombre d’images pour les deux yeux de notre spectateur.

Hélas, Cameron s’est décidé à faire varier la fréquence d’images durant le film: des séquences en 48 i/s sont entrecoupées de séquences en 24 i/s.

Et peu importe que cette décision est été motivée par des raisons d’économies ou une volonté de « déployer progressivement la technologie HFR », j’ai un problème.

Je dois avouer que je suis un gamer: j’aime jouer et parfois même créer des jeux vidéo. Et en tant que joueur, je n’aime pas voir mon jeu « lagger »: car cela entraine des baisses de la fréquence d’images (dit « framerate » en anglais).

Mais ce qui m’a conduit à être extirpé de l’intrigue fade et insipide du film est l’absence totale de motion blur dans les séquences en HFR. Car puisque le nombre de frames est doublée, il devient inutile de simuler l’effet de mouvement inhérent à notre capacité visuelle.

Et c’est pourquoi durant la projection de mon film en Dolby Vision j’ai eu l’impression de voir une cinématique douée d’un univers magnifique et sublimée par des effets visuels splendide, le tout dans une dynamique d’animation digne des meilleurs titres de Playstation 2.

Oups.

Alors voilà. Après le visionnage du film, une question se pose, une fois de plus: quelle est la place de la technologie au cinéma ?

Car après avoir rapatrié les savoirs-faire issus de l’animation, puis les talents du jeu vidéo, le cinéma se décide à prendre une direction qui me dérange.

Pour moi, le cinéma telle qu’il est présenté dans ce film est sur la frontière tenue entre le réalisme épatant et Uncanny Valley (en français « Vallée dérangeante » qui est une notion qui décrit la sensation de malaise provoquée par un personnage si réaliste que ses imperfections nous paraissent monstrueuses) issue malgré elle de la méthode de projection du film.

A mon humble avis, la technologie est ici utilisée pour une mauvaise raison: à savoir changer les méthodes de visionnage quitte à altérer l’oeuvre et son message.

Finalement, j’ai l’impression que les images photo-réalistes et les environnements sur-détaillés n’arrivent plus à satisfaire les ambitions de Cameron qui choisit ici l’ajout d’une technologie peu pertinente dans ses visions d’auteur. Peut-être pour rendre l’expérience en salle unique et la différencier de son re-visionnage sur petit-écran. N’était-ce pas l’objectif de la 3D ?

Mais personnellement, j’ai peur de préférer le framerate du prochain jeu Avatar à celui du film. J’espère que cela ne sera pas de même pour son scénario.

Oups.

En 2046, Disney, je l’aurais assurément rêvé !

En 2020, j’ai publié un article sur mon blog intitulé « En 2046, Disney, je l’aurais assurément racheté » dans lequel je publiais un travail écrit dans le cadre de mes cours d’Expression-Communication à l’IUT. J’étais très fier de présenter ce travail ! Aujourd’hui, je m’apprête à effectuer un exercice peu commun, à savoir commenter mon travail de l’époque.

J’ai envie d’y ajouter quelques compléments, mais aussi quelques corrections.

Bonne lecture !

L’article originale est écrit en bleu, mes ajouts sont écrits en noir !


Aujourd’hui, je vous présente le travail que j’ai réalisé dans le cadre d’un contrôle d’Expression-Communication.
Il s’agissait d’un exercice dans lequel nous devions mettre à l’épreuve notre savoir sur l’Historique de la Communication Verbale. Nous devions traiter de l’article “Pixar, Marvel, bientôt Disney+… Disney, un empire tout-puissant et sans limites ? rédigé par Laurent Rigoulet.

Je vous souhaite une excellente lecture !

Ici, j’omet d’informer le lecteur que l’exercice donné par notre professeur incluait un document complémentaire: un message d’un compte Twitter appelé Bored Panda qui prédisait que Disney allait racheter le monde sur un ton ironique. C’est pourquoi je ferais référence à « Bored Panda » par la suite.

L’idée commune exprimée au travers des expressions “usines à divertissement”, “industrie du divertissement”, “industrie du spectacle” est celle de la communication de masse.
Apparue dans les années 1920, l’expression “mass média” décrit le phénomène d’industrialisation des médias populaires: l’offre précède la demande. Dans le cadre des loisirs, les objets de consommations sont fabriqués en série. Ils voient en conséquence leurs prix baisser.
De ce fait, on assiste à une déferlante de produits calibrés, aseptisés et conçus pour plaire au grand public. On retrouve cette volonté d’abondance dans le terme “usine à divertissement”. L’œuvre devient produit, et le titre devient une marque: les rachats des différents labels par The Walt Disney Company vont dans ce sens.

Cette partie est très juste, car elle commente un phénomène qui s’est accéléré depuis la parution de cet article en 2020. Entre le rachat de l’éditeur de jeux vidéo Activision Blizzard par Microsoft en janvier 2022 pour 68.7 milliard de dollars, la fusion-acquisition de WarnerMedia et Discovery pour former le consorsium Warner Bros Discovery en avril 2022, les différents rachats du groupe Embracer avec Asmodee en 2021 et la division nord-américaine de Square Enix (devenue Studio Onoma), le rachat de Zynga par Take-Two en début 2022, la concentration se fait de plus en plus forte. On assiste à des vagues de rachats permettant d’entrer dans une dynamique de contenu. Les studios deviennent des « content factory » (usines à contenus) et produisent des oeuvres de divertissement à la chaîne pour nourrir les plateformes de distribution à la demande et donc le consommateur.

On note également la vision globale, la vision d’ensemble de la société qui bâtit ses marques dans différents produits: les parcs à thèmes, les films, les séries et produits dérivés font de ses personnages des incontournables de la culture populaire et donc de l’imaginaire collectif. Ce processus a pour ambition de s’adresser au plus grand nombre, car comme le disait Karl Marx “les loisirs remplacent la religion comme ‘opium du peuple’”. Cet opium est la vocation de Disney.

Si Disney est effectivement un géant du divertissement, il est aussi le premier groupe de divertissement indépendant qui n’est pas associé à un industriel. On peut également introduire la notion de Keiretsu et de Chaebol: des empires rassemblant plusieurs entreprises dans des domaines variés. Et même si ces termes sont employés autrement dans le monde, l’idée derrière la concentration des entreprises n’est pas nouvelle. Aujourd’hui, je pense que Disney n’a pas forcément quitté la dynamique qui était sienne à ses débuts, bien que sa stratégie orientée contenus la différencie de Sony.

A noter que des entreprises autrefois associés à d’autres activités se sont scindées pour marquer la séparation entre les activités de médias et les autres: WarnerMedia s’est séparé d’AT&T en mai 2021, webedia s’est séparé de ses activités technologies et marketing en créant la compagnie spin-off Jellyfish, la séparation en 2013 de la 21th Century Fox (rachetée par The Walt Disney Company en 2019) de News Corporation (entreprise de presse), puis la séparation des actifs cinéma de la Fox Corporation suite au rachat de Disney de 2019.

La volonté de créer des synergies entre les différents corps de métiers est finalement un élément de différentiation clé de la Walt Disney Company depuis un centenaire, mais je pense qu’ici, je souhaitais souligner le coeur de ce dispositif n’est pas le système en lui même, mais ses franchises. Et ce sont les franchises qui ne sont pas éternelles, et qui nécessitent d’être remplacées et/ou d’évoluer au cours du temps.

La liberté d’expression est également menacée: la censure effectuée par la multinationale sur ses propres programmes même si “aucune autorité ne lui en fait la demande” démontre la volonté de ne “heurter personne” qui aseptise ses productions. Dans la théorie de l’Agenda, Mr Combs et Dr Shaw explicitent que les médias ne disent pas aux gens ce qu’ils doivent penser, mais à quoi ils doivent penser. Disney focalise donc l’attention du spectateur sur un monde plus “divertissant” que le notre.

J’ajoute ici la notion d’infotainment qui entremêle l’information et l’actualité à du divertissement et qui est devenue incontournable dans le paysage médiatique internationale.

Dès lors qu’on limite ses propos, un œuvre perd de sa matière, de son sens, mais également son message. Le contrôle des productions Disney va dans ce sens.

Je pense que cette dernière phrase est incorrecte. Car ici j’associe deux visions du terme artiste qui sont complémentaires: artiste au sens artistique, et artiste au sens artisanale (je parle ici de la dimension industrielle de l’art bien que le terme artisanat ne reflète pas son côté massif et à grande échelle).

Ces deux visions sont différentes, car quand je parlais à l’époque de « l’artiste », je donnais à l’époque la vision d’une personne qui donnait forme à une oeuvre de l’esprit. Une oeuvre dont l’unique but est de partager une vision à un autre. Mais le terme « art » est ambiguë car il confond l’intimité d’une oeuvre à la perception industriel de sa distribution. Dès lors, on créé une oeuvre en espérant un retour sur investissement. Mais pour s’assurer un retour sur investissement, on limite les risques en imitant les formules ayant déjà faites leurs preuves.

De plus, selon Brett Heinz, “une société comme Disney a le pouvoir […] d’influencer la politique et le gouvernement” comme le montre le ‘décret Mickey Mouse’ avec lequel ils ont obtenu une extension de vingt ans des droits d’auteurs.
On peut donc en conclure que la liberté d’expression est menacée par le monopole de Disney.

La liberté d’expression de Mickey est peut-être menacée. Mais est-ce que celle des Looney Tunes l’est moins ?


Tout d’abord, l’internaute voit Hollywood comme une “zone de guerre”, car c’est à Hollywood que se fabriquent aujourd’hui les blockbuster qui font des milliards de recettes. Mais cette industrie Hollywoodienne s’applique également a présenter une certaine vision du monde: le rêve Américain en fait partie (Walt Disney lui même étant une figure du cette vision).
Puis, l’internaute évoque les “fermes Disney” qui élèvent une nouvelle génération. Ces fermes à contenus qui délivrent sans cesse de nouveaux produits dédiés au divertissement de masse. Et cette nouvelle génération condamnée à consommer, vivre et penser Disney.

Cette industrie est aujourd’hui partagée par de grands conglomérats tels que ComCast (qui voulait également racheter la 21st Century Fox) et Disney. Et tous convoitent cet influence.

Oui ! Et cette influence résulte d’une force inhérente aux cultures populaires qui façonne notre imaginaire collectif. Mais c’est aussi ce qui ferme le champs des possibles aux grands groupes qui misent plus facilement sur des visages et des noms qui ne sont plus en phase avec la culture contemporaine. Et qui sont condamnés à racheter des franchises neuves.

Mais plus encore, selon Bored Panda, “Disney [rachètera] les Etats Unis D’Amérique, et [créera] les Etats Unis de Disney…”. Ces mots sont plein de sens: ils reflètent la capacité financière et politique de Disney. Sa large influence sur les Etats Unis et sur le monde est l’image de son appétit vorace capable de racheter à prix d’or des franchises lucratives. Car ce sont ses licences qui font prospérer son influence.

Finalement Bored Panda présente ici une vision pessimiste de notre futur. Un futur dans lequel Disney serait omniscient, car il irait au delà du divertissement pour contrôler notre mode de vie et notre manière de penser.
On peut donc dire que cet internaute envisage un avenir dystopique.

J’ajouterai que cette vision est réaliste. Mais elle ne prend pas en compte tous les paramètres: les nouveaux entrants arrivent en masse et avec des investissements beaucoup plus importants en tête. Mais je ne sais pas s’il existera un jour quelqu’un qui fera trembler Disney.


Je ne suis pas d’accord avec Bored Panda sur sa vision de “l’empire Disney”.

Le divertissement est pluriel

Tout d’abord, je crois que de nombreuses compagnies du divertissement feront encore et toujours subsister la pluralité des points de vus sur le monde. Quelque soit leur taille, il existe une pléiade de compagnie qui dédient leur existence à l’art: leurs œuvres sont engagées et donc engageantes et ne sont pas penser pour plaire à tout le monde. De nombreux studios d’animations viennent contredire et géants Disney et Pixar, comme de nombreux cinéastes se consacrent à des films uniques et qui changent notre manière d’entrevoir le cinéma.

Ce paragraphe est étrange, car il est optimiste tout en étant en opposition totale avec le paragraphe suivant !

Le divertissement est pluriel, oui. Mais qui le finance ?

D’autres ont essayé

Ensuite, je pense que Disney n’est qu’une infime partie de ce vaste univers qu’est le divertissement. De nombreuses compagnies du divertissement de masse telles que EuropaCorp -conglomérat créé par Luc Besson suite à ses succès en salles- ont également compris la recette pour mettre au monde des blockbusters. Mais contrairement à Disney, EuropaCorp n’a pas accompli le rêve de son créateur qui était de construire un géant du cinéma. Aujourd’hui, le colosse de Luc Besson chute a perdu de sa grandeur. Est-ce là peut-être un avant goût de ce qui attend The Walt Disney Company.

EuropaCorp n’est pas le meilleur exemple, mais il est néanmoins symptomatique de l’ambition démesurée de nombreuses compagnies qui entament une stratégie de diversification/internationalisation suite à un succès commercial. J’y reviens dans le paragraphe ci dessous.

Mais qui détrônera Disney ?

Enfin, Bored Panda contredit mon objectif, car mon rêve est d’aller concurrencer Disney. On ne compte plus le nombre d’articles qui présentent une jeune start-up qui veut à elle seule concurrencer l’ogre Disney. Ankama, Rovio, Melty, Webedia… Ces noms ne vous disent surement rien. Ces quelques entreprises ont tenté ou tentent actuellement, de plusieurs manière, de se confronter à Disney. Sans succès. Pour moi, ces entreprises sont l’image même du succès de Disney. Se réinventer, repenser sa stratégie et développer ses franchises sont un point important certes. Mais très peu des ‘nouveaux Disney’ ont su faire la différence. Quand Georges Lucas a revendu ses entreprises à Disney, il a également revendu son rêve de faire face à Hollywood et à son monopole dément.

Et j’ajoute à cela que certaines des entreprises que je cite sont depuis revenues à leurs coeurs de métiers suite à des difficultés dans leurs stratégies d’internationalisation et de diversification.

Ces échecs me confortent dans l’idée que cette recette n’est pas une formule viable, du moins sur le long terme. Car à son échelle, Disney à soif de nouvelles marques déposées. Mais les consommateurs ne seront pas dupés longtemps face à la nouveauté des autres usines à contenu.

Une question supplémentaire se pose aujourd’hui: que se passera t-il quand les usines à contenu n’auront plus besoin d’humains pour produire du contenu ? Et comment pourra t-on prouver qu’un contenu est écrit par de la matière grise ? Je n’ai pas la réponse à cette question, mais dans un monde fait d’imperfections, une part de moi se dit que la seule manière de se différentier de la masse sera bientôt de faire des fautes d’orthographe !

Disney est doué d’un trésor de Guerre, certes, mais son inertie le perdra.

Je n’en suis pas la certitude, mais je pense que Disney à très certainement plus de chance d’exister dans un siècle que de très nombreux « Nouveaux Disney ».

Je ne suis pas d’accord avec Bored Panda. Car en 2046, Disney, je l’aurais assurément racheté !

Cette phrase m’avait beaucoup amusé quand je l’avais écrite il y a deux ans. Aujourd’hui, je la regarde avec beaucoup de tendresse car elle est l’état d’esprit d’une génération.

Je fais partie d’une génération étrange qui a vu la naissance de la télé-réalité, l’explosion des influenceurs et l’émergence des films sur les entrepreneurs.

Je pense que nous sommes dans une époque ou les investissements dans les industries du divertissement ont explosé parce que jamais il n’a paru aussi opportun de s’attaquer à The Walt Disney Company.

Je ne suis pas d’accord avec William Clément. Car en 2046, Disney, je l’aurais assurément rêvé !

Quelle histoire raconter ?

Dans la vie, il y a parfois des moments ou on a besoin d’évasion. Pour certains, cette nécessité se traduit par une volonté de voyage. Pour d’autres, il s’agit de s’immerger dans une oeuvre, de lire, de voir, d’écouter, de jouer. Dans tous les cas, il s’agit de mettre tout ses sens en éveil pour se propulser dans un lieu exotique.

Ma manière à moi, c’est d’écrire, de raconter des histoires. Mais ayant été élevé dans une société où l’image est désormais plus présente que les mots, j’ajoute à mes textes des dessins, des créations visuelles, très souvent, du code. 

Ces derniers temps, j’ai ressenti la volonté de m’évader. De prendre de la hauteur et d’imaginer à quoi peut ressembler l’ailleurs qui me passionne.

Ces dernières années ont été riches en rêves: j’ai essayer d’imaginer à chaque fois des projets personnels qui me sont forts de sens. Des projets qui visent à mieux comprendre et à mieux me comprendre.

Depuis près de sept ans maintenant, je développe, en plus de ma web série UNAI, deux projets qui me semble carrément passionnant et qui me donne l’envie de créer.

Le premier est un univers de science fiction que j’ai commencé à développer autour d’un scénario (date d’il y a 9 ans). Le coeur de ce projet est la vidéo, puisque le scénario que j’ai développé est pensé comme un script de film. Il est axé sur des personnages forts, et sur une mise en scène iconique. L’écriture derrière ce projet est très personnelle, puisqu’elle reflète ma vision de nombreuses thématiques. Avec un univers monochrome et sombre, animé par des airs de jazz atypiques.

Le second est un univers de fantasy. Le projet est beaucoup plus jeune que le premier (il date d’au moins quatre ans), mais n’en demeure pas moins développé. Ce projet est un conte onirique et coloré. Il raconte l’histoire de personnages faibles qui deviennent forts, ensembles. C’est donc une sorte de romance mêlée d’amitié, de trahisons et de combats.  Ce projet là, pour le coup est différent, puisqu’il est pensé d’abord comme un univers avec quelque chose de plus chalereux.

Alors vous pouvez peut-être vous dire que tout cela fait beaucoup de travail, avec énormément de dessins, de codes, de graphismes…. Mais c’est oublié que je suis le gars qui a réussi à créer une web série en CGI en parallèle de ses études en autodidacte.

Aujourd’hui, la question que je me pose est la suivante: quelle histoire raconter.

Il y a quelques temps, j’ai eu une discussion avec quelqu’un qui m’est proche. Cette personne me posait la question que je me pose aujourd’hui. Après qu’elle m’ai expliqué ses idées (qui sont soit dit en passant géniales et audacieuses), je n’avais alors pas su répondre à la question.

Aujourd’hui, je me retrouve dans son cas.

Je vous épargnerais les tenants et aboutissants de ma réflexion, mais il y a malgré tout une notion qui m’interpelle: l’auteur. A quel point j’ai envie que l’histoire me soit personnelle ? 

On arrive à la finalité de mon cheminement de pensé: aujourd’hui, je suis à un moment de ma vie ou j’ai quelque chose de spécifique à raconter, une humeur et un ressentiment à partager. Et j’ai envie de justifier mon choix par sa proximité avec ma vision actuelle.

Les histoires que j’écris ne sont peut-être pas des oeuvres qui changeront à jamais le monde ou qui chambouleront celles et ceux qui y pénètre. 

Mais elle me changeront, moi. Et c’est peut-être ça, être un conteur d’histoire.

Comment j’ai fait mon moteur de recherche web ?

Parmi mes projets personnels les plus fous se trouve une idée un peu farfelue.

Il y a quelques année de cela, durant l’année 2016, je me suis passionné pour une dimension très spécifique de l’informatique, à savoir l’accès à l’information.

Je me suis alors intéressé au fonctionnement de moteurs de recherche dédiés aux web. 

Alors si il existe plein de moteurs de recherche aujourd’hui, celui qui détient le monopole aux Etats-Unis et en Europe est bien évidemment Google. Egérie des Start-ups Garages et autres disrupteurs du dimanche, c’est aujourd’hui un portail rassemblant plus qu’un outil de recherche de page web, mais bien un assortiment de data-centers et de compétences permettant de dompter les flux de données à l’échelle mondiale.

Mais si nous revenons à la base du concept de moteur de recherche, c’est une tout autre idée bien que la vision reste la même.

Derrière un moteur de recherche tel qu’ils existaient dans la fin des années 90, il y a trois entités bien distinctes. Pour ce cas d’usage, je développerai le fonctionnement d’un moteur de recherche web très basique.

Le Crawler, l’explorateur du web

Tout d’abord, il y a le Crawler, aussi appelé Spider. C’est un logiciel qui se balade de page en page pour enregistrer l’ensemble des données associées. Il y lit le contenu, en déduit les mots clés associés, y recense l’ensemble des liens vers lesquels la page courante redirige.
Finalement, il fait exactement ce que son nom nous induit. On peut alors imaginer une petite araignée parcourant le web et traçant sa toile.
Chose important à noter: notre araignée robotisée, avant de pénétrer dans la page web, est tenu de lire un fichier robot.txt qui lui dit ou non si elle a le droit d’accéder ou d’enregistrer la page en question.

Une fois notre page web traitée, notre araignée poursuit son chemin en allant suivre les autres liens.

L’index: stocker l’information

Chaque page visitée par notre araignée est inscrite dans une base de donnée appelée l’index, qui regroupe l’ensemble des données relative à la page web.
Les pages sont recensées dans l’index et sont couplées à leurs indice de pertinence: le pagerank.

Le Pagerank: classer l’information

Par la suite, c’est au pagerank de récupérer ces données brutes et de noter la page web en conséquence.

Il va d’abord enregistrer sa pertinence en comptant le nombre de lien qui redirigent vers cette page. Puis, il lui donner un score arbitraire en fonction de la pertinence des pages de ces liens sources.

Aujourd’hui, il existe des normes dédiées au SEO (Search Engine Optimisation, ou Optimisation pour le référencement naturel), à l’accessibilité et aux standards. Par exemple, si votre site est doté d’une bannière en flash avec des polices de caractères clignotantes tout en omettant d’être lisible sur un téléphone, c’est compliqué de se frayer un chemin vers la première page de résultats.

Le Pageranker va également associer ces pages aux mots clé les plus pertinents.

Un champs de recherche cache parfois autre chose

Enfin, il y a le front, qui est le site web ou l’application permettant d’interroger notre index.

En 2016, je rêvais déjà de construire un petit moteur dédié à la recherche web. Hélas, il me manquait à ce moment quelques notions qui m’ont empêché de programmer l’outil de mes rêves.

A ce moment là, j’ai donc travaillé sur un méta-moteur de recherche !

Un méta-moteur de recherche, c’est un site ou une application qui (de base) n’a ni crawler, ni index. En effet, ce système se contente d’aller piocher chez la concurrence les résultats de recherche pour les ressortir sur une page avec un autre logo.

Du coup, à ce moment là, puisque je n’avais pas les compétences en programmation, j’ai décidé de travailler une autre partie tout aussi interessante: l’interface utilisateur.

Je me suis donc appliqué à repenser l’ensemble avec les moyens du bord.

https://www.youtube.com/watch?v=vtRnDP7rdF4

L’idée derrière ce projet était alors d’imaginer une nouvelle forme d’expérience utilisateur axée sur l’idée de personnifier le logiciel.
Inspirée par les mascottes de Microsoft Word comme Clippy qui conseillait l’utilisateur sur son usage du traitement de texte, Toast était voué à servir de visage à l’éternelle page blanche ornée du champs de recherche qui fait la réputation de l’internet.

Au delà le l’interaction sommaire, le personnage servirait également de champs de recherche qui s’affiche au gré des requêtes de l’utilisateur.

Mon objectif dans la réalisation de ce projet était de moderniser la manière dont l’utilisateur interagit avec son outil. C’était alors l’époque où les applications permettant d’échanger avec la machine avec leurs voix. Après tout, la voix de Siri permet de donner une dimension palpable à l’outil qu’on utilise. Humaniser un logiciel permet à mon sens de capter une nouvelle audience en ajoutant une couche de simplification au dessus d’un outil déjà simplifié à l’extrême.

https://www.youtube.com/watch?v=n4LuPULsrCQ

Avant cela, j’avais déjà travaillé sur une autre mouture de l’interface du moteur un peu plus proche de ce qui existait déjà.

Parcourir le web, un lien à la fois

Maintenant, parlons de mon projet qui remonte à deux ans (en 2020 donc). A cet instant, je m’intéresse beaucoup moins à l’interface utilisateur, mais bien à la technologie derrière les outils que j’utilise au quotidien.

J’ai le besoin de mieux comprendre comment faire tourner un vrai crawler.

Et pour cela, la première idée qui me vient à l’esprit est littéralement une boucle récursive: un moulin qui ne s’arrête jamais puisqu’il persiste à parcourir toutes les branches d’un arbre dont la hauteur n’est probablement pas un représentable par un nombre raisonnable.

Du coup, j’ai commencé à la dure ! Une boucle récursive est initialisée par un appel de l’utilisateur au format ligne de commande. Par la suite, une partie du code (au format Objet) se connecte à notre base de donnée pour être rappelée autant de fois que nécéssaire en écriture.
La boucle va ajouter ou modifier les valeurs dans notre base de donnée correspondant à la page web et dont la clé est pour le moment le lien hypertexte de notre page.

L’outil que j’ai développé est disponible sur Netneer.com !

Ce que j’en ai appris

Tout cela, en plus de me servir d’exercice, m’a permis d’entrevoir les limites des outils que j’utilisais alors, mais aussi les contraintes qui en découlent.

D’abord, le language JAVA est un langage séduisant et robuste, mais condamné à tourner sur une machine virtuelle appelée JVM (JAVA Virtual Machine). Cette dernière est une machine à gaz, opaque et dont on ne peut percevoir le fonctionnement de l’extérieur. En gros, c’est une boite noire qui n’est pas du tout optimisée pour mon idée, puisqu’à terme, je veux pouvoir faire des Threads de mes différents Crawlers pour faire tourner plusieurs araignées en parallèle. Ce qui fait que sur une machine donnée, je veux pouvoir avoir un maximum de threads qui tournent en parallèle, et qui soient orchestrés par un outil plus automatisable qu’un appel de commande.

Ensuite, il y a la base de données que j’utilisais: une base MySQL toute simple. Mais encore une fois, ce n’est pas ce que je veux pour manipuler de grandes quantités de données de manière plus souple, tout en imaginant un système de classification qui soit plus performant qu’un simple attribut. De plus, j’imagine que si une base MySQL est amplement suffisante pour faire tourner un site classique, ce n’est pas le meilleur outil pour l’application de mes rêves.

Je pense me tourner à terme vers une solution en C plus plus. Mais j’hésite encore, et comme je vois de nouveaux langages apparaître régulièrement, je pense avoir l’opportunité de découvrir de nouvelles manières de construire le moteur de recherche de mes rêves !

Conclusion

J’essaie de découvrir de nouvelles technologies à apprivoiser très régulièrement, et mes projets personnels sont pour moi l’un des meilleurs moyens de rester à la page.

Je trouve néanmoins que l’évolution de mon petit projet personnel m’encourage à en apprendre plus !