Un vélo (électrique) pour l’esprit
Si l’ordinateur augmente l’homme, est-ce que l’intelligence artificielle va faire de même ? Rapport d'étonnement suite au lancement des applications ChatGPT et Dall-E #210
👨🚀 Tous les mardis, Stéphane décrypte la transformation numérique de l'économie et la société. En savoir plus sur cette lettre : À propos
Vous êtes 159 nouveaux abonnés depuis la semaine dernière. Soyez les bienvenus et merci aux autres pour leur fidélité !
Pas encore abonné•e ?
💌 Vous et moi
La date de lancement du parcours d’apprentissage "transformation numérique” sur laquelle je travaille depuis des mois approche. Je vous en parlerai plus en détail prochainement. Ce travail de fond m’oblige à me mettre à la place de celles et ceux qui ont en charge la transformation de leur entreprise ou leur filière. Comment les aider à comprendre ce qui se passe et ce qui va arriver ?
C’est pourquoi je regarde avec un intérêt particulier les Large Language Models, ces programmes d’intelligence artificielle aussi appelés modèles génératifs. Ils permettent de créer avec une simple consigne un visuel, un texte, une musique ou une vidéo. Près de 2 millions d’utilisateurs ont déjà testé “Dall-E” ou “ChatGPT” et inondent les réseaux de démos épatantes.
Je suis loin de saisir toutes les subtilités de ces outils et les possibilités qu’ils offrent. Comme le dit très bien Etienne Klein, j’en suis au stade où “j’en sais suffisamment pour savoir ce que je ne sais pas encore”. Mais je pense pouvoir dire sans me tromper qu’il s’agit d’une étape importante dans l’accès aux technologies. Je vous propose donc un premier rapport d’étonnement, avec comme toujours de nombreux liens dans la rubrique suivante pour aller plus loin et vous faire votre propre opinion
J’ai demandé à Dall-E : “a robot riding an e-bike and dressed like an entrepreneur in the 80s in the californian countryside”
🎯 Cette semaine
Chaque semaine un nouveau sujet décrypté. Cette semaine nous avons étudié les modèles génératifs d’Open AI.
Dans un documentaire de 1980, Steve Jobs citait une étude selon laquelle l’humain était l’un des animaux les plus inefficients de la création (distance parcourue / énergie consommée) alors que, juché sur un vélo, il devenait de loin le plus efficient de tous les animaux. La capacité des humains à utiliser des outils leur a permis de dominer les autres espèces et de “battre l’évolution”. Présentant sa vision du futur, l’entrepreneur considérait que l’ordinateur personnel était l’équivalent d’un “vélo de l’esprit” : l’outil moderne indispensable à l’homme pour affronter les nouveaux défis de l’information, de la créativité et de la collaboration. Plus de 40 ans après, difficile de le contredire. Le PC puis les smartphones ont accompagné une formidable démocratisation des savoirs, de l’information et des savoir-faire. Et une autre révolution semble à nos portes…
L’évolution récente des technologies d’intelligence artificielle est remarquable. Depuis quelques années les “AI” sont capables de reconnaître des images, comprendre des textes et les traduire mieux que les humains.
La croissance des activités de calcul dédiées à l’intelligence artificielle est vertigineuse : leur volume double tous les 3 mois depuis 10 ans !
Des applications existent déjà dans les logiciels que vous utilisez au quotidien (pensez au correcteur de texte ou à la gestion de vos photos). Ce qui vient de changer cet hiver est l’ouverture de ces solutions. Elles sont désormais accessibles au grand public - particuliers et entreprises - grâce au travail réalisé par Open AI, une entreprise fondée par Sam Altman et…Elon Musk. Chemin faisant, Microsoft a également pris des parts dans l’aventure et Musk a quitté le navire. Open AI, centrée sur la recherche et le déploiement à l’origine, lève aujourd’hui des fonds pour financer son développement. Deux millions de personnes ont déjà testé ChatGPT en quelques semaines, soit l’adoption la plus rapide de l’histoire des technologies.
Comment ça fonctionne ?
Ce qui nous intéresse ici plus particulièrement est le Machine Learning et le Deep Learning : la capacité pour un programme d’évoluer dans sa manière d’interpréter des données lorsqu’il se retrouve confronté à suffisamment de données, même si elles sont hétérogènes.
Comme souvent, l’analyste Benedict Evans trouve les mots clairs pour exposer les enjeux et les limites de ces modèles génératifs :
La rupture du machine learning est de prendre un groupe de problèmes logiques qui sont “simples à faire pour des humains mais compliqués à décrire pour des humains” et les transformer en problèmes statistiques. Au lieu d’essayer d’écrire des séries de tests logiques pour distinguer une photo de chien d’une photo de chat, ce qui semblait simple mais en réalité n’a jamais fonctionné, nous donnons au programme informatique un million d’exemples de chaque et le laissons trouver lui-même les modèles (patterns) dans chaque échantillon. Au lieu d’essayer d’écrire des règles que la machine devra appliquer aux données, nous donnons des données et des réponses à la machine (“cette photo est une photo de chien”) et la machine calcule les règles. Ça marche incroyablement bien, se généralise au-delà des images, mais rencontre les limitations inhérentes au fait que de tels systèmes n’ont aucune compréhension structurelle de la question - ils ne savent pas conceptualiser les “yeux” ou les “jambes” et encore moins les “chats”.
Une fois les patterns identifiés dans des milliards d’images, le modèle les applique à chaque élément les composant, vous permettant ainsi d’obtenir des réponses aux requêtes les plus baroques : “un robot en vélo électrique habillé comme un entrepreneur des années 80 en Californie”.
Premières critiques
Les premières critiques n’ont pas tardé à souligner plusieurs problèmes.
Ces outils ne présentent pas des résultats “justes” mais une “version crédible de la justesse”. Ce que répond ChatGPT dans un style de bonne facture représente une bonne approche statistique de la question. “Un outil limité, mais assez bon pour créer une impression trompeuse d’émerveillement” comme le dit son co-fondateur Sam Altman.
Les enseignants en particulier n’ont pas tardé à voir le danger que représentait l’usage intempestif d’outils comme ChatGPT pour trouver des “réponses crédibles” à des exercices ou même des dissertations.
Ces modèles ne sont jamais aussi bons que les jeux de données qui les ont nourries : la demande “représente moi un dirigeant d’entreprise” a de grande chance de représenter un homme blanc d’âge mûr. Encore une fois, l’outil n’est pas un outil d’analyse ni de créativité, c’est un outil qui créé des modèles à partir d’un échantillon de données. Pire : il y a des humains dans la boucle, qui taguent les photos et vérifient les résultats. Et les humains aussi ont des biais.
C’est ennuyeux si vous jouez à créer des images. C’est hyper dangereux si vous utilisez ces modèles pour - au hasard - retrouver un suspect ou sélectionner des candidats pour un job.
L’utilisation d’images et de données récoltées sur le web pose évidemment des problèmes juridiques et éthiques : quid des créateurs et de leurs créations qui alimentent ces modèles ?
Les modèles génératifs ne sont pas non plus un nouveau moteur de recherche comme l’est Google ou Bing. Un moteur de recherche fournit une série de résultats, classés du plus pertinent ou moins pertinent. C’est important pour l’internaute d’avoir plusieurs résultats : lui seul connait le contexte, la manière dont l’information peut être rangée, les termes même qui sont employés. Ceci explique notamment que seuls 28% des premiers résultats sur Google sont cliqués. Le choix est roi.
Un moteur de recherche va également fournir des liens vers des publications ou des extraits de publications, qu’il vous appartient de lire, d’analyser et comprendre. Les résultats obtenus en interrogeant un modèle génératif comme ChatGPT sont d’un tout autre ordre : les textes sont riches et bien structurés, mais il ne s’agit que d’une seule réponse, qui peut s’avérer totalement à côté de la plaque.
Tout ceci va bien évidemment évoluer, mais l’objectif de ces modèles ne sera jamais “d’aller chercher sur internet” les meilleures réponses à votre question. Il s’agit de créer des patterns à partir de données qu’ils auront déjà traitées et les appliquer à votre question pour vous fournir la réponse statistiquement la plus probable.
En revanche, le développement probable de ce type d’outils va poser un gros problème à tous les business basés sur la publicité “contextualisée”, c’est à dire positionnée le plus près possible d’une recherche sur le web. La fin d’une époque.
À quoi ça peut servir ?
Avec toute la prudence requise par la nouveauté de ces solutions (lancement en octobre 2022 !), il semble que nous soyons en face d’une nouvelle forme de technologies de rupture - disruptive technologies selon les termes de feu Clayton Christensen. Des technologies qui fournissent à moindre coût une solution juste assez bonne pour un certain nombre de cas d’usages et qui remplacent les technologies dominantes. Pensez par exemple au covoiturage sur des trajets desservis par le train ou au smartphone comparé à votre PC : ça fait le job suffisamment pour certains usages, et ça répond à d’autres besoins que la technologie dominante. S’agissant des modèles génératifs, Benedict Evans les compare à une “armée de stagiaires” qui pourrait vous alerter sur un problème “qui revient souvent” mais sans vraiment comprendre pourquoi ce problème arrive. Tout dépendra selon lui de la qualité des consignes données, de ce que vous leur aurez montré et expliqué.
Nous sommes actuellement dans la période où les influenceurs technologistes s’en donnent à coeur joie pour imaginer les usages futurs de ces modèles génératifs. Parmi toutes les propositions examinées, l’une a retenu mon attention : m’aider dans mon travail de consultant 😚. Avec mon associée Noémie je pense que nous devons lire au bas mot une centaine d’articles, newsletters et posts par mois. Nous avons développé quelques outils d’archivages, mais il est clair que nous perdons beaucoup de matière dans l’exercice. Nous pourrions utiliser un Large Langage Model pour chercher au-delà de notre propre taxonomie l’ensemble des ressources, échanges, commentaires,…et pouvoir ainsi formuler des réponses argumentées à des questions du type : “quels sont les exemples d’application utilisant ChatGPT qui pourraient servir à nos clients existants ?”. Vue la qualité des données dont nous disposons, cela devrait être un jeu d’enfant et nous permettre d’aller beaucoup plus vite.
Mon métier suppose de prendre une certaine dose de risques dans la manière de voir le futur, et il faut éviter de sauter sur la dernière innovation. Dans quelques années je regarderai sans doute ce post avec amusement tant j’ai du rater de choses évidentes.
Concernant les avancées récentes des usages de l’intelligence artificielle, je pense que nous en sommes à peu près au même stade que les contemporains de Steve Jobs en 1980. On voit très bien à quoi cela peut servir aujourd’hui - faire des images sympas - , mais très difficilement ce que le potentiel de rupture de ces technologies apportera.
Nous avons l’engin, mais pas encore la vision de jusqu’où nous emmènera notre vélo électrique de l’esprit et ce que cela changera dans nos villes.
J’espère vous avoir donné envie d’explorer ces chemins.
🧐 Et aussi
Des ressources utiles en lien avec le sujet traité cette semaine.
La vidéo dont est issue l’expression “bicycle of the mind” le vélo de l’esprit. La capacité de Steve Jobs a voir le futur est tout à fait remarquable. A Bicycle of the Mind' - Steve Jobs on the Computer
D’où vient l’intelligence artificielle et où allons-nous ? The brief history of artificial intelligence: The world has changed fast – what might be next?
Comment fonctionne la reconnaissance d’images ? AI can now create images out of thin air. See how it works - Washington Post
Les premières utilisations d’OpenAI ne donnent en réalité que de faibles indications sur les usages futurs. C’est le “moment Imagenet”, du nom d’un concours de 2010 pour chercheurs en computer vision : c’est épatant mais qu’allons-nous en faire ? ChatGPT and the Imagenet moment - Benedict Evans
Pourquoi ChatGPT ne va pas remplacer les moteurs de recherche avant longtemps. Why ChatGPT won’t replace search engines any time soon - Algolia
Comment ChatGPT pourrait vous aider à vous organiser. The End of Organizing
Microsoft a déjà investi 1 milliard de dollars dans Open AI. D’autres investisseurs se montrent très intéressés. ChatGPT Creator Is Talking to Investors About Selling Shares at $29 Billion Valuation - WSJ
La riposte de Google (je n’ai pas eu le temps de l’analyser) Muse: Text-To-Image Generation via Masked Generative Transformers
🤩 On a aimé
Nos trouvailles de la semaine, en vrac et dans le désordre
Quels ont été les effets du COVID sur les déplacements des New-Yorkais ? Magnifique travail de data-visualisation lauréat du concours Information is beautiful MTA Ridership Changes due to COVID-19
Un site pour retrouver les images de votre rue à différentes époques du passé. Bien vu IGN. Remontez le temps !
Un sujet qui nous tient à coeur avec Noémie : « Vestige d’un temps révolu, la conversation est en voie de disparition » - David Le Breton
L’occasion de vous repartager l’une de mes vidéos préférées 10 conseils pour une meilleure conversation - Celeste Headlee
Et pour finir si vous aimez les articles scientifiques, un site qui recense les titres les plus drôles de papiers scientifiques. All research papers with funny titles in one place
Si vous avez apprécié cette lettre, laissez-nous un 💙 pour nous encourager.
Et n’oubliez pas la seconde newsletter de 15marches, Futur(s) :
👩🏻🚀 Tous les jeudis, Noémie raconte les futurs possibles en fiction.
Pour ma part je vous dis à la semaine prochaine !
Stéphane
Je suis Stéphane Schultz, de 15marches. Le jour je suis consultant, je prends des trains à travers les plaines. La nuit je lis et j’écris cette lettre.
Très intéressant, merci. En matière de création vidéo, l’IA reste encore limitée mais on entrevoit les possibilités : élaboration de la structure narrative, génération de plans d’illustration, création de face cam fake ultra-réalistes. On ne v plus travailler de la même façon.
L'analyse de Stéphane sur la transformation numérique est particulièrement pertinente. Il souligne l'importance croissante des modèles génératifs, tels que ChatGPT, qui marquent une étape clé dans l'évolution technologique. Bien que ces outils offrent des possibilités fascinantes, il est crucial de les aborder avec prudence, notamment en raison des biais potentiels et des défis éthiques qu'ils posent. Ce type de réflexion est essentiel pour anticiper les impacts futurs sur nos vies professionnelles. D'ailleurs, dans ce contexte technologique en pleine mutation, des experts comme ceux de https://sherbrookelectricien.ca/ doivent également rester vigilants face aux innovations pour adapter les solutions aux besoins actuels et futurs.