ChatGPT

  • Auteur/autrice de la publication :

ChatGPT est un prototype d’agent conversationnel utilisant l’intelligence artificielle développé par OpenAI et spécialisé dans le dialogue. L’agent conversationnel est un modèle de langage affiné à l’aide de techniques d’apprentissage supervisé et d’apprentissage par renforcement.

ChatGPT est lancé en novembre 2022 et attire l’attention pour ses réponses détaillées articulées, bien que son exactitude factuelle soit critiquée.

En 2023, la société OpenAI, maison-mère de ChatGPT est valorisée 29 milliards de dollars américains.

Caractéristiques

Page d’accueil de ChatGPT avant le 15 décembre 2022.

ChatGPT est un agent conversationnel à intelligence artificielle ou « chatbot », autrement dit un assistant virtuel qui utilise les nouvelles technologies pour dialoguer avec ses utilisateurs.

Disponible dans de multiples langues comme le français, son robot conversationnel est capable de comprendre les questions des utilisateurs et d’y répondre dans un langage très proche de celui d’un humain.

Modèle de langage et d’apprentissage

ChatGPT est affiné sur la base du modèle de langage GPT-3 d’OpenAI, avec l’apprentissage supervisé et l’apprentissage par renforcement, les deux approches faisant appel à des formateurs humains pour améliorer les performances du logiciel.

Dans le cas de l’apprentissage supervisé, le modèle reçoit des conversations dans lesquelles les formateurs jouent les deux rôles : l’utilisateur et l’assistant d’intelligence artificielle.

Dans l’étape de renforcement, les formateurs humains ont d’abord classé les réponses que le modèle avait créées dans les conversations précédentes. Ces classements ont été utilisés pour créer des modèles de récompense sur lesquels le modèle est affiné en utilisant plusieurs itérations de Proximal Policy Optimization (en) (PPO).

Les algorithmes de Proximal Policy Optimization présentent un avantage économique par rapport aux algorithmes de Trust Region Policy Optimization (en) ; ils annulent un grand nombre d’opérations coûteuses en calcul avec des performances plus rapides. Les modèles sont formés en collaboration avec Microsoft sur son infrastructure de supercalculateur Microsoft Azure.

Atouts

Par rapport à son prédécesseur, InstructGPT, ChatGPT tente de réduire les réponses erronées et trompeuses. Par exemple, lorsque l’utilisateur écrit :

« Raconte-moi quand Christophe Colomb est arrivé aux États-Unis en 2015 », InstructGPT considère cette affirmation comme vraie, tandis que ChatGPT utilise des informations sur les voyages de Christophe Colomb ainsi que des informations sur le monde moderne, y compris la perception de Christophe Colomb dans notre société contemporaine, pour construire une réponse qui imagine ce qui se passerait si Colomb venait aux États-Unis en 2015.

À la différence de la plupart des agents conversationnels, ChatGPT se souvient des messages précédents qui lui sont donnés par l’utilisateur au cours d’une même conversation, ce qui, selon certains journalistes, lui permettrait d’être utilisé comme un thérapeute personnalisé.

Dans le but d’empêcher que des résultats offensants soient présentés à ChatGPT ou produits par celui-ci, les requêtes sont filtrées par une API de modération et les messages potentiellement racistes ou sexistes sont rejetés.

Limites

ChatGPT possède cependant de multiples limitations.

Le modèle de récompense de ChatGPT, conçu autour de la surveillance humaine, peut par exemple être suroptimisé et ainsi entraver les performances, un phénomène connu sous le nom de loi de Goodhart.

En outre, ChatGPT n’a pas accès à Internet et a une connaissance limitée des événements survenus après 2021. La base de données utilisée par ChatGPT ne contient en effet que des informations antérieures ce qui peut poser problème lorsque la recherche concerne des événements récents. Si l’utilisateur interroge par exemple ChatGPT sur l’effondrement en 2022 de la plate-forme de cryptomonnaies FTX, l’IA se révèle incapable de répondre. Elle se contente alors d’indiquer :

« Je suis désolé, mais je ne suis pas en mesure de fournir des informations sur des événements qui ont pu se produire dans la réalité. Mon training ne couvre pas de tels événements et je n’ai pas accès à l’internet pour effectuer des recherches. »

Lors de la phase d’entraînement de l’IA, les évaluateurs humains ont par ailleurs privilégié la rédaction de réponses plus longues, indépendamment de la compréhension réelle du sujet traité ou du fait qu’il s’agisse d’un contenu factuel.

Les données d’entraînement peuvent également souffrir d’un biais algorithmique. Des messages comprenant des descriptions vagues de personnes, comme un président directeur-général, pourraient ainsi générer une réponse qui suppose que cette personne est, par exemple, un homme blanc.

Intégration dans des solutions Microsoft

Microsoft Bing

Dans le cadre du partenariat entre Microsoft et Open AI, un projet d’intégration de ChatGPT dans le moteur de recherche Microsoft Bing serait à l’étude. En effet, d’après le média The Information, ChatGPT pourrait être intégré dans une future version de Bing afin d’assister l’internaute dans sa recherche en ligne.

L’intégration de ChatGPT se ferait sous la forme d’une option qui permettrait à l’utilisateur de lancer des requêtes à travers le robot conversationnel. Au lieu de proposer une liste de liens comme dans un moteur de recherche classique, Bing serait alors capable de répondre de façon ciblée à l’internaute.

L’objectif pour Microsoft serait ainsi de permettre à son moteur de recherche Microsoft Bing de concurrencer Google qui détient plus de 90 % des parts du marché mondial en 2023.

Microsoft Office

Selon le média The Information, Microsoft souhaiterait également intégrer ChatGPT dans sa suite bureautique Microsoft Office.

Dans Microsoft Outlook, l’objectif serait d’améliorer l’interface de recherche afin de permettre à l’utilisateur d’obtenir des résultats à partir de simples requêtes, et également d’accéder à des propositions de textes de mails, qui seraient rédigées directement par lIA sur la base de l’historique des échanges de l’utilisateur.

Dans Microsoft Word, le robot conversationnel serait capable de donner à des conseils à l’utilisateur dans la rédaction de son document.

Dans Microsoft PowerPoint, ChatGPT pourrait générer des diapositives à partir des discussions entre les utilisateurs dans Microsoft Teams.

Cependant, pour le journaliste Julien Lausson du site Numerama, ces différents usages de ChatGPT soulèvent des problèmes de confidentialité par rapport aux données des utilisateurs, car l’IA aurait ainsi accès à leurs correspondances, y compris à leurs correspondances privées.

Essayez ChatGPT

ChatGPT : Optimiser les modèles de langage pour le dialogue (openai.com)

Laisser un commentaire