TikTok abandonne les résumés de l’IA après avoir halluciné des myrtilles et des poulets en caoutchouc

2

TikTok a considérablement réduit sa fonctionnalité « Aperçus de l’IA », une décision motivée par une série de descriptions bizarres et inexactes qui ont miné la confiance des utilisateurs. La plateforme, qui testait un système automatisé pour générer des résumés textuels sous les publications vidéo, a décidé de pivoter. Au lieu de fournir un contexte narratif, la fonctionnalité mise à jour se concentrera désormais strictement sur l’identification des produits présentés dans les vidéos.

Cette retraite met en lumière les défis persistants auxquels les géants de la technologie sont confrontés lors du déploiement de l’IA générative dans des environnements de contenu en temps réel. Même si la technologie promet d’améliorer la découvrabilité et l’accessibilité, l’itération actuelle s’est révélée trop sujette aux « hallucinations » – des cas où l’IA invente en toute confiance des détails qui sont factuellement erronés ou qui n’ont aucun rapport avec le contenu visuel.

L’erreur “Blueberry” et autres échecs

La décision de rappeler cette fonctionnalité a été prise après que les utilisateurs et les journalistes ont documenté de nombreuses erreurs flagrantes. Les tentatives de l’IA pour interpréter le contenu vidéo aboutissaient souvent à des interprétations erronées surréalistes qui confondaient plutôt que clarifiaient l’expérience de visionnage.

Voici quelques exemples clés de ces échecs :

  • Identification erronée d’une célébrité : Une vidéo mettant en vedette Charli D’Amelio, créateur de TikTok, s’adressant à la caméra a été décrite par l’IA comme “une collection de myrtilles variées avec différentes garnitures.”
  • Interprétations abstraites : Un clip de la chanteuse Shakira a été qualifié de “une séquence répétitive de plusieurs formes bleues distinctes apparaissant et se déplaçant sur l’écran.”
  • Reconnaissance d’action absurde : Dans un exemple partagé sur Reddit, une vidéo de deux danseurs de salon a été identifiée à tort comme “une personne se frappant la tête à plusieurs reprises avec un poulet en caoutchouc.”

Ces erreurs n’étaient pas des incidents isolés mais faisaient partie d’un schéma plus large d’inexactitude qui frustrait les utilisateurs qui s’attendaient à ce que la fonctionnalité fournisse un contexte utile, semblable aux résumés affichés dans la recherche Google.

Pourquoi le contexte est important dans une vidéo courte

L’ambition initiale de TikTok avec AI Overviews était de refléter l’utilité des résultats de recherche générés par l’IA de Google. L’objectif était d’expliquer ce qui se passait dans une vidéo, offrant un contexte supplémentaire aux utilisateurs qui pouvaient la faire défiler silencieusement ou rechercher des informations rapides.

Cependant, la vidéo courte est intrinsèquement complexe. Il s’appuie sur des coupes rapides, de l’humour visuel, des références culturelles et un langage corporel nuancé – des éléments que les modèles d’IA actuels ont du mal à analyser avec précision. Lorsque l’IA ne parvient pas à reconnaître un visage humain ou une activité courante, elle utilise souvent par défaut une reconnaissance d’objet générique, ce qui entraîne une déconnexion discordante entre le contenu vidéo et la description textuelle.

Le problème principal : La précision est primordiale pour les résumés d’IA. Lorsqu’un outil destiné à clarifier le contenu crée de la confusion, il érode la confiance des utilisateurs et ajoute du bruit à la plateforme.

Un pas en arrière dans l’adoption de l’IA

Le pivot de TikTok vers l’identification des produits est un ajustement pragmatique. En limitant la portée de l’IA aux éléments commerciaux reconnaissables, la plateforme peut exploiter ses atouts en matière de vision par ordinateur tout en évitant les pièges de la génération de langage naturel pour un contenu créatif ouvert.

Cet incident reflète les tendances plus larges du secteur. Il y a quelques années à peine, Google a fait l’objet d’un examen similaire lorsque ses premières expériences de recherche en matière d’IA suggéraient des conseils absurdes, comme manger des pierres ou utiliser de la colle sur une pizza. Ces premiers faux pas soulignent une leçon cruciale pour l’industrie technologique : Les capacités de l’IA doivent évoluer en tandem avec des garanties de sécurité et de précision.

Conclusion

Le retrait de TikTok des résumés narratifs de l’IA sert de mise en garde pour les autres plateformes expérimentant l’IA générative. Bien que la technologie soit prometteuse pour améliorer l’expérience utilisateur, elle n’est pas encore prête à interpréter de manière fiable la nature nuancée et rapide de la vidéo sur les réseaux sociaux. Pour l’instant, identifier des produits est une application plus sûre et plus fonctionnelle que tenter de résumer la créativité humaine.