Suivez Intuiface :

6 janvier 2023

L'IA générative dans l'affichage dynamique : Qu'est-ce que c'est, comment l'utiliser et quelles sont les prochaines étapes ?

L'IA générative et l'affichage numérique

Il s'agit d'un billet de blog invité par

Geoff Bessin

OCM

Vous avez lu des articles sur ChatGPT, DALL-E, Stable Diffusion, etc. Ce sont tous des exemples de la dernière tendance technique : l'IA générative. Cet article de blog explore l'IA générative, comment l'utiliser dans l'affichage dynamique et ce que l'avenir nous réserve. Si vous souhaitez garder une longueur d'avance dans votre stratégie d'affichage dynamique, lisez la suite !

Introduction

Le monde de l'IA générative est en pleine effervescence. Des algorithmes surpuissants écrivent du code, rédigent des histoires et créent des images qui défieraient un test de Turing. Dans l'ombre, des processus d'apprentissage machine extrêmement complexes s'enfoncent dans des milliards de mots, de graphiques et de codes créés par l'homme, devenant de plus en plus intelligents et créatifs à chaque minute.

Et comme ces algorithmes sont entièrement accessibles via l'API Web, ils sont facilement incorporés dans vos expériences Intuiface.

Prenons le temps de comprendre le monde de l'IA générative, sa valeur pour l'affichage dynamique, et comment vous pouvez l'utiliser dans Intuiface.

Qu'est-ce que l'IA générative ?

L'intelligence artificielle générative (IA) est un sous-ensemble de l'apprentissage automatique qui permet aux ordinateurs de créer un nouveau contenu (texte, audio, vidéo, images ou code) en utilisant la connaissance d'un contenu créé précédemment. Le résultat a une apparence authentique et est totalement original.

Les algorithmes qui créent ce contenu unique sont basés sur des modèles qui reflètent les leçons apprises sur un sujet particulier. Ces leçons ne sont pas programmées ; au contraire, les algorithmes s'auto-apprennent par le biais d'un mécanisme connu sous le nom d'apprentissage profond, en affinant leurs modèles au fur et à mesure de l'arrivée de données sur un sujet. Parmi les nombreux aspects fascinants de cette technologie, citons la flexibilité du moteur d'apprentissage, qui s'adapte à tous les aspects de l'expression humaine. L'esthétique d'une image et le formalisme d'un code JavaScript sont tous deux réalisables !

Quelles sont les options d'IA générative les plus populaires ?

L'exemple le plus connu d'IA générative est GPT - actuellement représenté par GPT-3.5, la dernière version du modèle de prédiction linguistique de troisième génération de la série GPT. Créé par OpenAI, cet algorithme peut être adapté pour créer des images et tout ce qui possède une structure linguistique : il répond à des questions, rédige des essais, élabore des résumés de textes plus longs, écrit du code logiciel et traduit même des langues. OpenAI a fourni au modèle GPT environ 570 Go d'informations textuelles provenant de l'internet pour obtenir cette capacité de langage naturel. Vous voulez l'essayer ? Rendez-vous sur ChatGPT, créez un compte gratuit et entamez une conversation.

Pour la génération d'images, les options les plus connues sont DALL-E (également basé sur GPT), Midjourney et StableDiffusion. Comme ChatGPT, ces services prennent le langage naturel en entrée, mais ils produisent des images en sortie. Le résultat peut être dans n'importe quel style - des thèmes inspirés de l'art comme le cubisme ou l'impressionnisme aux images complètement réalistes qui ressemblent à des photographies mais qui ont été créées par un algorithme.

Comment fonctionne l'IA générative

Ha ! Si vous cherchez un traité sur la science de l'apprentissage profond, ce n'est pas le lieu. En revanche, nous pouvons parler de la manière dont ces modèles sont exposés aux utilisateurs.

Les demandes de texte et d'images sont soumises sous la forme d'un "message-guide". Les messages-guides sont des phrases en langage naturel qui expriment le résultat souhaité. La création d'un message est un art en constante évolution, car plus le message est précis et descriptif, plus vous avez de chances d'obtenir exactement ce que vous voulez.

Cet article n'est qu'un exemple parmi d'autres de la façon dont l'élaboration d'un message publicitaire relève autant de la science que de l'art.

Vous pouvez désormais assouvir votre désir de voir "Yoda assis sur le trône de fer de "Game of Thrones" au marbre de Fenway Park". (Nous avons utilisé la diffusion stable pour générer l'image ci-dessous avec ce texte exact).

Comme vous le verrez ci-dessous, la plupart des services d'IA générative sont accessibles par le biais d'un ensemble d'API. Grâce à ces API, les services commerciaux - et, dans notre intérêt égoïste, la signalisation numérique - peuvent intégrer la technologie.

Comment le marché B2B utilise l'IA générative

Il existe désormais une longue liste (qui ne cesse de s'allonger) d'entreprises qui tirent parti de l'IA générative.

Dans le graphique ci-dessous, la colonne de gauche identifie les modèles génératifs les plus courants sur le marché. Les différents domaines de solutions et les entreprises qui utilisent des modèles génératifs pour fournir des services dans ces domaines sont indiqués à droite.

‍

SOURCE: https://www.battery.com/wp-content/uploads/2022/10/Battery-Ventures-OpenCloud-Report__2022.pdf

Comment l'affichage dynamique traditionnel peut tirer parti de l'IA générative

L'IA générative peut être une excellente technologie d'accompagnement pour créer des expériences d'affichage dynamique uniques et attrayantes. Grâce à elle, l'affichage dynamique peut créer et afficher dynamiquement du contenu en temps réel qui s'adapte parfaitement au contexte. Ce contenu peut être influencé par le comportement de l'utilisateur ou par des sources de données externes, qu'il s'agisse de prévisions météorologiques ou de prix en temps réel.

En voici quelques exemples :

Créer des images contextuelles qui reflètent l'information, l'environnement ou le site audience.
Générer des résumés et/ou des traductions de textes imprévisibles tels que des bulletins d'information ou des événements sportifs.
Réécrivez les messages avec des tonalités et des longueurs différentes en fonction de audience ou de l'urgence.

L'obstacle le plus important est la performance, en particulier pour la génération d'images, car les solutions d'IA générative actuelles ne sont pas (encore) instantanées. En fonction de la complexité de la demande et du résultat souhaité, la génération d'images peut même prendre quelques secondes. Par conséquent, l'affichage doit être proactif dans la demande de contenu pour s'assurer qu'il n'y a pas de latence visuelle.

Comment affichage numérique interactif augmente la valeur de l'IA générative

En adoptant affichage numérique interactif, qui permet de connaître les préférences de l'utilisateur, vous pouvez aller plus loin avec l'IA générative. Désormais, vous n'êtes plus limité à un contexte externe ; vous connaissez parfaitement votre site audience et pouvez communiquer en conséquence.

Par "interactif", nous entendons tout type de conversation homme-machine, qu'elle soit active ou passive. Les options actives comprennent tactile, les gestes et reconnaissance vocale, tandis que les options passives comprennent les capteurs et la vision par ordinateur. Pour toutes les modalités, en combinaison avec le contexte et le contenu à l'écran, la signalisation numérique peut clairement identifier les intérêts d'un utilisateur.

En voici quelques exemples :

Utilisation des données de l'utilisateur pour créer des "avatars" personnalisés pour la durée de la session.
Ajoutez une personnalité excentrique à l'interaction, en créant des blagues et des apartés spirituels pour l'utilisateur dans le contexte d'un engagement numérique qui pourrait être ennuyeux.
Conversion d'une revue des commandes du panier d'achat en texte conversationnel pour humaniser l'utilisation du kiosque.
Utiliser une technologie de reconnaissance faciale anonyme pour identifier l'âge/le sexe et utiliser cette information pour personnaliser la communication.
Traduire des sources de données en constante évolution, comme un catalogue de produits ou des informations touristiques.

Pour tout scénario de langage naturel, le concepteur - ou l'utilisateur - pourrait choisir de transformer dynamiquement le texte en parole (TTS) en utilisant des services spécifiques au système d'exploitation ou avec l'aide de services génératifs d'IA reconnaissance vocale comme VALL-E.

Dans tous les cas, l'équipe créative n'a pas à anticiper le large éventail d'utilisateurs, de scénarios et de besoins potentiels. Elle peut simplement compter sur une ressource d'IA générative pour faire le gros du travail en temps réel.

Utilisation de l'IA générative dans Intuiface

Comme de nombreux services d'IA générative sont exposés par le biais d'API Web, une requête textuelle (l'"invite") peut être soumise par programme, la réponse texte/image étant récupérée en temps réel pour être affichée. Grâce à Intuiface API Explorer, les utilisateurs d'Intuiface peuvent facilement créer des intégrations avec ces API Web, même s'ils n'ont que peu ou pas de connaissances sur le fonctionnement de ces API.

La plupart des API Web pour l'IA générative permettent une utilisation limitée gratuite et font appel à un système de paiement par jeton ou par image pour l'adoption à grande échelle. Voici quelques exemples d'API, toutes prises en charge par Intuiface API Explorer:

OpenAI pour la création, l'achèvement et la traduction de textes
DALL-E (basé sur OpenAI) pour la génération d'images
Comme indiqué ci-dessus, un bon exemple de DALL-E peut être trouvé dans notre communauté d'utilisateurs. ‍
Diffusion stable pour la génération d'images
Une explication sur l'utilisation de la diffusion stable dans Intuiface est disponible ici.
L'API officielle de ChatGPT n'est pas encore disponible mais devrait l'être prochainement...

Par exemple, Paolo Tosolini, de Tosolini Productions, partenaire d'Intuiface, a publié sur notre communauté d'utilisateurs un excellent exemple de la façon dont il a utilisé API Explorer pour créer une intégration en temps réel avec DALL-E.

Alors que l'exemple présenté ci-dessus utilise une interface utilisateur basée sur Intuiface qui dépend de l'entrée humaine pour générer une invite (et donc une image), Intuiface peut également extraire des informations de l'environnement d'une expérience et les utiliser pour créer une invite. Par exemple, l'invite peut inclure des mots liés à la température actuelle, au nombre ou à la présence de personnes passant à proximité, à l'heure de la journée, etc. - toutes ces informations sont collectées et combinées de manière significative pour un algorithme d'IA génératif en temps réel.

Comme indiqué plus haut, cette approche permet au concepteur de l'expérience de ne pas avoir à identifier tous les scénarios possibles et à créer des réponses appropriées de manière proactive. Les images et les textes peuvent être créés automatiquement par un service d'IA génératif sur la base d'une infinité de contextes environnementaux et livrés presque en temps réel. Une telle génération automatique de contenu est une révolution pour l'affichage dynamique !

L'IA générative et l'affichage dynamique - Perspectives d'avenir

L'IA générative évolue continuellement et devient de plus en plus accessible. Elle deviendra de plus en plus courante dans les réseaux d'affichage numérique à mesure qu'elle deviendra moins chère, plus rapide et plus facile à utiliser. Elle permettra aux entreprises de créer des expériences uniques adaptées à chaque spectateur ou à l'environnement dans lequel il se trouve.

On peut imaginer un service d'assistance entièrement automatisé, un moteur de recommandation (pour les vêtements, les repas, les destinations) ou un guide touristique. Les possibilités de l'IA générative pour l'affichage numérique - et nos vies ! - sont pratiquement infinies. Au fur et à mesure que cette technologie évolue, ses applications potentielles augmentent de façon exponentielle.

Vous pouvez commencer votre exploration dès aujourd'hui. Utilisez Intuiface pour vous plonger dans l'eau, expérimenter la technologie et l'utiliser pour améliorer vos expériences interactives.