Cas d'usages

Marketing

Les sites web de la grande distribution donnent des informations précieuses sur le prix des produits. Les sociétés d’étude marketing ont mis au point des solutions de Web scraping pour récupérer ces informations, mais ce sont des opérateurs humains qui les analysent pour constituer des bases de données marketing.

Nous avons développé une application qui traite automatiquement les informations scrapées. Le traitement automatique peut être vérifié par des opérateurs pour en contrôler la qualité. Cette application divise le coût du travail manuel par 10 et le coût total du traitement par 2, elle permet de traiter en temps réel les informations et elle augmente la qualité du traitement en divisant par 3 le nombre d’erreurs.

Cette application réalise les fonctions suivantes qui à l’origine étaient faites par des opérateurs humains :

  • Détection de la catégorie du produit : cette tâche est très difficile à réaliser par un opérateur, car il peut y avoir un très grand nombre de catégories parfois plusieurs milliers.
  • Détection des marques
  • Associations de produits similaires : les produits semblables sont regroupés ensemble. Ce regroupement est capital pour l’analyse marketing, il est fait sur la base d’une expertise des opérateurs qui est captée par les algorithmes de machine learning.

À chaque information extraite est associé un coefficient de confiance, ce qui permet à l’exploitant de choisir les informations à valider par un opérateur et celles qui seront considérées comme juste sans validation.

Les prospectus sont analysés par des opérateurs humains pour fournir aux producteurs et aux distributeurs des informations sur l’activité promotionnelle de chaque distributeur. Ces traitements manuels sont coûteux, longs et de qualité variable.

Nous avons développé une application qui traite automatiquement les prospectus. Le traitement automatique peut être vérifié par des opérateurs pour en contrôler la qualité. Cette application divise le coût du travail manuel par 10 et le coût total du traitement par 2, elle permet de traiter en temps réel les prospectus et elle augmente la qualité du traitement en divisant par 3 le nombre d’erreurs.

Dans une page de prospectus, elle isole les images correspondant à chaque promotion. Quand une promotion présente plusieurs produits mis en scène (une cuisine avec plusieurs éléments en promotion), elle isole chacun des produits. Dans les promotions, elle reconnaît le texte promotionnel qui n’est pas détecté par les OCR classiques. À la fin du traitement, chaque promotion est détectée avec les informations qui s’y rattachent et associée à un produit de la base de données marketing. À chaque information extraite est associé un coefficient de confiance, ce qui permet à l’exploitant de choisir les informations à valider par un opérateur et celles qui seront considérées comme juste sans validation.

Une méta plateforme de distribution assure la diffusion des produits sur un grand nombre de marketplaces, ce qui permet aux distributeurs d’augmenter leurs ventes.

Aujourd’hui, cette méta plateforme utilise des équipes d’opérateurs pour décrire les produits dans le format des différentes marketplaces. Elle doit donc arbitrer entre les coûts de distribution et les profits espérés des ventes. Cet arbitrage est malthusien et limite son chiffre d’affaires.

Nous avons conçu une application qui décrit automatiquement, à partir de la description du vendeur, les produits dans les formats des différentes marketplaces. Cette application permet de distribuer un grand nombre de produits sur toutes les marketplaces. Le coût de la donnée traitée diminue avec le volume de données, ce qui incite la plateforme à traiter un grand nombre de produits et ainsi d’augmenter son chiffre d’affaires.

Tous les consommateurs ont été confrontés au problème de trouver un produit dans une grande surface. Ils sont alors confrontés à un autre problème : trouver un vendeur compétent, et s’ils sont dans un magasin de bricolage s’ajoute l’attente quand ils ont enfin trouvé un vendeur. Avec la réduction du personnel, ce problème devient un vrai casse-tête qui pousse les consommateurs à abandonner les achats en grande surface et à se rabattre sur Internet.

Nous avons conçu un assistant audio sur téléphone portable qui vous guide pour trouver le produit recherché. L’assistant facilite la vie du consommateur et le pousse à revenir dans les grandes surfaces, il permet aussi aux vendeurs de se consacrer à leur travail de conseil.

Pour l’instant, cet assistant a été conçu pour les consommateurs des grandes surfaces. Mais il pourrait être étendu à de nombreux domaines pour aider l’utilisateur à s’orienter : aéroports, hôpitaux, gares.

Aujourd’hui, notre système traite le dialogue entre l’assistant et l’utilisateur. Nous sommes en train de développer le repérage dans le magasin par reconnaissance d’image.

Construction

L’industrie du BTP vit sa révolution numérique avec le Building Information Model qui a pour but de remplacer les plans par des jumeaux numériques. Le BIM va bouleverser tous les processus du BTP afin d’augmenter la productivité de ce secteur de 50% à 60%. Ces jumeaux numériques sont essentiels pour le processus de construction, mais encore plus pour le processus de maintenance qui représente 80% des coûts globaux de ce secteur. Il y a donc un besoin considérable de réalisation de jumeaux numériques pour le construit existant (bâtiment, ouvrage d’art). Actuellement, ces jumeaux sont réalisés par des opérateurs en rétro-ingénierie à partir de nuages de points obtenus par télédétection laser (lidar). La charge en main d’oeuvre est importante, à tel point que ces chantiers sont souvent “outsourcer” dans les pays à faible coût de main d’oeuvre. Cette solution est peu satisfaisante, car les jumeaux sont à compléter et à vérifier sur site. De nombreux acteurs ont abandonné ces solutions d’outsourcing pour réaliser la rétro-ingénierie par des opérateurs qualifiés qui connaissent le site.

Nous développons un prototype pour un grand bureau d’études en utilisant les dernières techniques de la segmentation sémantique pour construire automatiquement une première ébauche du jumeau numérique à partir du nuage de points. Cette technique intégrée avec d’autres (lecture des plans 2D) doit permettre à terme d’alléger fortement le travail des opérateurs spécialisés et réaliser un gain de productivité important.

Elle peut être aussi utilisée pour certifier une maquette BIM, en s’assurant que le bâtiment est conforme à la maquette. Bien que ce secteur présente un potentiel économique moins important, il est essentiel pour le développement du BIM. Aujourd’hui, cette certification est réalisée par des opérateurs en utilisant la réalité augmentée. Pour cet usage l’automatisation est plus envisageable. Notre technologie permet de détecter automatiquement les écarts, entre l’existant et la maquette BIM, qui sont à vérifier par un opérateur.

Pour une société qui analyse et surveille l’état du réseau routier, nous avons réalisé une application qui détecte les équipements routiers pour aider à leur maintenance.

Cette société fait patrouiller des véhicules qui prennent des vidéos de la route. Notre application, analyse ces vidéos, détecte les équipements routiers, leur position et leur état.

Elle permet de déterminer les équipements à maintenir et de générer les ordres de mission pour les employés de la maintenance.

Grâce à cette application, l’exploitant peut faire une maintenance optimale de ses routes et surtout il évite tout contentieux dû à une mauvaise signalisation.

Dans le BTP, les documents contractuels jouent un rôle important tant du point de vue technique, contractuel et juridique. Il est donc important de les gérer au mieux pour que les différents acteurs puissent les consulter facilement.

Nous avons réalisé une application qui les classe automatiquement qu’ils soient en format texte ou en format PDF.

Avant l’utilisation de notre application, le service qui gérait ces documents faisait des erreurs de classification et passait un temps important à cette tâche sans apporter aucune valeur ajoutée.

Avec l’utilisation de notre application, le temps a été fortement réduit et les erreurs de classifications ont fortement diminué. Le service peut donc se concentre sur des tâches à plus fortes valeurs ajoutées.

Industrie

Les expériences scientifiques peuvent être très coûteuses, il est donc important de choisir les bonnes expériences à réaliser. Nous avons deux exemples dans la chimie où le test d’un produit est coûteux et où potentiellement il y a un très grand nombre de produits qui pourraient être testés pour trouver le plus performant.

À partir d’une base de résultats d’expérience limitée, contenant les résultats pour une centaine de produits. Nous avons développé un modèle prédictif qui permet de prévoir les résultats pour des milliers de produits. Ce qui permet aux expérimentateurs de tester que les produits les plus prometteurs.

Quand les experts sélectionnaient les produits à tester, 50% des expériences étaient concluantes, avec notre système, 90% des expériences sont concluantes.

Notre application a permis de diviser le budget expérimental par deux. Mais surtout, elle permet de constituer beaucoup plus rapidement une base de données des produits intéressants qui était l’objectif principal de notre client.

Nous avons même l’espoir à terme de remplacer les expériences réelles par des expériences virtuelles pour certaines applications.

Les CAM sont des modules électroniques au format “smartcard” qui s’intègrent dans tous les téléviseurs modernes et pour contrôler l’accès à des chaînes payantes.

Contrairement aux décodeurs sous forme de “box”, on ne peut pas dans les CAM récupérer le flux vidéo. Actuellement, pour tester les CAM, un opérateur regarde si les images du téléviseur correspondent au signal reçu : écran noir, menu d’anomalie, etc.

Nous avons réalisé un programme de reconnaissance d’image qui analyse les images, les classe et en extrait l’information pour les comparer aux résultats attendus afin de tester le bon fonctionnement de la CAM.

Dans le projet VirtualLab, nous avons présenté comment réaliser un laboratoire virtuel pour prédire les résultats d’expériences.

Pour faire ce laboratoire virtuel, nous avons besoin d’un corpus de résultats d’expérience. Plus les expériences sont complexes, plus ce corpus doit être important. Quand on ne dispose pas d’un corpus suffisant, une des solutions est de rechercher ces résultats dans les publications scientifiques. Pour cela, nous avons développé le projet ScientificReaderDigest.

Le but de ce projet est triple :

  • Trouver dans la masse des publications scientifiques celles qui contiennent des résultats d’expérience intéressants.
  • Extraire de ces publications, les passages qui concernent ces résultats.
  • Extraire de ces passages les résultats pour remplir automatiquement une base de données de résultats d’expérience.

Ce projet met en jeu une sémantique complexe qui ne peut être définie qu’à partir d’exemples annotés. Ce travail d’annotation est long et nécessite des opérateurs experts. On a donc réalisé un système incrémental qui permet à partir de mots clés caractéristiques de la sémantique de “bootstraper” le système.

Ces mots clés permettent de générer des requêtes pour rechercher les premiers documents. Ils permettent de retrouver les passages intéressants dans ces documents qui vont être annotés par les opérateurs. Ces annotations vont permettre de “reranker” les résultats du moteur de recherche, d’extraire et d'annoter automatiquement les passages, les opérateurs validant ou invalidant les annotations automatiques. Quand le corpus est suffisamment étendu, on construit un modèle qui extrait automatiquement les caractéristiques pour remplir la base de données. Le système s’améliore en continu, réduisant le travail des opérateurs et augmentant l’automatisation des tâches.

Administration

Il existe de nombreux fichiers regroupant un très grand nombre d’individus, rechercher une personne dans ces fichiers pose de nombreux problèmes : homonymie, imprécision dans les données, absence d’information.

Pour résoudre ces problèmes, les opérateurs ont développé une expertise qui leur permet de trouver les informations concernant la bonne personne.

Nous avons développé une application qui permet d’automatiser le travail des opérateurs.

Pour les recherches où notre application est très confiante, qui représentent 85% des données, le système automatique fait 3 fois moins d’erreurs qu’un opérateur.

Pour diminuer les coûts, on traite automatiquement les recherches confiantes et l’on assiste l’opérateur sur les autres recherches. La réduction des coûts est de 90% et le taux d’erreur est divisé par 3.

Pour augmenter la qualité, le cas de notre client, on assiste l’opérateur sur toutes les recherches. La réduction des coûts est de 50% et le taux d’erreur est divisé par 10.

Notre système est une refonte d’un système existant. Le système analyse le texte pour en extraire l’information, quand cette extraction est confiante l’information est directement stockée dans la base de données, quand elle incertaine, elle est présentée à l’opérateur pour validation.

Pour faciliter le travail de l’opérateur, le document est structuré pour qu’il puisse plus facilement naviguer et se repérer dans le document. Le texte qui a permis d’extraire l’information est présenté à l’opérateur pour qu’il puisse la confirmer.

Le système existant qui est en exploitation depuis de nombreuses années est basé sur un système de règles, il est difficile à maintenir et très peu performant. Notre système est basé sur le machine learning et apprend les concepts à partir du travail des opérateurs. Pour apprendre, il profite de deux types de sources : la valeur de l’information et parfois le texte annoté qui a conduit à cette information.

L’objectif est qu’au démarrage de son exploitation, il soit déjà plus performant que l’ancien système et qu’au fur et à mesure de l’exploitation il devienne de plus en plus en performant en captant l’expérience des opérateurs. Pour cela, le nouveau système intègre dans son interface une interface d’annotation.

Mobilité

Une startup a conçu une application pour afficher l’arrivée du prochain bus avec une interface en réalité augmentée. Il suffit de diriger son téléphone portable vers le panneau de l’arrêt de bus et le temps d’attente s’affiche sur votre portable. Cette application permet aux compagnies de bus d’améliorer leur service tout en évitant des dépenses importantes liées aux afficheurs, elle est particulièrement utile pour faciliter la mobilité en région.

Nous avons développé une application qui reconnaît automatiquement les arrêts de bus ce qui permet de récupérer en OCR les informations sur la ligne et l’arrêt pour afficher l’arrivée du prochain bus.

Service

Pour le client pour lequel nous avons réalisé le projet Product2MarketPlace, nous avons aussi réalisé l’automatisation de son service client.

En effet, en augmentant ses ventes de produits, son service client a été surchargé et l'automatiser a été la solution pour répondre aux demandes sans augmenter les équipes en place.

Nous avons réalisé un système de catégorisation automatique des mails qui correspond à des réponses types qui peuvent être automatisées. Avec ce système, le client a pu limiter le recours à des opérateurs en outsourcing, ce qui lui a fait baisser ces coûts d’exploitation et a amélioré la réactivité de son service client. Seuls les mails complexes sont traités humainement par ses équipes internes qui sont restées à effectif constant, malgré l’augmentation des ventes.

© Aiway 2019