Comment les algorithmes décident-ils quoi nous recommander et savent-ils ce que nous aimons

Nous sommes constamment entourés de suggestions numériques: chaque fois que nous accédons à une plateforme de streaming ou visitons un commerce électroniqueun algorithme basé surintelligence artificielle travaille pour nous pour organiser la sélection de contenu que nous trouvons devant nous, qu’il s’agisse de contenu numérique, de produits à acheter, etc. Ce système, techniquement défini moteur de recommandationest basé sur l’analyse de mégadonnées et sur des algorithmes complexes apprentissage automatique conçu pour interpréter nos comportements passés et anticiper nos désirs futurs. L’objectif de ces technologies est double : d’une part, elles nous aident, nous, utilisateurs, à nous orienter dans des catalogues interminables, nous permettant de découvrir des films, des chansons ou des produits que nous aurions du mal à trouver par nous-mêmes, et d’autre part, elles sont essentielles aux entreprises pour maintenir notre implication élevée et stimuler les ventes. Ce n’est pas un hasard si le marché de ces systèmes en vaut presque la peine aujourd’hui 7 milliards de dollarset ce chiffre devrait tripler au cours des prochaines années.

Mais Comment les algorithmes décident-ils quoi nous recommander ? En résumé, le processus commence par collecte généralisée de nos donnéesaussi bien ceux fournis volontairement que ceux déduits de nos activités en ligne. Ces informations sont stockées dans d’énormes bases de données, analysées pour identifier des modèles récurrents et enfin filtrées à travers trois méthodologies principales : filtrage collaboratifqui nous compare à d’autres utilisateurs similaires ; celui basé sur contenuqui analyse les caractéristiques intrinsèques de ce que nous avons déjà apprécié ; Hé systèmes hybrides. Bien que ces algorithmes améliorent considérablement notre expérience utilisateur, ils entraînent des défis importants, de la nécessité de protéger notre vie privée et de respecter les réglementations, au risque de rencontrer des biais tirés des données elles-mêmes, en passant par la complexité technique de nous fournir des suggestions en temps réel. Approfondissons le sujet en tenant compte du fait que les systèmes de recommandation peuvent avoir différentes spécificités et modus operandi différents les uns des autres.

Comment fonctionnent les algorithmes de recommandation et quels avantages ils apportent

Pour bien comprendre comment les algorithmes de recommandation parviennent à décrypter nos goûtsnous devons analyser 5 phases opérationnelles qui transforment nos interactions en prédictions précises, à partir de première phasele collecte de donnéesqui représente le carburant principal de l’ensemble du processus. Les moteurs de recommandation se nourrissent de deux catégories de traces que nous laissons en ligne : i données explicitesc’est-à-dire nos actions directes et conscientes telles qu’un « J’aime », une critique écrite ou une note par étoiles, ei données implicitesbeaucoup plus nombreux et subtils, qui incluent notre historique de navigation, nos clics, nos achats passés ou encore le temps que nous passons à regarder un produit. Ils s’y ajoutent souvent données démographiques et psychographiquescomme notre âge ou notre mode de vie. Toutes ces données, une fois collectées, sont transmises à deuxième phasecelui de archivage. C’est à ce stade que les données sont stockées dans des structures de stockage complexes, appelées entrepôt de données ou lac de données. Une fois « stockées », les données passent à troisième phasecelui de analysesoù les algorithmes d’apprentissage automatique recherchent des corrélations mathématiques pour créer modèles prédictifs.

Là quatrième phasel’un des plus importants, est celui de filtrationqui détermine la logique de la suggestion. Dans le filtrage collaboratifutilisé massivement par des géants comme Amazone Et Spotifyle système repose sur l’hypothèse que si nous et un autre utilisateur avons eu des préférences similaires dans le passé, nous continuerons probablement à les avoir ; si nous avons aimé les mêmes films qu’un autre utilisateur, l’algorithme recommandera également ceux qu’il a vus et que nous n’avons pas vus. Cette méthode peut être basé sur la mémoirecalculant la proximité entre les utilisateurs ou cela peut être basé sur un modèleexploitant les réseaux neuronaux de apprentissage profond pour combler les lacunes de nos préférences. La principale limite ici est ce qu’on appelle le « démarrage à froid » : si nous sommes de nouveaux utilisateurs et n’avons pas d’historique, le système a du mal à nous identifier.

L’alternative est la filtrage basé sur le contenuqui au lieu d’observer les autres utilisateurs, se concentre sur les caractéristiques des objets qui nous ont plu. Si nous écoutions une chanson avec certaines balises, genre et rythme, l’algorithme nous traitera comme des vecteurs dans un espace vectorielnous proposant d’autres chansons « proches » de celles connues. Cette approche résout le problème, qui vient d’être évoqué, du fatidique « démarrage à froid », mais risque de nous enfermer dans une bulle où l’on nous propose toujours des choses trop similaires à celles que l’on connaît déjà, limitant la découverte du nouveau.

Pour pallier les défauts des deux méthodes de filtrage, des plateformes telles que Netflix ils adoptent systèmes hybridestrès puissant mais coûteux en terme de calcul. Les bénéfices pour notre expérience sont tangibles : on gagne du temps en évitant les scrollings interminables et on découvre des contenus pertinents, à tel point que 80 % des visionnages de Netflix proviennent de ces suggestions.

Problèmes critiques liés aux systèmes de recommandation

Indépendamment de système de recommandation utilisécertains ne manquent pas criticité inhérent à cette technologie. En plus du complexité de gérer des millions de recommandations simultanées, il existe un risque que les algorithmes apprendre et amplifier les préjugés sociaux présents dans les données d’entraînement, générant des recommandations biaisées, sans oublier les délicats problème de confidentialité liés à la collecte massive de nos informations personnelles. Il y a tant à dire sur les enjeux critiques de ces systèmes et c’est un sujet si vaste et sans limites qu’il mérite une étude ad hoc.