Articles

Je voudrais vous parler d’un MOOC très intéressant qui m’a été recommandé lors de mon entrée en Executive Master Data Strategy à MediaSchool. Le MOOC en question est disponible sur la plateforme OpenClassRooms. Il s’intitule Comprendre le Big Data à travers les films de cinéma. Comme il est parfois difficile de s’y retrouver dans l’offre de MOOC, je partage mon expérience.

Ce MOOC a été réalisé en collaboration avec des écoles d’ingénieurs prestigieuses (ENSAE ParisTech et ENSAE-ENSAI) ce qui est déjà un beau gage de qualité. Les deux orateurs du MOOC sont Guy Jacquemelle et Xavier Perret, co-auteurs du livre « Big data: Le Cinéma avait déjà tout imaginé » (éditions Kawa). Cependant il ne faudrait pas croire que ce MOOC ne s’adresse qu’aux ingénieurs, mathématiciens ou informaticiens. Si vous êtes dans le marketing comme quoi et que vous souhaitez avoir un cours pour mettre un peu d’ordre dans tout ce que vous avez déjà lu sur les données, la big data, la smart data, ce MOOC est fait pour vous.

instant-digital-ENSAE-ENSAI

Et si comme moi vous adorez les films de science fiction, n’hésitez plus, ce MOOC va vous plaire. Cependant, il n’est pas nécessaire d’être un fan de films de science fiction pour suivre. En effet, le parallèle entre le film de science fiction et le concept étudié sera toujours expliqué dans la vidéo. Si vous n’êtes pas fan de science fiction, vous pouvez donc y aller … et qui sait, cela vous donnera peut-être envie de découvrir certains classiques de la SF.

Ce que vous allez apprendre

Le MOOC m’a permis de structurer ce que j’avais déjà lu sur le big data et de retrouver une définition claire de nombreux concepts liés au big data (machine learning, intelligence artificielle, algorithme de recommandation, …). Le MOOC est divisé en 4 parties.

La première partie est la partie introductive qui rappelle ce qu’est le big data. La deuxième partie parle de prévision.  L’enjeu avec la big data n’est plus seulement de savoir ce que vous faites et aimez mais bien de prévoir ce que vous allez faire et aimer avant même que vous n’ayez demandé quoi que ce soit. Les concepts de overfitting (surapprentissage) et underfitting (sous-apprentissage) sont également abordés pour parler des possibles erreurs de prédiction. Il est également rappelé qu’une corrélation ne reflète pas toujours une relation de causalité. Enfin, si vous voulez comprendre un algorithme de recommandation comme celui de Netflix, le MOOC vous explique comment cela fonctionne. La troisième partie approfondit le fonctionnement des algorithmes: comment les algorithmes apprennent (machine learning). Vous y apprendrez l’origine de l’intelligence artificielle, et que l’IA est déjà parmi nous: nous nous en servons déjà tous les jours. La dernière partie s’interroge sur les risques et dérives possibles du big data.

Mon avis sur OpenClassrooms

La plateforme OpenClassrooms vous permettra d’accéder gratuitement à ses cours … dans la limite de 5 cours par semaine. Si vous n’êtes pas pressé, vous n’avez donc pas besoin de payer. Mais si vous voulez allé plus vite, être certifié ou télécharger les vidéos des cours, il vous faudra payer l’abonnement (à partir de 20€ par mois).

Attention tout de même quand vous vous inscrivez sur la plateforme: il s’agit d’un abonnement. Votre compte bancaire sera prélevé de 20€ tous les mois de façon automatique sauf si vous faites une demande à OpenClassrooms d’arrêt d’abonnement. Je me suis désabonnée sans souci quand je n’avais plus besoin d’accéder aux cours, cela se fait directement en ligne sur le site et mon abonnement s’est donc terminé à la fin du mois qui avait été payé. Le site de OpenClassrooms est donc un site clair, simple à utiliser et transparent sur ses tarifs et son fonctionnement.

Si vous êtes demandeur d’emploi, c’est gratuit. Grâce à un partenariat avec Pôle Emploi, les demandeurs d’emploi ont un accès Premium Solo gratuitement.

Paul Duan, fondateur de l’ONG Bayes Impact est venu parler de sa foi en l’algorithme lors de la seconde édition de L’Echappée Volée le 6 juin 2015, un événement organisé par TEDxParis au château de Chambord. Cet événement a permis aux 6 lauréats sélectionnés de venir présenter leur projets mais également à d’autres intervenants de parler de leur « renaissance digitale ».

Paul Duan se demande tout simplement comment 10 personnes peuvent sauver la vie de 10 millions ? Pour lui, la réponse se trouve dans la science des données qu’on appelle souvent big data. Selon lui, la big data ne doit pas seulement permettre aux abonnés Netflix de savoir quel épisode de House of Cards ils doivent regarder. Il serait également dommage que la big data ne serve qu’à l’optimisation des investissements des fonds spéculatifs.

Son ambition est la suivante: utiliser les mêmes techniques qui font la fortune des industries privées pour résoudre des problèmes sociaux.

Optimiser la réparition des ambulances comme le fait Uber avec ses taxis

La société Uber utilise les millions de données recueillies sur chaque passager, ses requêtes et ses trajets pour prédire à l’avance à quel endroit de nouvelles commandes sont le plus susceptibles d’arriver. Ces algorithmes prédictifs permettent ainsi à Uber d’optimiser le dispatch de leurs véhicules et donc de faire des économies substantielles. Paul Duan propose de faire la même chose pour les services ambulanciers alors que des millions de personnes meurent en attendant une ambulance chaque année. Il serait possible d’utiliser les données pour optimiser le dispatch des ambulances et de sauver ainsi des vies tout en faisant des économies.

Optimiser la rencontre employeur/employé comme le fait Meetic

Des algorithmes de matching sont aujourd’hui utilisés par des sites de rencontres comme Meetic ou Tinder. Ils permettent de recommander à des célibataires des personnes avec les plus fortes probabilités de compatibilité. Paul Duan pense que l’utilisation de ce genre d’algorithme de matching pour des agences comme Pôle Emploi pourrait permettre d’optimiser le matching entre employeurs et chercheurs d’emploi. Et si grâce aux algorithmes il était possible de réduire le chômage en France tout en faisant des économies de fonctionnement d’une énorme structure comme Pôle Emploi ? Une promesse alléchante en cette période de chômage et de déficits budgétaires.

Retour à la réalité … et la conduite du changement

Il suffirait donc d’avoir quelques bons analystes pour mettre en place des outils d’optimisation basés sur la big data ? Evidemment les choses ne seront pas aussi simple. Paul Duan rappelle avec beaucoup d’humour qu’il ne suffira pas d’une bande de volontaires à mi-temps et de quelques hackatons pour changer Pôle Emploi. Il rappelle la nécessite de travailler en profondeur et de bien connaître les institutions culturellement différentes pour pouvoir les accompagner de façon efficace vers plus de modernisation.

L’ONG Bayes Impact travaille actuellement sur un logiciel open source de prédiction du risque de réadmission à l’hôpital, qui coûte plus de 40 milliards de dollars par an aux hôpitaux américains. Grâce à leurs algorithmes, ils seront alors capables d’identifier les personnes à risque, de les traiter à l’avance pour éviter une réadmission et sauver ainsi ces malades. Il estime qu’ils pourrait sauver 3 millions d’années de vie humaine par an avec cet algorithme et ce n’est que le début d’après lui.

Pourquoi Paul Duan veut faire tout ça ? Il dit que ça en vaut le coût, tout simplement. J’espère qu’il dit vrai.

Crédit photo : Flickr / Do-Hyun Kim / lego custom IRON MAN