La puissance prédictive de l’apprentissage automatique

Le premier article de notre série Driven By Data met en lumière la manière dont les modèles d’apprentissage automatiques (AI) ont été utilisés pour orienter la stratégie de développement d’Educate Girls.

En Inde, plus de 4 millions de filles âgées de 7 à 14 ans ne vont pas à l’école. C’est l’un des taux de déscolarisation les plus élevés au monde.

Depuis 2007, Educate Girls s’attaque aux barrières qui empêchent les filles d’accéder aux salles de classe dans les villages ruraux les plus isolés. Dans les États du Rajasthan, du Madhya Pradesh et de l’Uttar Pradesh, l’ONG intègre, ou réintègre, les filles non scolarisées dans le cursus scolaire.

En collaboration avec le gouvernement indien et les écoles publiques, Educate Girls s’appuie sur une large base de volontaires locaux, les « Team Balika », recrutés pour effectuer des recensements dans des milliers de villages et de districts par du porte-à-porte. Les Team Balika ont une mission essentielle : changer les mentalités qui condamnent tant de filles à la déscolarisation.

Les visites dans les foyers et les actions dans les communautés sont la clé du succès de l’organisation, mais sont coûteuses et chronophages. L’objectif visé par l’ONG - (re) scolariser 1,5 million de filles d’ici à 2024 - est donc particulièrement complexe.

Challenge-Machine-learning-01.jpg

© Cartier Philanthropy / Cyril le Tourneur

Educate Girls s’est vue contrainte de repenser son processus de sélection des villages afin d’atteindre le plus grand nombre d’écolières potentielles dans des limites budgétaires et temporelles fixes.

L’organisation s’est alors tournée vers les techniques prédictives d’apprentissage automatique. Ces techniques consistent à alimenter des algorithmes qui, sur la base d’importantes quantités de données, génèrent des statistiques prévisionnelles sur des situations encore inconnues, à l’instar des systèmes de navigation qui, à l’aide d’algorithmes similaires, déterminent les temps de trajet par l’analyse des données de circulation. De même, des outils comparables permettent aux supermarchés de gérer leurs stocks. Avec l’aide d’IDinsight, Educate Girls utilise désormais un algorithme d’apprentissage artificiel exploitant les données de recensement collectées par les Team Balika pour dénombrer, dans de nouvelles régions, les villages susceptibles de compter le plus de filles non scolarisées.

Grâce à la mise en œuvre de son programme dans 8 000 villages, Educate Girls a pu avoir connaissance du taux de scolarisation des filles de plus d’un million de foyers. IDinsight a croisé ces données avec des informations publiques relatives à la population et à l’éducation ainsi qu’avec des données tirées de sondages menés par d’autres ONG. La société a développé et testé plusieurs modèles d’apprentissage automatique permettant de prédire le nombre de filles non scolarisées dans des villages d’autres régions du pays.

Sur cette base, IDinsight a identifié les groupes de villages présentant la plus forte densité de filles déscolarisées, soit les zones dans lesquelles les équipes de terrain devraient trouver le plus d’écolières susceptibles de bénéficier de l’intervention de Educate Girls. Résultat ? En concentrant ses ressources sur des groupes de villages précis plutôt que sur l’ensemble des villages d’un district donné, Educate Girls a pu toucher 2,5 fois plus de filles non scolarisées par village, pour un budget opérationnel comparable.

À mesure que l’organisation étend son action à d’autres régions, l’algorithme prédictif est alimenté de nouvelles données et consulté pour cibler les prochaines zones de développement. Le souhait de remettre 1,5 million de filles sur le chemin de l’école d’ici 2024 devient alors réalisable.

« Les algorithmes ont été créés en 2018. Depuis, ils ont été continuellement affinés pour gagner en précision grâce à de nouvelles sources d’information, des données récentes et des villages supplémentaires. Par ces prédictions, nous pourrons atteindre plus de 200 000 enfants non scolarisés dans les prochains mois. De plus, le modèle est associé à une application qui nous permet de créer de manière interactive des groupes de 8 à 10 villages géographiquement proches. Nous pouvons identifier précisément les zones dans lesquelles nous devons engager des équipes locales et ainsi optimiser leurs déplacements. L’apprentissage automatique et l’intelligence artificielle ont été de formidables leviers pour toucher un public plus large », explique Lisa Rodricks, vice-présidente des opérations d’Educate Girls.

Célèbre pour avoir lancé le premier contrat à impact social (Development Impact Bond ou DIB ADD) dans le secteur éducatif et pour être devenue la première ONG asiatique à rejoindre l’Audacious Project, Educate Girls a amélioré l’accès à l’éducation et enrichi la qualité de la formation de 1,3 million enfants depuis 2007.

Slideshow-Machine-learning-04.jpg

© Cartier Philanthropy / Cyril le Tourneur

Slideshow-Machine-learning-05.jpg

© Cartier Philanthropy / Cyril le Tourneur

Slideshow-Machine-learning-01.jpg

© Cartier Philanthropy / Cyril le Tourneur

Slideshow-Machine-learning-03.jpg

© Cartier Philanthropy / Cyril le Tourneur

Slideshow-Machine-learning-04.jpg

© Cartier Philanthropy / Cyril le Tourneur

Slideshow-Machine-learning-05.jpg

© Cartier Philanthropy / Cyril le Tourneur

Slideshow-Machine-learning-01.jpg

© Cartier Philanthropy / Cyril le Tourneur

Slideshow-Machine-learning-03.jpg

© Cartier Philanthropy / Cyril le Tourneur

Crédits photo : Banner © Cartier Philanthropy / Cyril le Tourneur