1 of 109

Pourquoi tester des hypothèses ?

Tester les hypothèses

Janvier 2025

Leçon 13

2 of 109

RÉVISION

2

Passons en revue ce que nous avons accompli lors de la

la phase de conception des prototypes.

3 of 109

La phase de conception des prototypes transforme les aperçus issus de la recherche en idéation, et les idées en prototypes afin de ne retenir que les solutions les plus prometteuses.

RÉVISION

4 of 109

Concevoir des interventions

Hiérarchiser les interventions

RÉVISION

D

CONCEPTIONS DE PROTOTYPES

TH

S

E

1

2

3

4

Prototype, tester et itérer les interventions

Théorie du changement

5 of 109

RÉVISION

Au cours des trois dernières leçons (10-11-12), nous avons appris à :

Rédiger des suggestions d'idées (leçon 10)
Générer des idées (leçon 10)
Hiérarchiser les interventions (leçon 11)
Développer des prototypes (leçon 12)
Planifier et réaliser le prototypage (leçon 12)
Itérer (leçon 12)
Concevoir une théorie du changement (leçon 12)

D

CONCEPTIONS DE PROTOTYPES

TH

S

E

6 of 109

RÉVISION

Dans la leçon 10, nous avons appris à :

PROTOTYPE DESIGNS

1

2

3

4

Idées préliminaires

Comment pouvons-nous mieux aider les parents au Liban à adopter de meilleures habitudes de planification afin qu'ils soient plus enclins à se souvenir et à se présenter à temps aux rendez-vous de vaccination de suivi de leur enfant ?

Micro-comportement

Le parent revient à l'heure pour le deuxième rendez-vous de vaccination.

Population concernée

Les parents vivant dans des communautés à faibles revenus et de réfugiés au Liban

Barrières / Facteurs facilitateurs

Faibles habitudes de planification

A

B

C

A

B

7 of 109

RÉVISION

Dans la leçon 10, nous avons appris à :

PROTOTYPE DESIGNS

1

2

3

4

Générer des idées à l'aide de diverses méthodes

Les soignants disposaient d'une carte pour se souvenir de la date de la prochaine visite de vaccination

Le comportement serait �plus facile si

Une simple carte de rappel avec la date du rendez-vous de vaccination

Une carte joyeuse « Héros de la Vaccination » avec un message festif et un autocollant pour l'enfant

Un ton plus ludique et festif

Encourager les parents à vacciner leurs enfants par le biais d'annonces

Partagez des données indiquant que « 85 % des mères de votre communauté ont fait vacciner leurs enfants cette année ».

Rendez-le social

8 of 109

RÉVISION

Dans la leçon 11, nous avons appris à :

PROTOTYPE DESIGNS

1

2

3

4

Hiérarchiser les interventions en fonction de critères clés

1

2

3

4

5

Désirabilité

Facilité du changement de comportement

Impact du changement de comportement

Mesurabilité

Coût

Scalabilité

9 of 109

RÉVISION

Dans la leçon 12, nous avons appris à :

PROTOTYPE DESIGNS

1

2

3

4

Prototypes de conception

Maquettes

Maquettes en papier

Storyboard

Jeux de rôle

10 of 109

RÉVISION

Dans la leçon 12, nous avons appris à :

Planifier et réaliser un prototypage

Établir un plan

Quel comportement spécifique souhaitons-nous voir changer ? À quoi ressemble le succès ?
Quelles sont les principales barrières que cette idée permet, selon nous, de surmonter ?
Quels mécanismes l'idée utilisera-t-elle pour surmonter ces barrières ?
Pourquoi cela pourrait-il fonctionner pour la communauté ?

Puis décidez :

À qui devez-vous vous adresser pour tester l'idée ?
Où devons-nous prototyper ?
Comment saurons-nous si cela fonctionne ?

CONCEPTION DE PROTOTYPES

1

2

3

4

11 of 109

RÉVISION

Dans la leçon 12, nous avons appris à :

Synthétiser les apprentissages et itérer

Effectuer des tests initiaux

Synthèse et itération

CONSERVER / AMÉLIORER / SUPPRIMER / AJOUTER

Effectuer des tests de suivi

CONCEPTIONS DE PROTOTYPES

1

2

3

4

12 of 109

RÉVISION

Dans la leçon 12, nous avons appris à :

PROTOTYPE DESIGNS

1

2

3

4

Élaborer une théorie du changement

Ressources

Acteurs

Besoins

Activités

Mécanismes Comportementaux Psychologiques

Résultats

Impact

Résultats intermédiaires

Résultat comportemental principal

13 of 109

13

Commençons notre séance.

14 of 109

APERÇU

14

Que se passe-t-il après les Prototypes ?

15 of 109

APERÇU

D

TESTER LES HYPOTHÈSES

S

E

P

Au cours de cette phase, les idées sont mises à l'épreuve.

L'intervention a-t-elle fonctionné ?

Les informations recueillies ici révèlent ce qu'il faut affiner, mettre à l'échelle ou abandonner.

16 of 109

APERÇU

Pourquoi tester une hypothèse ?

Considérations relatives à la conception pour l’évaluation d'impact

1

2

3

D

TESTER LES HYPOTHÈSES

S

E

P

Évaluation et recherche sur la mise en œuvre

17 of 109

APERÇU

Pourquoi tester une hypothèse ?

Considérations relatives à la conception pour l'évaluation d'impact

1

2

3

D

TESTER LES HYPOTHÈSES

S

E

P

Évaluation et recherche sur la mise en œuvre

18 of 109

APERÇU

Pourquoi tester une hypothèse ?

01 L'importance de l'évaluation

02 Le défi de la causalité

03 Le cadre contrefactuel

04 La randomisation : la référence en matière de contrefactuels

D

TESTER LES HYPOTHÈSES

S

E

P

Dans cette leçon,�nous aborderons :

1

19 of 109

APERÇU

19

Avons-nous vraiment besoin de tester davantage les solutions ? Ne pouvons-nous pas passer immédiatement à la mise à l'échelle ?

20 of 109

Pourquoi tester les hypothèses ?

Section 1

L'importance de l'évaluation

D

TESTER LES HYPOTHÈSES

S

E

P

1

21 of 109

Seriez-vous prêt à le prendre ?

IMPORTANCE DE L'ÉVALUATION

Ce médicament n'a pas été testé officiellement, mais certains patients ont vu leur état s'améliorer et notre équipe est convaincue de son efficacité.

22 of 109

IMPORTANCE DE L'ÉVALUATION

22

La plupart des gens refuseraient,

et pour de bonnes raisons.

23 of 109

IMPORTANCE DE L'ÉVALUATION

23

Les solutions doivent être testées de manière formelle.

Les gens ont besoin de voir la preuve qu'elles fonctionnent : où, comment, pourquoi et avec qui.

LES PREUVES SONT ESSENTIELLES

24 of 109

IMPORTANCE DE L'ÉVALUATION

v

Mais avec les programmes sociaux et les interventions comportementales, c'est souvent le contraire qui se produit : nous agissons avec de bonnes intentions et en nous appuyant sur des théories, mais sans disposer de preuves rigoureuses de ce qui fonctionne réellement.

25 of 109

IMPORTANCE DE L'ÉVALUATION

25

Le développement international regorge de programmes qui semblaient innovants et prometteurs, jusqu'à ce qu'ils soient rigoureusement évalués.

26 of 109

PRENONS L'EXEMPLE DE

La microfinance

Au début, en 1980

IMPORTANCE DE L'ÉVALUATION

Considérée comme une avancée majeure dans la lutte contre la pauvreté

Petits prêts pour favoriser l'entrepreneuriat

Largement saluée et rapidement mise à l'échelle

27 of 109

Au début, en 1980

Mais après une évaluation rigoureuse

PRENONS L'EXEMPLE DE

La microfinance

IMPORTANCE DE L'ÉVALUATION

Considéré comme une avancée majeure dans la lutte contre la pauvreté

Petits prêts pour favoriser l'entrepreneuriat

Largement salué et rapidement mis à l'échelle

✔️ Amélioration de l'accès au crédit

✖️ Impact mitigé sur la pauvreté

✖️ Alourdissement du fardeau de la dette

✖️ Résultats limités à long terme

Au fil du temps, cependant, des évaluations rigoureuses ont révélé une réalité plus complexe. Si la microfinance a amélioré l'accès au crédit, son impact sur la réduction de la pauvreté, la mobilité économique et le bien-être à long terme était moins évident. Des études rigoureuses ont mis en évidence l'alourdissement de la dette des emprunteurs, la scalabilité limitée, les résultats commerciaux modestes et les progrès insuffisants dans la lutte contre la pauvreté structurelle . Des articles et des livres, tels que « Big Money Backs Tiny Loans That Lead to Debt, Despair and Even Suicide » (Les gros capitaux soutiennent les petits prêts qui mènent à l'endettement, au désespoir et même au suicide) et « More Than Good Intentions » (Plus que de bonnes intentions), reflètent la désillusion qui a suivi et le rôle crucial joué par l'évaluation pour révéler ce que les anecdotes ne pouvaient pas montrer.

28 of 109

Et il existe de nombreux autres exemples

IMPORTANCE DE L'ÉVALUATION

PlayPump

Millennium Villages

Un ordinateur portable par enfant

29 of 109

IMPORTANCE DE L'ÉVALUATION

29

Avoir de bonnes intentions ne suffit pas.

Même avec les meilleures intentions du monde, nous faisons souvent des suppositions qui peuvent nous induire en erreur dans nos interventions.

C'est ce qu'on appelle le « piège des suppositions ».

30 of 109

Nous partons du principe que nous comprenons le problème

IMPORTANCE DE L'ÉVALUATION

Nous définissons les problèmes selon notre propre point de vue → nous passons à côté de l'expérience vécue par les personnes concernées.

31 of 109

Nous partons du principe que nous savons ce qui fonctionnera

IMPORTANCE DE L'ÉVALUATION

Lorsque nous sommes trop convaincus que quelque chose fonctionnera → nous négligeons des facteurs clés qui influent sur la réussite.

32 of 109

Nous partons du principe que les anecdotes positives sont synonymes de réussite

IMPORTANCE DE L'ÉVALUATION

Nous surévaluons les histoires positives → elles ne reflètent pas la réalité dans son ensemble.

Mon mari a dit qu'il avait vraiment apprécié être à la clinique avec le personnel de santé

33 of 109

Nous supposons que les résultats positifs sont dus à notre intervention

IMPORTANCE DE L'ÉVALUATION

Nous confondons corrélation et causalité → Si les choses s'améliorent, cela ne signifie pas que c'est grâce à notre intervention.

34 of 109

IMPORTANCE DE L'ÉVALUATION

34

L'esprit humain est souvent partial et tire des conclusions hâtives. Cela peut être utile dans la vie, mais trompeur lorsqu'il s'agit d'évaluer des interventions complexes.

MÉFIEZ-VOUS DU PIÈGE DES HYPOTHÈSES

35 of 109

L'évaluation fournit le processus structuré dont nous avons besoin pour aller au-delà des hypothèses et comprendre l'impact réel de notre travail.

IMPORTANCE DE L'ÉVALUATION

36 of 109

Une évaluation rigoureuse permet :

IMPORTANCE DE L'ÉVALUATION

Affecter les fonds limités aux interventions appropriées.

Résoudre les problèmes avant de passer à la mise à l'échelle.

Instaurer la confiance avec les partenaires.

Fournir un plan d'action pour l'expansion.

Identifier les conséquences négatives imprévues.

Les évaluations ne sont pas seulement des exercices académiques, elles apportent une valeur concrète :

Optimisation des ressources : dans les environnements où les ressources sont limitées, l'évaluation permet d'orienter les fonds disponibles vers des interventions dont l'efficacité a été prouvée.
Correction de trajectoire : une évaluation effectuée en temps opportun permet d'identifier et de résoudre les problèmes de mise en œuvre avant la mise à l'échelle, évitant ainsi l'adoption à grande échelle d'approches inefficaces.
Confiance des parties prenantes : une évaluation rigoureuse renforce la confiance des donateurs, des gouvernements et des communautés, facilitant ainsi les partenariats et le soutien à long terme.
Mise à l'échelle et reproduction : les programmes bien évalués fournissent un modèle pour l'expansion, permettant aux approches efficaces de bénéficier à davantage de communautés.
Prévention des dommages : l'évaluation permet d'identifier les conséquences négatives involontaires de programmes bien intentionnés avant qu'elles n'affectent de larges populations.

37 of 109

IMPORTANCE DE L'ÉVALUATION

37

Il est important d'évaluer notre impact, mais comment savoir si nous avons réellement fait une différence ?

38 of 109

Pourquoi tester les hypothèses ?

Section 2

Le défi de la causalité

D

TESTER LES HYPOTHÈSES

S

E

P

1

39 of 109

Une campagne de vaccination est lancée, et les taux de maladie diminuent peu après. Peut-on en conclure que la campagne est à l'origine de cette baisse ?

Oui, le timing prouve l'impact
Pas encore, d'autres facteurs pourraient l'expliquer

QUE MESURER ET COMMENT

VOTEZ DANS LE SONDAGE

40 of 109

La réponse est B :

Les changements saisonniers, les nouvelles politiques ou d'autres programmes peuvent également influencer les résultats : ce n'est pas parce que deux événements se produisent simultanément que l'un est la cause de l'autre.

QUE MESURER ET COMMENT

41 of 109

LE DÉFI DE LA CAUSALITÉ

41

Le défi fondamental de l'évaluation consiste à déterminer si notre intervention a réellement entraîné les changements que nous observons.

42 of 109

La corrélation signifie que deux choses se produisent simultanément, tandis que la causalité signifie qu'une chose en entraîne une autre.

LE DÉFI DE LA CAUSALITÉ

43 of 109

Lorsque les ventes de crème glacée sont élevées, il y a davantage d'attaques de requins

LE DÉFI DE LA CAUSALITÉ

+

44 of 109

Les ventes de crème glacée sont-elles à l'origine des attaques de requins ?

LE DÉFI DE LA CAUSALITÉ

45 of 109

C'est ce qu'on appelle le « problème de la troisième variable ».

La température est la troisième variable cachée qui influence les deux résultats de manière indépendante.

LE DÉFI DE LA CAUSALITÉ

Influence causale

Cela illustre ce que les statisticiens appellent le « problème de la troisième variable (ou confusion par cause commune) ». Dans ce cas, la température est la troisième variable cachée qui influence les deux résultats de manière indépendante. Pendant les mois d'été, la température augmente. Cela entraîne alors :

Une augmentation de la consommation de crème glacée.

Une augmentation du nombre de personnes se baignant dans l'océan. Plus le nombre de baigneurs augmente, plus le risque de rencontre avec des requins augmente.

Nous pouvons visualiser cette relation à l'aide d'un simple diagramme causal, similaire aux diagrammes que nous avons utilisés lorsque nous avons cartographié le système entourant notre problème lors de la phase de définition. Les flèches représentent les influences causales. Il n'y a pas de flèche reliant les ventes de glaces et les attaques de requins, car il n'y a pas de relation causale directe entre elles : elles sont en corrélation (elles se produisent ensemble), mais pas causales (l'une ne cause pas l'autre).

Comprendre ce problème de troisième variable nous aide à éviter les conclusions erronées dans nos programmes. Sans cette compréhension, nous pourrions observer une corrélation entre deux variables et supposer à tort que l'une cause l'autre, ce qui conduirait à des interventions inefficaces, voire nuisibles.

46 of 109

La corrélation signifie que deux choses se produisent simultanément.

Corrélation

La causalité signifie qu'un événement en provoque un autre.

Causalité

LE DÉFI DE LA CAUSALITÉ

47 of 109

LE DÉFI DE LA CAUSALITÉ

47

Pourquoi est-ce important pour nous de le savoir ?

48 of 109

LE DÉFI DE LA CAUSALITÉ

v

Confondre corrélation et causalité peut nous amener à poursuivre ou à mettre à l'échelle des interventions qui ne sont pas réellement le moteur du changement.

49 of 109

Ce programme est-il à l'origine de cette amélioration ?

LE DÉFI DE LA CAUSALITÉ

Le programme nutritionnel de l'UNICEF est mis en œuvre dans plusieurs communautés

Les indicateurs de croissance des enfants s'améliorent

50 of 109

Que pourrait-il se passer d'autre ?

LE DÉFI DE LA CAUSALITÉ

Le programme nutritionnel de l'UNICEF est mis en œuvre dans plusieurs communautés

La disponibilité alimentaire saisonnière a augmenté

Une autre organisation fournit de l'eau potable, ce qui réduit les cas de diarrhée.

Le gouvernement a mis en œuvre une politique économique qui a permis d'augmenter les revenus des familles.

Les indicateurs de croissance des enfants s'améliorent

51 of 109

LE DÉFI DE LA CAUSALITÉ

Le programme nutritionnel de l'UNICEF est mis en œuvre dans plusieurs communautés

La disponibilité alimentaire saisonnière a augmenté

Une autre organisation fournit de l'eau potable, ce qui réduit les cas de diarrhée.

Le gouvernement a mis en œuvre une politique économique qui a augmenté les revenus des familles.

En supposant que le programme est à l'origine du changement, on risque d'investir dans des interventions qui ne fonctionnent pas réellement ou de négliger les véritables facteurs à l'origine du changement.

52 of 109

LE DÉFI DE LA CAUSALITÉ

Le programme nutritionnel de l'UNICEF est mis en œuvre dans plusieurs communautés

La disponibilité alimentaire saisonnière a augmenté

Une autre organisation fournit de l'eau potable, ce qui réduit les maladies diarrhéiques.

Le gouvernement a mis en œuvre une politique économique qui a augmenté les revenus des familles.

Intervention

Facteurs de confusion

53 of 109

C'est ce qu'on appelle l'endogénéité : une situation où la relation entre une intervention et son résultat est faussée par l'influence d'autres variables.

LE DÉFI DE LA CAUSALITÉ

54 of 109

LE DÉFI DE LA CAUSALITÉ

Les facteurs de confusion liés au temps sont des changements qui se seraient produits indépendamment de notre intervention.

Variations saisonnières : disponibilité typique plutôt qu'impact du programme.

Tendances préexistantes : les taux étaient déjà en hausse en raison du développement économique.

La disponibilité saisonnière des aliments a augmenté.

55 of 109

LE DÉFI DE LA CAUSALITÉ

Les facteurs de sélection sont les différences entre les participants et les non-participants.

Biais d'auto-sélection : les familles qui choisissent de participer peuvent être plus engagées.

Biais de ciblage : si nous choisissons l'extrême, la normalisation des taux au fil du temps se produira quoi qu'il arrive.

Les familles qui adhèrent à un programme nutritionnel sont peut-être déjà plus impliquées dans la croissance de leurs enfants.

56 of 109

LE DÉFI DE LA CAUSALITÉ

Un programme de nutrition pour la petite enfance est lancé au moment même où une subvention alimentaire nationale est mise en place.

Les facteurs de confusion environnementaux sont des événements ou des conditions externes qui se produisent au même moment.

Programmes concomitants : différentes interventions ayant le même objectif sont mises en œuvre simultanément.

Changements politiques : une politique qui pourrait également être responsable entre en vigueur.

Une autre organisation fournit de l'eau potable -> moins de maladies diarrhéiques.

57 of 109

LE DÉFI DE LA CAUSALITÉ

Les facteurs de confusion liés à la mesure sont des changements dans la manière dont nous suivons les résultats.

Amélioration du suivi : les taux et les résultats peuvent changer, non pas en raison d'un changement de comportement, mais parce que le suivi s'est amélioré.

Après la mise en place d'un nouveau système de déclaration, un plus grand nombre d'enfants sont déclarés comme souffrant d'insuffisance pondérale.

58 of 109

LE DÉFI DE LA CAUSALITÉ

58

Lorsque plusieurs facteurs influencent simultanément les résultats, comment pouvons-nous isoler l'impact réel de notre programme ?

59 of 109

Pourquoi tester les hypothèses ?

Section 3

Le cadre contrefactuel : comprendre ce qui se serait passé autrement

D

TESTER LES HYPOTHÈSES

S

E

P

1

60 of 109

Pour savoir si une campagne de vaccination a réduit les taux de maladie, à quoi devons-nous la comparer ?

Les communautés qui ont également bénéficié de la campagne
Des communautés similaires qui n'en ont pas bénéficié

QUE MESURER ET COMMENT

VOTEZ DANS LE SONDAGE

61 of 109

La réponse est B :

La comparaison avec des communautés qui n'ont pas bénéficié de la campagne peut nous aider à répondre à la question qui est au cœur de l'inférence causale : « Que se serait-il passé si l'intervention n'avait pas eu lieu ? »

QUE MESURER ET COMMENT

62 of 109

Le contrefactuel est le scénario alternatif dans lequel le programme n'existait pas.

CONTREFACTUELS

63 of 109

CONTREFACTUELS

Reçoit l'intervention

Y₁

(résultat)

Ne reçoit pas l'intervention

Pour évaluer la différence qu'apporte une intervention, créez plusieurs réalités possibles pour chaque unité.

Y₀

(résultat)

Effet causal

=

Y₁ - Y₀

Pour aider à raisonner autour de l'impact causal, les statisticiens utilisent ce qu'on appelle le Cadre des résultats potentiels.

Celui-ci fournit une structure formelle permettant de réfléchir à l'impact d'une intervention en créant plusieurs réalités possibles pour chaque unité.

Une unité peut être une personne, un ménage, une école ou une communauté, et pour chaque unité, il existe deux résultats potentiels :

Y₁ : le résultat si l'unité bénéficie du traitement/de l'intervention
Y₀ : le résultat si l'unité ne bénéficie pas du traitement/de l'intervention

L'effet causal est la différence entre ces deux résultats potentiels : Y₁ - Y₀.

Enfant A (groupe de traitement) → A reçu l'intervention → Résultat observé : Y₁

Enfant B (Groupe de comparaison) → N'a PAS reçu l'intervention → Résultat observé : Y₀

Effet causal = Y₁ - Y₀

64 of 109

Nous ne pouvons pas observer à la fois le scénario réel et le scénario contrefactuel pour un même individu.

CONTREFACTUELS

Reçoit le vaccin

Ne contracte pas la maladie

Ne reçoit pas le vaccin

?

65 of 109

65

Alors, que faisons-nous ?

66 of 109

66

Le contrefactuel est ensuite approximé en trouvant ou en créant un groupe de comparaison valide.

67 of 109

Si les groupes de comparaison sont très similaires, toute différence significative dans les résultats peut être attribuée au programme.

CONTREFACTUELS

Y₁

(résultat)

Y₀

(résultat)

Bénéficie de l'intervention

Ne bénéficie pas de l'intervention

En constituant soigneusement des groupes de comparaison très similaires les uns aux autres, il est possible d'estimer ce qui serait arrivé aux membres du groupe ayant bénéficié de l'intervention et à ceux qui n'en ont pas bénéficié.

Ce groupe est aussi similaire que possible au groupe d'intervention et subit les mêmes conditions externes (telles que les changements de saison, les fluctuations économiques ou les réformes politiques), mais ne bénéficie pas de l'intervention.

Si les deux groupes sont exposés au même contexte, toute différence significative dans les résultats entre eux peut être attribuée au programme lui-même. C'est le fondement d'une conception d'évaluation crédible. Un scénario contrefactuel soigneusement élaboré permet d'aller au-delà des hypothèses et de répondre avec certitude à une question importante : l'intervention a-t-elle fait la différence ou cela se serait-il produit de toute façon ?

68 of 109

Une bonne inférence causale dépend de la capacité de notre groupe de comparaison à refléter ce qui se serait passé sans l'intervention.

CONTREFACTUELS

69 of 109

CONTREFACTUELS

69

Comment pouvons-nous donc créer un groupe de comparaison qui soit similaire sur autant de facteurs/variables observables et non observables que possible ?

70 of 109

CONTREFACTUELS

v

Il existe plusieurs approches différentes pour créer un groupe de comparaison, chacune présentant ses propres compromis entre rigueur, faisabilité et risque de biais.

71 of 109

CONTREFACTUELS

71

Avant d'aborder certaines de ces approches, nous allons présenter un système permettant d'y réfléchir.

72 of 109

CONTREFACTUELS

v

O → Nous mesurons quelque chose (connaissances, comportement, etc.)

X → Le programme est mis en œuvre

Voici quelques-uns des acronymes que nous utiliserons

73 of 109

CONTREFACTUELS

v

Nous écrirons sur des lignes horizontales

Chaque ligne représente un groupe

L'alignement vertical indique que les événements se produisent simultanément

O ------ X ------ O

74 of 109

CONTREFACTUELS

Conception simple avant-après sans groupe de comparaison

O ------------- X ------------ O

Avant Programme Après

Comparaison avant-après – Contrefactuel faible

Une approche courante mais imparfaite de l'évaluation consiste en une comparaison avant-après. Cette méthode consiste à mesurer les résultats juste avant le début d'un programme, puis à nouveau après, en attribuant tout changement à l'intervention. Bien que simple et intuitive, cette approche est très vulnérable aux facteurs de confusion qui peuvent influencer les résultats au fil du temps, indépendamment du programme lui-même.

Il s'agit notamment :

Facteurs de confusion liés au temps : variations saisonnières ou tendances à long terme (par exemple, un programme de formation agricole montre une augmentation des rendements, mais la période d'évaluation coïncide avec la saison de croissance naturelle).
Facteurs de confusion environnementaux : programmes ou changements politiques simultanés (par exemple, un programme nutritionnel semble efficace, mais le gouvernement a simultanément introduit la gratuité des repas scolaires dans la même région).
Facteurs de confusion liés à la mesure : l'acte de mesure influence les résultats (par exemple, des enquêtes répétées sensibilisent les ménages aux comportements « souhaités » tels que le lavage des mains, ce qui entraîne des changements indépendants du programme lui-même).

Tous ces facteurs peuvent créer l'illusion d'un impact, alors qu'en réalité, le changement aurait pu se produire de toute façon.

75 of 109

CONTREFACTUELS

Conception simple avant-après

sans groupe de comparaison

Cette conception montre l'évolution dans le temps, mais nous ne pouvons pas déterminer si le programme est à l'origine de cette évolution, car d'autres facteurs ont pu également jouer un rôle.

Début de la saison sèche �→ les maladies d'origine hydrique �diminuent naturellement

O ------------- X ------------ O

Avant Après

Avril

Août

Programme de Santé Communautaire

76 of 109

Une nouvelle campagne de vaccination est lancée en priorité dans les communautés qui en ont fait la demande la plus pressante. Cette configuration peut-elle être utilisée pour mesurer l'impact réel de la campagne ?

Non, ces communautés peuvent présenter des différences susceptibles de fausser les résultats.
Oui, les communautés motivées l'adopteront plus rapidement

QUE MESURER ET COMMENT

VOTEZ DANS LE SONDAGE

77 of 109

La réponse est A :

Les communautés qui font du bénévolat ont peut-être déjà un meilleur accès aux soins de santé ou une plus grande sensibilisation. Ces différences cachées permettent de déterminer si c'est la campagne elle-même qui a provoqué le changement.

QUE MESURER ET COMMENT

78 of 109

CONTREFACTUELS

Pré-post

avec un groupe de comparaison (non randomisé)

O ------------ X ----------- O

Avant Programme Après

O ------------------------- O

Groupe de comparaison non équivalent – mieux, mais imparfait

Une amélioration par rapport aux comparaisons avant-après est le groupe de comparaison non équivalent, c'est-à-dire un groupe qui ne bénéficie pas de l'intervention, mais qui est observé pendant la même période que le groupe d'intervention. Cette approche permet de tenir compte de nombreux facteurs de confusion liés au temps, car les deux groupes sont exposés aux mêmes conditions externes (par exemple, les saisons, les changements de politique ou les changements économiques).

Cependant, cette conception reste vulnérable aux facteurs de sélection : les différences entre les groupes qui peuvent influencer les résultats indépendamment de l'intervention.

Il s'agit notamment des facteurs suivants :

L'auto-sélection : les personnes qui choisissent de participer peuvent déjà être plus motivées, mieux dotées en ressources ou plus soucieuses de leur santé que celles qui ne participent pas.
La sélection administrative : les programmes sont souvent intentionnellement mis en œuvre dans les zones où les besoins sont les plus importants ou où le potentiel de réussite est le plus élevé, ce qui peut fausser les comparaisons.
Différences de base : avant même le début du programme, les communautés comparées peuvent présenter des différences importantes, notamment en termes d'infrastructures, de revenus ou de démographie.

Les chercheurs essaient souvent de faire correspondre les groupes en fonction de caractéristiques observables, mais cette approche a ses limites. De nombreux facteurs importants (par exemple, les attitudes, les aspirations, la résilience ou la génétique) ne peuvent être observés, mais peuvent néanmoins influencer les résultats. Ces différences cachées rendent difficile d'attribuer avec certitude les changements à l'intervention.

Bien que plus solide que la conception avant-après, l'approche de comparaison non équivalente ne permet toujours pas de produire des estimations causales très fiables, à moins que des méthodes supplémentaires (telles que l'ajustement statistique ou les expériences naturelles) ne soient appliquées avec soin.

79 of 109

CONTREFACTUELS

Conception simple avant-après

sans groupe de comparaison

Les groupes ne sont pas randomisés, ils peuvent donc présenter des différences (motivation, contexte, soutien familial, etc.).

O ------------ X ----------- O

Avant Programme Après

O ------------------------- O

Les participants ont choisi de participer : ils sont déjà plus motivés

80 of 109

CONTREFACTUELS

v

Les comparaisons avant-après et les modèles de groupes non équivalents ont leurs limites.

Ils peuvent aider à observer le changement, mais ils ont du mal à isoler ce qui a causé ce changement.

81 of 109

CONTREFACTUELS

81

Nous avons besoin d'un moyen de créer des groupes qui soient véritablement comparables, même pour les caractéristiques que nous ne pouvons ni voir ni mesurer.

82 of 109

Pourquoi tester les hypothèses ?

Section 4

Randomisation : la norme de référence pour les contrefactuels

D

TESTER LES HYPOTHÈSES

S

E

P

1

83 of 109

RANDOMISATION

C'est là qu'intervient la randomisation

1

2

Reçoit

intervention

Ne reçoit pas d'intervention

GROUPE A

GROUPE B

Effectuer un échantillonnage aléatoire de différents groupes (individus, écoles ou communautés) parmi la population cible

Attribuer de manière aléatoire les groupes qui bénéficieront d'une intervention

Cela permet de créer des groupes statistiquement équivalents.

84 of 109

RANDOMISATION

Avec la randomisation, les facteurs de confusion sont répartis de manière uniforme entre les groupes dès la conception.

Tendances préexistantes
La participation est attribuée
Variations saisonnières
Effets liés à la mesure
Programmes concomitants
Changements politiques

En attribuant de manière aléatoire les unités (c'est-à-dire les individus, les ménages, les écoles ou les communautés) qui bénéficient d'une intervention, l'influence des facteurs de confusion est considérablement réduite. Tous les types de facteurs de confusion mentionnés précédemment sont désormais répartis de manière uniforme entre les groupes, conformément à la conception. Dans la pratique, cela signifie que :

Les variations saisonnières affectent les deux groupes de manière égale
Le biais d'auto-sélection est éliminé, car la participation est attribuée et non choisie
Les tendances préexistantes se manifestent de manière similaire dans les deux groupes
Les programmes ou changements de politique concomitants ont un impact simultané sur les deux groupes
Les effets liés à la mesure s'appliquent de manière égale aux deux groupes

85 of 109

RANDOMISATION

La seule différence systématique entre les groupes réside dans le fait qu'ils bénéficient ou non de l'intervention.

Bénéficie

l'intervention

Ne bénéficie pas de l'intervention

GROUPE A

GROUPE B

86 of 109

Lorsqu'elle est correctement mise en œuvre, la randomisation garantit que la seule différence entre les groupes réside dans le fait qu'ils aient ou non bénéficié de l'intervention.

RANDOMISATION

87 of 109

EXEMPLE

Imaginez que vous mettiez en place un programme visant à encourager les parents à envoyer leurs enfants à l'école.

RANDOMISATION

Différentes situations financières

Différents niveaux d'éducation

Différents emplois du temps

Différentes valeurs envers l'éducation

Différentes motivations

Expériences passées différentes

Distance différente par rapport à l'école

88 of 109

EXEMPLE

En attribuant les caractéristiques de manière aléatoire, toutes les caractéristiques sont réparties de manière similaire entre les groupes.

Unité A

Unité B

RANDOMISATION

Réception

intervention

Groupe témoin

Ne reçoit pas

89 of 109

EXEMPLE

Toute différence dans les taux de fréquentation scolaire après l'intervention peut être attribuée à l'intervention elle-même.

Unité A

Unité B

RANDOMISATION

Recevoir

l'intervention

Groupe témoin

Ne reçoit pas

Y₁

(résultat)

Y₀

(résultat)

La différence entre ces deux résultats correspond à l'impact de l'intervention.

90 of 109

RANDOMISATION

90

La randomisation nous permet de créer une comparaison crédible de « ce qui se serait passé », ce qui nous aide à déterminer ce qui fonctionne vraiment, pour qui et pourquoi.

MÉFIEZ-VOUS DU PIÈGE DES HYPOTHÈSES

Le chemin qui mène des bonnes intentions à un impact réel

Une évaluation rigoureuse ne vise pas seulement à garantir la crédibilité académique, mais aussi à s'assurer que les programmes améliorent réellement la vie des gens. Comme indiqué précédemment, des interventions bien intentionnées peuvent échouer à produire des résultats, gaspiller des ressources précieuses, voire causer des dommages involontaires lorsqu'elles reposent sur des hypothèses plutôt que sur des preuves. La différence entre corrélation et causalité est importante, car elle détermine si les solutions qui fonctionnent réellement sont mises à l'échelle ou si les investissements sont consacrés à des programmes qui ont simplement coïncidé avec des changements positifs. En construisant des contrefactuels valides, idéalement par le biais de la randomisation, la compréhension va au-delà de ce qui semble fonctionner pour s'intéresser à ce qui fonctionne réellement, pour qui et pourquoi.

Ces connaissances transforment la manière de concevoir les programmes, d'allouer les ressources et, en fin de compte, de servir les communautés. Si une évaluation rigoureuse peut sembler intimidante, il est bien plus risqué de poursuivre des interventions sans connaître leur véritable impact.

91 of 109

RANDOMISATION

Expériences randomisées

Non randomisées �et quasi-expérimentaux

Pré-expériences

L'ECR de base
Essai multi-bras
ECR agile
Test A/B
Essai randomisé en grappes
Essais randomisés en grappes avec permutation séquentielle ou essais avec liste d’attente
Essai croisé
Essai multisite
Essai réaliste
Essai hybride
Essai adaptatif

RDD : Régression sur discontinuité
Appariement
Méthode des doubles différences (DiD)
Contrôle synthétique

Hiérarchie

des preuves

Augmentation du pouvoir causal

92 of 109

RANDOMISATION

Expériences randomisées

v

ECR

Confiance dans les résultats : très élevée

93 of 109

Un ECR est une expérience dans laquelle les participants sont répartis de manière aléatoire dans différents groupes d'intervention, dont l'un sert de groupe témoin et ne bénéficie pas de l'intervention.

Les ECR comparent les résultats entre les groupes et nécessitent un échantillon de grande taille.

RANDOMISATION

94 of 109

RANDOMISATION

POPULATION DE L'ÉTUDE

TRAITEMENT

CONTRÔLE

SUIVI

COMPARAISON �RÉSULTATS

ALÉATOIRE

95 of 109

RANDOMISATION

Quelles personnes/groupes se verront offrir l'accès au programme

Quand donner accès �au programme

Quelles personnes/groupes seront encouragés à participer au programme

Possibilités de randomisation

Accès

Moment de l'accès

Encouragement

Il existe plusieurs scénarios dans lesquels vous pouvez procéder à une randomisation. Les trois principales possibilités sont les suivantes :

Accès : par exemple, si nous disposons de ressources suffisantes pour fournir des manuels scolaires à seulement 100 écoles. Nous dresserions une liste de 200 écoles éligibles et sélectionnerions au hasard 100 d'entre elles pour recevoir les manuels pendant la période d'évaluation, puis nous ne livrerions les livres qu'à celles-ci. Les 100 écoles restantes constitueraient notre groupe de comparaison/contrôle.
Calendrier d'accès : par exemple, si un programme de déparasitage scolaire au Kenya prévoit de mettre en place son programme dans les écoles sur trois ans et qu'il y a 75 écoles éligibles. Nous pouvons les diviser de manière aléatoire en trois groupes de 25 écoles et sélectionner au hasard le groupe qui commencera le programme au cours de chacune des trois années.
Encouragement : par exemple, imaginons que nous évaluons un programme qui propose des comptes d'épargne aux agriculteurs cultivant des cultures commerciales. Il s'avère qu'il y a 200 agriculteurs, tous éligibles au programme, mais nous pouvons les répartir au hasard en deux groupes de 100 et envoyer une lettre d'encouragement à un groupe et rien à l'autre.

96 of 109

RANDOMISATION

Avantages

Garantit que le traitement est la seule cause de différence dans la mesure des résultats
Facile à analyser et à expliquer aux parties prenantes, aux décideurs politiques et aux bailleurs de fonds
De nombreuses ressources sont disponibles pour vous guider

Coût
Échantillon de grande taille
Ne garantit pas des connaissances généralisables sur « ce qui fonctionne »
Éthique

Inconvénients

AVANTAGES :

Les ECR, s'ils sont réalisés correctement, peuvent vous aider à déterminer l'efficacité de votre intervention. Cela peut vous aider à prendre des décisions quant à la poursuite de l'intervention, à sa mise à l'échelle, etc.
Les ECR sont une méthode très répandue, il existe donc une multitude de ressources pour vous guider.
Les résultats sont également faciles à analyser et à expliquer aux parties prenantes concernées. De plus, compte tenu de l'engouement suscité par les ECR, il peut être plus facile de convaincre les bailleurs de fonds.

INCONVÉNIENTS :

Les ECR sont coûteux à mettre en œuvre. Bien qu'il existe des ECR rentables, comme les tests A/B, les ECR sur le terrain ont généralement tendance à être très coûteux et à prendre beaucoup de temps.
Ils nécessitent un échantillon de grande taille. Si votre échantillon est trop petit, vous risquez de ne pas pouvoir détecter l'effet (l'impact) de vos interventions.
Validité : les ECR peuvent avoir une validité externe limitée, c'est-à-dire qu'ils ne permettent pas toujours de produire des connaissances généralisables sur « ce qui fonctionne » dans différents contextes et pour différentes personnes.
Éthique : mener des expériences sur des services essentiels peut sembler contestable. Sur quelle base allez-vous exclure certaines personnes ? Est-ce justifié ? Mener des ECR n'est pas toujours éthiquement acceptable.

97 of 109

RANDOMISATION

97

La prochaine étape consiste à apprendre à concevoir des évaluations qui posent les bonnes questions,

mesurent ce qui importe et génèrent des preuves qui guident les décisions réelles.

98 of 109

Amara a un rhume

Que doit-elle faire ?

99 of 109

Actions possibles :

Elle pourrait

Ne rien faire

Prendre de la vitamine C

100 of 109

Étant donné qu'elle ne peut agir qu'une seule fois et observer les conséquences une seule fois, que pouvons-nous lui conseiller ?

Aidez Amara à prendre une décision :

101 of 109

Et si nous clonions Amara ?

102 of 109

Pourquoi avons-nous cloné Amara ?

État de santé général : Amara A est en excellente santé et fait régulièrement de l'exercice.
Sexe : Amara A est une femme
Âge : Amara A est âgée de 28 ans
Environnement : Amara A vit à Bangkok
Formation : Amara A est titulaire d'une maîtrise en économie

Traitement : Amara A prend de la vitamine C

Amara B (contrefactuel)

État de santé général : Amara B est en excellente santé et fait régulièrement de l'exercice
Sexe : Amara B est une femme
Âge : Amara B est âgée de 28 ans
Environnement : Amara B vit à Bangkok
Formation : Amara B est titulaire d'une maîtrise en économie

Traitement : Amara B ne prend PAS de vitamine C

Amara A

102

103 of 109

Amara A prend ses médicaments

Amara B �ne le prend pas

103

Ne fait rien

Prend de la vitamine C

104 of 109

Amara A prend ses médicaments

Amara B �ne le prend pas

104

Ne fait rien

Prend de la vitamine C

105 of 109

La causalité comme outil d'aide à la décision

Saisir les conséquences des actions
Comparez les conséquences entre deux ou plusieurs actions
Aider à identifier les actions à répéter et celles à abandonner
Aider à éviter les coïncidences

En clonant notre amie Amara, nous pourrions répondre avec désinvolture à la question de savoir si la vitamine C était utile. De la même manière, être capable de faire des affirmations causales peut être un outil puissant lorsque nous devons prendre différents types de décisions.

Désormais, chaque fois qu'Amara sera malade et qu'elle voudra un soulagement immédiat, elle saura que la vitamine C l'aidera.

En substance, la causalité est donc un outil puissant qui nous aide à prendre des décisions. Elle permet de saisir les conséquences des actions. Elle nous aide à comparer les conséquences de deux ou plusieurs actions. Une fois que nous savons quelles actions sont bonnes, nous pouvons identifier celles qui doivent être répétées ou celles qui doivent être arrêtées.

106 of 109

Quel est l'impact ?

Début du programme

RÉSULTAT PRINCIPAL

DURÉE

107 of 109

Quel est l'impact ?

Devrions- nous continuer ?

Début du programme

RÉSULTAT PRINCIPAL

DURÉE

Contrefactuel

Impact

Que se serait-il passé si le programme n'avait pas été mis en place ?

108 of 109

Quel est l'impact ?

Devrions- nous continuer ?

Début du programme

RÉSULTAT PRINCIPAL

DURÉE

Contrefactuel

Impact

Que se serait-il passé si le programme n'avait pas été mis en place ?

109 of 109

109

Les expériences (sociales) s'apparentent au clonage humain

La clé du clonage réside dans la randomisation : en répartissant les personnes de manière aléatoire dans deux groupes, ceux-ci sont statistiquement identiques, à condition que l'échantillon soit suffisamment large. �Quelle doit donc être la taille de l'échantillon ? → Cela dépend de la taille de votre effet.

POPULATION ÉTUDIÉE

TRAITEMENT

TÉMOIN

SUIVI

COMPARAISON �RÉSULTATS

Les expériences sociales s'apparentent au clonage humain. Ce que nous faisons essentiellement avec ces expériences, c'est créer un groupe contrefactuel afin de pouvoir comparer les effets de nos programmes et/ou interventions.

Afin de comprendre comment les expériences créent des groupes contrefactuels, nous devons d'abord aborder le concept de « randomisation ». La randomisation est une méthode utilisée pour répartir les personnes dans différents groupes de manière aléatoire. C'est comme lorsque les équipes tirent à pile ou face avant un match.

Vous vous demandez peut-être pourquoi la randomisation fonctionne.

Si vous disposez d'un groupe de personnes suffisamment important et que vous le divisez en groupes sans aucun biais, par exemple en tirant des noms au sort, vous obtiendrez des groupes assez similaires en termes de caractéristiques telles que l'âge, le milieu social, etc. Cela permet de garantir que les différences que nous observerons plus tard entre les groupes pourront être attribuées à ce que nous testons, et non à des différences entre les personnes composant chaque groupe.

Si la seule différence entre ces deux groupes est le traitement (les interventions), nous pouvons alors être sûrs que les différences dans leurs résultats sont dues à l'intervention elle-même, et non à d'autres facteurs.