Optimum, le seul blog véritablement optimal

Aller au contenu | Aller au menu | Aller à la recherche

lundi 20 novembre 2017

Des chiffres et des lettres : qu'y a-t-il de mal avec les modèles macroéconomiques ?

Voilà un billet que je voulais écrire il y a bien longtemps. Lawrence Christiano et ses co-auteurs me font sauter le pas. Dans un document récent, ils prennent la défense du travail des macroéconomistes contemporains, et de leur principal outil de travail qui s'appelle les modèles DSGE. Étant donné que ces modèles constituent en quelque sorte l’orthodoxie macroéconomique, et qu'ils n'ont pas très bien fonctionné pendant la crise, il est de bon ton soit de leur rentrer dans le lard, comme le font beaucoup, soit de la jouer discrète quand on en est un partisan. Christiano et al, pour leur part, en prennent la défense, de façon assez agressive. Les gens qui critiquent ces modèles sont tout simplement des feignasses ("People who don’t like dynamic stochastic general equilibrium (DSGE) models are dilettantes"). Pour Noah Smith, cette agressivité ne risque pas de convaincre grand monde. Il caricature le propos comme suit : "Vous n'êtes pas qualifiés pour juger notre travail, fermez-la et continuez à nous envoyer des chèques".

Il a un peu raison, la condescendance n'encourage pas l'interlocuteur à l'ouverture d'esprit. Mais soyons ouverts quand même.

Leur article comprend des arguments intéressants, mais également un argument qui, paradoxalement, met en lumière ce qui cloche avec l'approche utilisée par ces modèles.

Commençons par expliquer brièvement ce que sont les modèles DSGE (pour Dynamic Stochastic General Equilibrium). En macroéconomie, on doit tenir compte des interactions entre les différents secteurs de l'économie (marché du travail, marché financier, marché des biens et services...). C'est pourquoi, en règle générale, on travaille sur des modèles d'équilibre général, qui tiennent compte de toutes ces interactions. Il y a bien longtemps que les économistes ont compris l'importance des anticipations sur les comportements économiques. Les modèles DSGE sont donc dynamiques, en ce sens qu'ils ne se focalisent pas sur une année isolée, mais ils représentent le fonctionnement de l'économie sur plusieurs années. Plus précisément, ces modèles comportent une hypothèse d'anticipations rationnelles de la part des agents économiques. Cela signifie 1- que les décisions prises aujourd'hui sont impactées par ce qu'on attend du futur, 2- en moyenne, les agents économiques ne font pas d'anticipations systématiquement biaisées du futur. Ces deux points permettent de définir un état stationnaire, dans lequel l'inflation est constante, de même que le PIB (en fait, il peut suivre un trend pour tenir compte de la croissance à long terme) et le taux d'intérêt de la banque centrale (pour prendre les variables les plus fondamentales). Dans cet état stationnaire, par définition, rien ne bouge, et tout le monde anticipe correctement le futur.

Mais soudain, un choc inattendu vient perturber cet équilibre. Par exemple, les banques gèlent les crédits qu'elles octroient à leurs clients. Boom, le PIB baisse, ainsi que l'inflation, on quitte l'équilibre ! C'est la dimension Stochastique du modèle. Que se passe-t-il alors ? Personne n'avait anticipé le choc, mais une fois qu'il s'est produit, chacun sait précisément ce qui va s'ensuivre. La banque centrale va baisser son taux d'intérêt pour stimuler à nouveau l'activité. L'inflation va repartir à la hausse, les taux d'intérêt, après la baisse initiale vont progressivement remonter, etc. On va, au bout de quelques temps, retrouver l'équilibre. Cela pourrait même se faire instantanément, s'il n'y avait des rigidités nominales (des prix qui ne peuvent pas s'ajuster tout de suite) freinant le retour à la normale.

Les modèles, partant de là, peuvent supporter des tas de variantes : rigidités des salaires, modélisation du secteur financier, modélisation de l'endettement, etc. Dans tous les cas, ces modèles sont calibrés, selon l'expression consacrée, pour reproduire les données d'un pays donné. Autrement dit, les paramètres du modèle sont choisis de manière à s'approcher au plus près des variations observées sur une période donnée (20 ans, 30 ans...) du PIB, de l'inflation, du taux d'intérêt (...) Ceci étant fait, on considère le modèle comme une maquette du vrai monde, et on peut simuler des chocs. Par exemple, tel pays envisage un programme d'austérité fiscale. Quelle contraction de l'activité peut-on en attendre, et combien faudra-t-il d'années pour un retour à la normale si la politique est mise en œuvre ?

Pourquoi ces modèles sont-ils critiqués ? Parce que leurs prévisions ont en général été trop optimistes sur la capacité de résilience des économies confrontées à la crise de 2008. A les en croire, la crise aurait dû être courte et d'intensité assez modeste. En science humaine (l'économie en est une) lorsque l'histoire donne tort à une théorie, ses partisans peuvent être tentés de se retrancher dans leur mauvaise foi, ses détracteurs de toujours jubilent et entament la curée. Ces deux attitudes sont également contreproductives.

L'article de Christiano donne un certain nombre d'arguments pour défendre les DSGE. Parmi eux, on mentionnera par exemple le fait que, dès avant la crise, certains modèles avaient déjà commencé à évoluer pour tenir compte des dysfonctionnements financiers, et que cette tendance s'est évidemment poursuivie avec la crise. S'ils ne l'avaient pas fait avant, c'est que personne ne prévoyait une crise d'une telle ampleur, et que les modèles fonctionnaient bien dans des contextes plus calmes.

Mais l'argument le plus intéressant est le suivant : certaines options politiques comportent des effets attendus positifs et d'autres négatifs. Seuls des modèles calibrés sur données réelles permettent d'évaluer lesquels l'emportent. Un pays envisage de dévaluer sa monnaie ? Il va stimuler ses exportations, mais augmenter le poids de la dette de ses ménages, si elle est libellée en monnaie étrangère. Quel effet prendra le dessus ? Un pays envisage d'accroître sa règlementation bancaire ? Il va accroître la  stabilité financière, mais aussi freiner certains investissements. Quel effet prendra le dessus ? Pour Christiano, on a beau jeu de baratiner sur les avantages et les inconvénients d'une réforme. Ce qui compte, c'est de savoir quelle sera l'ampleur de ses effets, et à quel niveau la mettre en œuvre. Les dilettantes, pour reprendre son expression, se contenteront de dire 'ah, ça c'est une bonne idée, mais attention, il y a un risque'. Les économistes qui maitrisent l'art des DSGE feront des prévisions chiffrées pour évaluer l'ampleur de ces risques.

"Prévisions chiffrées", le mot est lâché.

L'argument est suffisamment intéressant pour être pris au sérieux. Mais pour ma part, j'ai le sentiment que, paradoxalement, en mettant l'accent sur la capacité de ces modèles à produire des chiffres, Christiano met le doigt sur ce qui, justement, pose problème avec l'approche DSGE. La macroéconomie est une des rares spécialités, en économie, où l'on s'attend à ce qu'une théorie soit immédiatement présentée sous forme d'un modèle calibré, et donc chiffré. Ça n'a pas toujours été le cas, et les autres spécialités en économie fonctionnent aujourd'hui encore de manière assez différente. 

Dans les autres spécialités, une intuition se formule de façon théorique, dans un modèle où les variables et les paramètres sont représentés par des lettres. (Soit Y le revenu d'un consommateur, X son nombre d'années d'études, beta son aversion au risque, etc). Ces modèles sont, la plupart du temps, résolus, dans le sens où l'on est capable d'exprimer la valeur de chaque variable en fonction des paramètres du modèle. Cette démarche permet d'identifier, théoriquement, l'impact d'une variation des paramètres sur les variables qui nous intéressent. Par exemple, l'impact d'un contrôle de la démographie sur le niveau de développement d'un pays, l'impact d'une diminution des barrières douanières sur le commerce entre pays, l'impact d'une taxe carbone sur les émissions de CO2, l'impact d'une subvention à l'éducation sur le salaire, etc.

C'est uniquement lorsqu'on passe à la phase d'évaluation empirique qu'on tente de chiffrer ces effets, en confrontant le modèle aux données disponibles. Bien sûr, s'il s'agit d'en faire des recommandations politiques, on sera tenté de s'appuyer sur ces résultats chiffrés pour donner du corps à la recommandation. Mais au fond, si les tests empiriques vont dans le sens de la théorie, ce sont les lettres de la théorie qui restent, plus que les chiffres des tests.

En macroéconomie, si je souhaite attirer l'attention sur un effet particulier, par exemple l'impact des banques en ligne sur l'efficacité de la politique monétaire, je devrai dériver ce que changent ces banques en ligne sur les principales équations du modèle, prises isolément, mais pour convaincre la communauté que cet effet est intéressant, il faudra que j'arrive à simuler des données existantes avec mon modèle. Je ne pourrai pas me contenter de résultats théoriques (caveat : j'ai probablement une connaissance partielle de ce qui se publie en macroéconomie, ce que je décris là est la manière, peut-être biaisée dont je vois les choses ; je peux me tromper).

Pourquoi cette spécificité ? Je vois deux raisons possibles.

La première raison est une raison de fond. La macroéconomie est une discipline particulièrement ardue, avec toutes ces interactions, et cette contrainte qu'on s'est fixée de raisonner en dynamique. Dès lors, il est difficile de dériver des résultats théoriques de manière purement analytique. Autant dire que cette raison ne me semble pas très bonne. Dans une défense un peu tiède des modèles DSGE, Olivier Blanchard reconnait que, bien souvent, les intuitions derrière les modèles proposés par les chercheurs peuvent être mises en lumière dans des versions amendées de modèles plus simples, tels qu'ISLM. L'avantage de passer d'un modèle intuitif clair, qu'on peut présenter sous forme de graphique, à une version obscure et insoluble analytiquement ne me saute pas aux yeux (Blanchard est plus tolérant sur ce point).

La deuxième raison est que de riches institutions sont demandeuses de prévisions chiffrées. Le FMI, la BCE, l'OCDE, les grands États... tout le monde veut son équipe d'économistes pour faire des prévisions, et on est prêt à payer cher pour qu'ils développent leurs propres modèles de prévision. Christiano explique que lorsque les économistes du FMI font à Mme Lagarde des prévisions basées sur les résultats des DSGE, ils transforment ça en langage intuitif et donnent les ordres de grandeur fournis par leurs simulations. Ce qu'il décrit ressemble passablement à un problème d'asymétrie informationnelle. Quelques puissants veulent leurs modèles macroéconomiques dont ils ne sont pas capables de comprendre le fonctionnement, mais les développeurs leurs disent : "En gros, ce que dit le modèle c'est blablabla, et d'après nos simulations qu'on ne peut pas vous expliquer, les ordres de grandeurs sont entre tant et tant".

S'il y a une demande, après tout, ne faut-il pas la satisfaire ? Eh bien en l'espèce, je pense que non. La raison est la suivante : quel que soit le modèle utilisé, si on veut faire de la prévision chiffrée en macroéconomie, on ne peut avoir de bons résultats que lorsqu'il n'y a pas de gros choc, c'est à dire quand la prévision ne sert pas à grand chose. Lorsque les chocs sont importants, les modèles chiffrés sont condamnés à échouer. Et à la rigueur, même dans ces situations, une bonne analyse qualitative est probablement plus utile qu'une prévision chiffrée forcément fragile.

Imaginez-vous dans la peau des trois derniers responsables de la fed : Alan Greenspan, Ben Bernanke et Janet Yellen, et demandez vous de quel type d'éclairages vous avez besoin pour mener votre politique monétaire. Greenspan n'a pas traversé de situations aussi difficiles que ses deux successeurs. La crise des dot-coms est peut-être ce qu'il a eu de plus difficile à gérer. Concrètement, comment se passe la gestion de la politique monétaire pendant la grande modération ? On jette un œil à des indicateurs conjoncturels. Indice de la production, évolution du chômage, des salaires, des prix. Petit coup d’œil sur la bourse et sur les prix de l'immobilier. Sur les différents spreads de taux d'intérêt également. Puis on guette. L'inflation s'accélère ? On augmente le taux d'intérêt. Selon le principe de Taylor, on l'augmente plus que ce qu'a augmenté l'inflation, pour que le taux réel augmente. En général, ça calme le jeu. Attention, coup d’œil au chômage, il ne faudrait pas que la hausse des taux soit trop brutale... on les re-diminue progressivement lorsque la menace inflationniste est passée. Bim ! Une petite crise boursière ! Aller, on rassure les marchés, on fournit des liquidités, on baisse les taux. Tout ça, c'est du pilotage. Il y a des questions techniques, là dessous. Mais elles portent plus sur des choses très empiriques telles que les délais avant que les variations de taux portent leurs fruits, que sur les fondements microéconomiques des modèles ! Soudain, vous êtes Ben Bernanke, et paf, vous vous prenez la crise des subprimes en pleine poire. Du jamais vu depuis 1929. Vite, les modèles, que disent-ils ? Ils se plantent ! Ils n'ont rien vu venir et ils surestiment la reprise qui n'arrive pas, bien au contraire. On fait quoi les gars ? Bah... on reprend la bonne vieille macro en lettres des années 70, et on y voit : que les dépenses publiques sont utiles dans ce contexte, que la baisse des taux à court-terme va vite buter sur un plancher et qu'il faut commencer à cibler les taux à long terme avec des politiques non conventionnelles, qu'il faut éviter aux banques une crise de liquidité qui risque de déraper en problèmes de solvabilité. "Oui mais combien ?" réponse : "on met le paquet !". "Oui mais jusqu'à quand ?" réponse : "jusqu'à ce que ça redémarre".

Derrière la remise en cause aujourd'hui très visible des modèles DSGE, il n'y a pas toujours un bon diagnostic. Il y a souvent l'espoir qu'un changement de paradigme va redistribuer les positions au sein de ce vaste terrain de jeu qu'est le monde académique. Ce fut le cas dans les années 70. Pourquoi pas aujourd'hui ? Tous ceux qui se sont fait un petit nom dans une spécialité un peu marginale espèrent que le jour de gloire est arrivé. Maintenant que les grandes institutions ont compris que les modèles DSGE n'étaient pas à la hauteur, il faut les convaincre que la clé d'un bon modèle de prévision est : la modélisation multi-agent, la prise en compte des biais cognitifs, les esprits animaux, le machine-learning, etc.

Il y a peut-être de bonnes choses dans tous ces nouveaux courants, mais ils ne répondent aucunement au vrai problème de la prévision chiffrée en macro : la macroéconomie est tout simplement trop complexe pour être l'objet de prévisions chiffrées fiables lorsque les chocs sont importants. Ça ne veut pas dire que la recherche en macroéconomie n'est pas utile. Elle doit fournir des règles de bonnes conduite en période normale, et des principes d'intervention efficaces en périodes de crises. Bien entendu, les périodes de crises comportent de l'incertitude. Une dévaluation peut stimuler les exportations mais asphyxier les débiteurs. Alors que faire ? N'en déplaise à Christiano, utiliser des modèles qui ne marchent pas n'est pas forcément une meilleure réponse que le doigt mouillé, si le doigt mouillé est connecté à un cerveau qui comprend quelques mécanismes économiques fondamentaux. Au fond, il n'est pas très difficile de savoir de combien va augmenter le poids de la dette extérieure si l'on dévalue de 10%, ni d'estimer de combien vont augmenter les exportations nettes. Et si on se trompe ? On avisera, on renégociera, on fera défaut... pas très pro ? Vous pensez que la Troïka et ses modèles DSGE ont fait mieux avec la Grèce ?

Le vrai changement salutaire pour la macroéconomie consiste peut-être à abandonner cette prétention à vouloir prédire l'avenir, à se re-concentrer sur l'étude qualitative des mécanismes à l’œuvre, et à coupler cette étude de tests empiriques, comme le font les autres spécialités en économie. Les travaux empiriques existent, bien sûr, et ils sont peut-être ce qui se fait de mieux dans la macroéconomie contemporaine. Mais ils sont passablement déconnectés de ce qu'est devenu la macroéconomie théorique.

Un tel objectif n'est peut-être pas très ambitieux, mais parmi les objectifs atteignables, il n'y a probablement pas mieux.

mardi 14 novembre 2017

Qui a inventé la courbe de Phillips ? (c'est Keynes bien sûr...)

James Forder, historien de la pensée économique d'Oxford, est entré en guerre contre la manière dont on présente habituellement l'histoire de la courbe de Phillips. Ses idées sont reprises par deux interventions passionnantes aux dernières Journées de l'économie : une de Goulven rubin, une autre d'André Orléan . Le "mythe" qu'il combat peut se résumer de la manière suivante :

1- Il manque une théorie de l'inflation à la théorie Keynésienne

2- William Phillips établit statistiquement un lien négatif stable entre inflation et chômage dans les années 50.

3- Les keynésiens d'après guerre en font le chaînon manquant de la théorie keynésienne : les pouvoirs publics doivent faire un choix entre {inflation faible + chômage élevé} et {inflation forte + chômage faible}

4- Friedman critique cette vision des choses qui ne tient pas compte de l'ajustement des anticipations qui dégrade les termes de l'arbitrage entre inflation et chômage

5- La stagflation des années 70 lui donne raison

Pour Forder, cette histoire est fausse. Phillips lui-même ne croyait pas vraiment en la stabilité de sa courbe, comme il l'aurait confié très tôt au jeune Friedman. Certes, Solow et Samuelson, dès 1960, s'appuient sur les travaux de Phillips pour dire qu'il existe un choix entre inflation et chômage, mais ils le font dans un article qui dit explicitement que les anticipations d'inflation peuvent changer, et donc que les termes de ce choix ne sont pas constants. Les artisans de la révolution de la macroéconomie des années 70, Friedman et Lucas, ont fait évoluer la discipline en mettant l'accent sur l'importance des règles pour l'un, et sur l'intérêt de raisonner sur des modèles d'équilibre général dynamiques pour l'autre. Mais dire qu'ils ont expliqué à une génération de keynésiens incrédules que les anticipations d'inflations étaient un facteur d'inflation et donc que l'arbitrage inflation-chômage ne tenait pas dans le long terme est tout simplement faux.

J'avoue être un peu ébranlé par ces révélations, car je croyais à ce mythe avant de découvrir les travaux de Forder.

Sur cet aspect de la question, je n'ai pas grand chose à ajouter, d'autant que je ne suis pas un historien de la pensée économique.

En revanche, je tique un peu sur le premier point ci-dessus, qui ne semble pas être le focus de Forder, et qui ressemble à un mythe lui-aussi. il s'agit de l'idée selon laquelle la théorie keynésienne ferait l'impasse sur l'inflation. Que la courbe de Phillips puisse être présentée comme le chainon manquant de la théorie keynésienne m’horripile. Je n'aime pas beaucoup la théorie générale de Keynes (difficile à lire, trop de précaution sur les limites de ce qu'il dit avant même qu'il ne le dise, pas assez direct...). Mais un des rares chapitres qui m'ait un peu marqué est le dernier, appelé "la théorie des prix", qui élabore quelque chose que n'importe qui, aujourd'hui, reconnaitrait comme étant une courbe de Phillips (avant l'heure, bien sûr).

Keynes commence par raisonner sur deux cas polaires : le chômage dans tous les secteurs vs le plein emploi.

Dans le premier cas, pour keynes, les prix sont rigides car, malgré le chômage, les travailleurs s'arrangent pour que leur salaire nominal ne diminue pas. L'inflation est donc nulle. Elle devrait être négative, mais les arrangements institutionnels font qu'elle est juste nulle. Par conséquent, dans ce cas, la courbe de Phillips est horizontale.

Dans le deuxième cas, celui du plein emploi, l'augmentation de la demande ne pouvant être satisfaite par des quantités, elle se traduit par de l'inflation. Autrement dit, la courbe de Phillips est, dans ce cas, verticale. Ces deux cas polaires sont résumés dans l'extrait suivant :

[...] l'accroissement de la quantité de monnaie ne produit absolument aucun effet sur les prix tant qu'il reste du chômage [...]. Aussitôt que le plein emploi est atteint, ce sont, au contraire, [les salaires] et les prix qui s'élèvent dans une mesure exactement proportionnelle à l'augmentation de la demande effective.

Plus loin, il explique qu'en réalité, certains secteurs peuvent être au plein emploi avant d'autres, si bien qu'entre ces cas polaires, la courbe de Phillips est penchée :

Dans la réalité [...] les prix, au lieu d'être constants lorsqu'il existe du chômage et d'augmenter proportionnellement à la quantité de monnaie lorsque le plein emploi est réalisé, montent progressivement à mesure que l'emploi augmente.

A moins que je rate quelque chose, ce chapitre peut être résumé par le graphique suivant :

Pour moi, pas de doute, c'est une courbe de Phillips.

Je le répète, je ne suis pas historien de la pensée. Pour un historien de la pensée, ce point est peut-être trivial. Mais il ne me semble pas inutile de le rappeler. Les manuels de macroéconomie qui s'appuient (encore !) sur IS-LM ont tendance à expliquer que la théorie keynésienne est une théorie à prix fixes, et que la "synthèse classico-keynésienne" s'obtient en y ajoutant une courbe d'offre globale, ou une courbe de Phillips.Il n'y a pas de synthèse qui tienne : cette courbe est déjà présente dans la théorie générale.


Bien sûr, il ne s'agit pas de dire que rien n'a été inventé après Keynes. La première chose qui saute aux yeux, est que rien ne se passe au-dessus de ce qu'il appelle le 'plein emploi'. En termes contemporains, on appellerait cette situation 'emploi d'équilibre' plutôt que 'plein emploi'. L'idée étant qu'on peut obtenir un niveau d'emploi supérieur à l'équilibre (baisse du chômage frictionnel, accroissement du temps de travail) mais moyennant une accélération de l'inflation. Autrement dit, un macroéconomiste d'aujourd'hui expliquerait certainement que la cible de la politique monétaire ne devrait pas être ce niveau d'emploi associé à une courbe de Phillips verticale, mais probablement un niveau inférieur.

Deuxième chose absente : les fameuses anticipations changeantes, qui rendent instable la relation inflation-chômage.

Cela dit, sur ces deux points, il faut faire la part des choses entre ce que Keynes n'avait pas vu et ce qui n'était tout simplement pas important dans le contexte des années 1930. Avec des taux de chômage atteignant les 25% dans certains pays développés, il n'est pas surprenant qu'on se focalise sur la manière de repasser de 25% à environ 0%, sans trop s'attarder sur le point de savoir si l'inflation dégénère à 0% ou un peu avant.

Quant à l'inflation, elle oscillait entre des valeurs négatives et très faiblement positives pendant la grande dépression, la question de son emballement n'était simplement pas d'actualité. La théorie générale a beau se prétendre 'générale', elle a quand même un contexte. Doit-on en conclure que Keynes pensait que l'arbitrage inflation-chômage était à termes constants ? Ce serait faire l'impasse sur ses écrits des années 1920 (compilés dans les essais sur la monnaie) dans lesquels il indique très explicitement que l'inflation et la déflation ont des effets réels uniquement parce qu'elles ne touchent pas tous les prix de façon uniforme.

Milton Friedman aurait dit "nous sommes tous Keynésiens". Pour le coup, ça n'est pas mythe.

mercredi 25 octobre 2017

La courbe de Phillips est-elle morte ?

Il y a un phénomène qui intrigue beaucoup les économistes en ce moment : alors que le taux de chômage américain est tombé à des niveaux très bas depuis maintenant de nombreux mois, l'inflation ne repart pas à la hausse. La courbe de Phillips semble donc prise en défaut. Selon cette courbe, l'inflation et le chômage varient en sens inverse, pour une valeur donnée de l'inflation anticipée par les agents économiques.

Comme la période est à la remise en cause des modèles qui ont fait l'orthodoxie depuis 30 ans, on est tenté de se tourner vers les théoriciens qui contestent le bien fondé de la courbe de Phillips.

A ma droite, Scott Sumner, qui a été brillant depuis le déclenchement de la crise, explique en deux posts (1 & 2) pourquoi la courbe de Phillips est un non-sens. Il réactive la théorie monétariste, en nous proposant d'imaginer une île d'auto-entrepreneurs (donc pas de chômeurs) utilisant un certain bien, disponible en quantité fixe, comme moyen de paiement. La vitesse à laquelle cette monnaie circule détermine le niveau général des prix. Si, soudain, on découvre un nouveau stock de cette monnaie, conduisant à un doublement de la quantité totale, chaque habitant de l'île va multiplier par 2 le prix de vente de ses produits suite à cette découverte, sans que le chômage n'y soit pour rien, puisqu'il n'y en a pas dans cette île d'autoentrepreneurs. Que se passe-t-il si on introduit une certaine forme de rigidité dans les prix ? Par exemple, certains autoentrepreneurs se sont engagés contractuellement à fournir un certain type de travail à un prix prédéterminé. Ces prix-là n'augmenteront pas, donc l'inflation ne sera pas immédiatement de 100% à cause de cette rigidité. Comme ces prix se retrouvent être trop faibles par rapport à tous les autres prix, les autoentrepreneurs concernés font face à une demande anormalement élevée, et ils travaillent plus que d'habitude. Lorsque les prix peuvent enfin changer, ils finissent par doubler eux aussi, et lesdits autoentrepreneurs se remettent à travailler comme avant. Conclusion : ce n'est pas le travail excessif qui crée l'inflation lorsque les prix sont rigides. C'est bien la monnaie qui crée l'inflation. Loin de créer l'inflation, l'excès de travail est au contraire un symptôme de cette rigidité des prix qui empêche l'inflation de prendre spontanément sa valeur "normale", égale au taux de croissance de la masse monétaire. Ainsi, s'il n'y a pas d'inflation aux USA, ça n'a rien à voir avec le chômage, c'est tout simplement parce que la banque centrale ne crée pas suffisamment de monnaie.

A ma gauche, Roger Farmer réactive pour sa part les esprits animaux de Keynes. Pour lui, la courbe de Phillips colle moins aux données des USA de ces 70 dernières années qu'une autre courbe de son cru : la "fonction de croyance" ("belief function"). Selon cette fonction, les agents économiques sont persuadés que le taux auquel le revenu nominal va croître entre cette année et l'année prochaine sera égal à celui auquel il a cru entre l'année dernière et cette année. Si l'individu moyen a vu son revenu exprimé en unités monétaires passer de 1000 à 1100 entre 2015 et 2016, alors on s'attend à ce qu'il passe de 1100 à 1210 de 2016 à 2017. Et comme les agents économiques s'attendent à ça, ils passent des conventions sur cette base, et l'anticipation finit par se réaliser. La banque centrale peut, naturellement, agir pour stimuler le revenu réel, mais sans impacter le revenu nominal. Si bien que, pour une anticipation donnée du revenu nominal, toute augmentation de l'activité réelle (baisse du chômage) s'accompagne d'une baisse de l'inflation. Dans ces conditions, la banque centrale devrait s'appliquer à stimuler l'activité économique autant que possible, pour obtenir un taux de chômage très faible, quelle que soit l'époque ou le pays concerné, sans se soucier de l'inflation. Elle devrait aussi contrôler la bourse pour éviter les bulles, afin de limiter les perturbations de l'économie.

Et au centre... Olivier Blanchard explique que si l'inflation n'a pas décollé, c'est parce que le chômage n'a pas encore assez baissé :

I have absolutely no doubt that if you keep interest rates very low for long enough the unemployment rate will go to 3.5, then 3, then 2.5, and I promise you at some point that you will have the rate of inflation that you want.

La courbe de Phillips existe toujours car... il n'en doute absolument pas.

Alors qui a raison ? Au risque de passer pour un simplet, je pense pour ma part que c'est, contre toute attente, Olivier Blanchard qui a raison.

Commençons par dire pourquoi, selon moi, le par ailleurs souvent pertinent Scott Sumner rate sa cible. 2 points. (1) D'abord, reprenons son histoire, et imaginons que le stock de monnaie supplémentaire soit trouvé par une seule personne, qui ne prévient pas les autres habitants de l'île, mais qui se met à acheter des tas de choses. Dirait-on que, au prétexte que l'inflation n'est pas anticipée, elle ne se produira pas ? En fait, même si personne ne sait qu'il y a deux fois plus de monnaie, l'inflation aura bien lieu. Dans un premier temps, certains des autoentrepreneurs de Sumner auront énormément de travail (ceux qui vendent des choses au chanceux qui a trouvé la monnaie supplémentaire). Assez rapidement, ils se rendront compte que de plus en plus de leurs concurrents sont également débordés de travail. La pression concurrentielle sera moins grande, et chacun pourra commencer à augmenter ses prix. A court terme, on travaille plus, ce qui fait augmenter le 'salaire' (horaire) des travailleurs, et donc le prix des biens qu'ils vendent. A long terme, les prix cesseront d'augmenter lorsqu'ils auront atteint leur niveau d'équilibre, et la demande et l'emploi seront revenus à leur niveau initial. Mais c'est bel et bien une courbe de Phillips qui fait que l'inflation se produit alors qu'elle n'est pas anticipée. La différence entre "tout le monde sait que le doublement de la masse monétaire va entraîner un doublement des prix" et "celui qui a trouvé la monnaie supplémentaire ne le dit à personne" correspond à la différence entre anticipations rationnelles et anticipations adaptatives. Bien que, dans certains domaines, les anticipations rationnelles soient une hypothèse utile, voire puissante, il est douteux qu'elles constituent une hypothèse plus réaliste que les anticipations adaptatives dans le contexte actuel. (2) Seconde faiblesse de la parabole de Sumner : il suppose que tout part de variations exogènes de la masse monétaire. Or, aujourd'hui, dire qu'il n'y a pas d'inflation car la fed ne crée pas assez de monnaie est absurde : la fed crée exactement la quantité de monnaie qui lui est demandée, à un taux qu'elle fixe elle même, et qui est à peu près aussi bas que possible. L'idée que l'absence d'inflation viendrait d'une insuffisance de la monnaie crée vis-à-vis de la demande est simplement un non-sens.

Venons-en à Farmer. Celui-ci refuse d'admettre qu'un marché du travail tendu conduise à une augmentation des salaires. Le marché du travail de nos économies a quelques ressemblances avec le monde des autoentrepreneurs de Sumner. La différence est que les travailleurs sont généralement employés par des entreprises, et que, dans certains cas, ils n'ont pas d'emploi et vivent, le temps d'en trouver un, des allocations chômage. Dans ce monde (le nôtre), les travailleurs et leurs employeurs passent leur temps à négocier des augmentations de salaires. Et les chômeurs jouent le rôle de concurrents des travailleurs. S'ils sont nombreux, les employeurs peuvent faire pression à la baisse sur les salaires ("si vous n’êtes pas satisfaits, j'ai des dizaines de lettres de motivation de chômeurs prêts à vous remplacer pour le salaire que je vous propose"). Si, au contraire, ils sont rares, ce sont les travailleurs qui peuvent faire pression à la hausse ("augmentez-moi ou j'irai travailler pour la concurrence"). Ainsi, il existe de bonnes raisons de penser qu'un faible chômage fasse augmenter les salaires. Mais en règle générale, les entreprises fixent le prix des produits qu'elles vendent en appliquant un taux de marge à leur coût marginal, lequel est, dans une large mesure, constitué des salaires. Par conséquent, l'augmentation des salaires finit par se répercuter sur le niveau des prix, et donc sur l'inflation. Cet enchaînement causal est connu sous le nom de modèle 'WS-PS', et est présenté dans tous les manuels de macroéconomie. Lorsqu'on lui demande pourquoi ce phénomène ne se produit pas dans son modèle, Farmer répond qu'il préfère sa fonction de croyance (et que Larry Summers trouve ça très bien).

Finalement, avec son obsession à croire que le modèle finira bien par marcher, Blanchard n'a peut-être pas l'air très subtil, mais il l'est, au fond, probablement plus que ses contradicteurs. Car à la question "pourquoi les salaires n'augmentent-ils pas alors qu'il n'y a plus de chômeurs ?", je préfère la réponse "bah... ils devraient augmenter pourtant", qui s'appuie sur un modèle logiquement assez robuste, à la réponse "dans ma théorie à moi il n'y a aucune raison qu'ils augmentent", lorsque ladite théorie est peu convaincante.

Cela ne signifie pas, bien sûr, qu'il ne faut pas chercher d'autres explications, mais le modèle WS-PS fixe une sorte de standard pour la recherche de la solution. En d'autres termes, une solution au puzzle de l'inflation devrait permettre de comprendre pourquoi les salaires n'augmentent pas lorsque les travailleurs ne subissent plus la pression concurrentielle des chômeurs. Le chômage est-il mal mesuré ? Après tout, le taux d'activité aux USA n'est pas revenu à sa valeur pré-crise. Peut-être certains inactifs sont en réalité des travailleurs potentiels, qui font pression à leur manière sur les salaires des actifs. Peut être l'inflation est-elle mal mesurée (bien que, d'après Aghion, elle soit plutôt sous-estimée que surestimée en ce moment, cf p 101). Peut-être les salaires des nouvelles embauches sont-ils bel et bien en hausse, mais ne se répercutent pas sur les salaires des anciens employés. Peut-être, tout simplement, les anticipations inflationnistes ont-elles besoin de temps pour s'ancrer dans les esprits.

Voilà en tout cas ce que j'apprécie dans l'attitude de Blanchard sur cette question : sa position bornée en apparence est celle de celui qui a compris qu'il y avait un puzzle à résoudre. En ces temps où il est de bon ton de vouloir reconstruire la macroéconomie, on peut espérer que la reconstruction ne consiste pas simplement à esquiver les questions difficiles. Ne perdons pas de vue que la macroéconomie qui s'est construire à partir des années 80 n'a pas particulièrement brillé pendant la crise, et qu'elle fut elle-même le fruit d'une reconstruction suite à la stagflation des années 70. Et que cette reconstruction s'est largement fondée sur une remise en cause de la courbe de Phillips.

jeudi 21 septembre 2017

Pourquoi (et comment) je n'enseigne plus IS-LM

J'ai la chance d'enseigner la macroéconomie à des étudiants de deuxième année de licence d'économie depuis 2011. Cette année, pour la première fois, je ne m'appuie plus sur le modèle IS-LM. Ce modèle, imaginé il y a 80 ans par John Hicks pour présenter de façon synthétique les idées de Keynes, a été abandonné depuis bien longtemps par les chercheurs en macroéconomie. Il continue pourtant à être la clé de voute de l'enseignement en macroéconomie au niveau licence dans la plupart des universités, accompagné de son extension OG-DG (offre globale - demande globale). Le décalage entre ce qu'on enseigne aux étudiants et ce qu'on fait dans les laboratoires de recherche atteint probablement des records dans la discipline macroéconomique.

S'agit-il de paresse intellectuelle de la part de la profession ? En fait, dans une certaine mesure, on pourrait presque prétendre le contraire. Il est vrai que les modèles macroéconomiques issus de la révolution des anticipations rationnelles sont par nature trop compliqués pour être enseignés à des jeunes de licence. Il est également vrai que les auteurs de manuels ne semblent pas s'être particulièrement préoccupés de trouver une manière simple d'en vulgariser les enseignements.

Mais à mon sens, la principale raison de cette survivance d'IS-LM-OG-DG est à chercher ailleurs que dans la paresse.

IS-LM est un très bon modèle

Il est assez probable que, pendant des années, ce modèle ait été tout simplement plus pertinent que ses successeurs plus complexes.

Par exemple, expliquer la grande dépression avec IS-LM-OG-DG fonctionne très bien : les faillites bancaires entraînent une chute de l'investissement autonome et donc un basculement vers la gauche de la courbe IS. Le taux d'intérêt chute car la demande de monnaie diminue. La courbe de demande globale se déplace donc vers la gauche, le PIB chute de même que le niveau des prix. La banque centrale essaie de corriger le tir en créant de la monnaie, mais dans une trappe à liquidité, c'est inefficace. Seul un stimulus budgétaire permet de se sortir d'une telle situation, sans risque d'effet d'éviction, la courbe LM étant horizontale. Quoi que vous pensiez de ce modèle, ses prédictions ressemblent quand même beaucoup à ce qui s'est passé.

Que nous en disent nos modèles contemporains, plus raffinés, et trop complexes pour être enseignés à nos étudiants de licence ? Au risque de m'acharner sur un homme de paille et de caricaturer un peu leur message (mais pas tant que ça), je répondrai à la question en m'appuyant sur un article célèbre d'Harold Cole et Lee Ohanian : "The Great Depression in the United States From a Neoclassical Perspective". Dans cet article, les auteurs montrent l'incapacité des modèles contemporains à reproduire la persistance de la grande dépression. Ils en concluent que si la réalité est si différente du modèle, c'est probablement qu'il s'est passé quelque chose après le déclenchement de la crise qui a ralenti la reprise. Et cette chose, vous l'avez deviné, c'est... le new deal ! Oui, vous avez bien lu : le modèle prédit que, sans rien faire, la reprise doit arriver rapidement, or elle n'est pas arrivée rapidement, c'est la faute au New Deal.

Il n'y avait certainement pas que de bonnes choses dans le New Deal, et il y a des débats légitimes sur les rôles respectifs du new deal et de l'abandon de l'étalon or (voire de la guerre) dans la sortie de crise. Mais de là à dire que c'est à cause du new deal que le PIB de la grande dépression s'écarte de celui prévu par les modèles macroéconomiques contemporains... non, vraiment, rendez-moi mon bon vieil IS-LM !

Mais alors pourquoi l'abandonner ?

Et pourtant, je l'abandonne. Et je ne suis pas le seul. Olivier Blanchard lui-même, qui se trouve être, entre autres choses, un des auteurs de manuels de macroéconomie fondés sur IS-LM, ne va pas tarder à l'abandonner. Et pour de bonnes raisons. Le modèle IS-LM-OG-DG est basé sur 4 courbes (IS, LM, OG et DG). Sur les 4, 2 sont pertinentes (IS et OG), une pourrait l'être dans un autre monde, mais ne correspond pas à la manière dont les banques centrales font leur travail (LM), et une n'a pas beaucoup de sens (DG).

Commençons par la courbe LM : cette courbe nous explique que, lorsque le PIB d'un pays s'accroît, la demande de monnaie augmente, et donc, si la banque centrale n'ajuste pas l'offre de monnaie, le taux d'intérêt augmente. Cette vision des choses pourrait avoir du sens dans une économie de type étalon-or, mais pas dans nos économies actuelles. De nos jours, les banques centrales fixent directement un taux d'intérêt, et laissent généralement la masse monétaire augmenter pendant les périodes de croissance.

Ce simple fait vide de son sens la courbe DG : celle-ci nous explique que la demande diminue lorsque l'indice des prix augmente. Cette transposition à la macroéconomie d'une évidence microéconomique est absurde. Si les prix augmentent, la valeur de ce qui est vendu augmente, et comme c'est la source de tout revenu, les revenus nominaux augmentent à leur tour. La seule justification de cette courbe DG est ce qu'on appelle un effet d'encaisses réelles : si tous les prix augmentent mais si la masse monétaire reste constante, alors cette masse monétaire devient relativement plus rare, et donc son prix, le taux d'intérêt augmente : ainsi, l'augmentation du niveau des prix aurait le même effet qu'une contraction monétaire. Cet effet d'encaisses réelles n'a jamais convaincu grand monde, et avec une monnaie qui se crée largement au rythme de l'activité nominale, il n'a tout simplement aucun sens.

Ajoutons à cela qu'une grande évolution des pratiques macroéconomiques depuis 30-40 ans concerne la gestion des banques centrales : aujourd'hui, elles sont indépendantes et appliquent des règles, en général le ciblage d'un taux d'inflation autour de 2%. Par conséquent, leurs décisions peuvent être anticipées, et donc directement intégrées à la dynamique du modèle. Ce qui n'est pas le cas dans IS-LM.

Alors que faire ?

Réponse très simple. A partir de cette année, pour moi, la macroéconomie, c'est le modèle IS-PC-MR, tel que présenté dans le manuel 'Macroeconomics: Institutions, Instability, and the Financial System' de Wendy Carlin et David Soskice. Le manuel n'est, hélas, pas traduit en français, mais je suis sûr que ce modèle est destiné à devenir le nouveau standard pour les années qui viennent.

Comment ce modèle fonctionne-t-il ? Il repose sur 3 équations, ou 3 courbes.

La courbe IS est assez classique : le taux d'intérêt, ici directement choisi par la banque centrale, détermine le PIB. Cette courbe IS se déplace vers la droite (gauche) lorsque la dépense autonome augmente (diminue). Le taux dont il est ici question est le taux d'intérêt réel, et non pas nominal. Pour passer de l'un à l'autre, on retranche l'inflation anticipée, égale, par hypothèse, au taux observé à la période précédente. C'est donc une hypothèse peu orthodoxe d'anticipations adaptatives qui est faite ici. Enfin, l'influence du taux d'intérêt sur le PIB se fait avec une période de retard : le taux fixé en 2017 détermine le PIB de 2018.

La courbe PC est tout simplement la courbe de Phillips. Voici comment elle fonctionne. Le côté offre de l'économie est représenté par un  modèle WS/PS assez classique, qui débouche sur une valeur du PIB telle que les prévisions d'inflations sont confirmées si le PIB prend cette valeur. C'est le PIB d'équilibre, qui sera ciblé comme objectif à atteindre par la banque centrale. Si le PIB est supérieur (inférieur) à ce niveau, le pouvoir de négociation des travailleurs est fort (faible), ce qui entraîne une augmentation de leur salaire supérieure (inférieure) à l'inflation anticipée. Cette augmentation (diminution) se répercute sur l'inflation, qui se trouve plus élevée (faible) que prévu. Là encore, les anticipations adaptatives prévalent : le niveau anticipé de l'inflation est celui de la période qui précède. Cela débouche sur sur une courbe de Phillips, qui est une relation croissante entre l'inflation et le PIB. Cette courbe de Phillips se déplace vers le haut lorsque l'inflation anticipée augmente.

A ce stade, il suffit d'ajouter que la banque centrale a une cible d'inflation (disons 2%) pour définir ce qu'est un équilibre du modèle :

les agents économiques anticipent une inflation de 2%, et la banque centrale fixe un taux réel correspondant, d'après la courbe IS, au PIB d'équilibre déterminé par WS/PS.

Résultat des courses, le taux d'inflation correspond bien aux 2% prévus.

Que se passe-t-il si la courbe IS bouge ? Prenons le cas d'une crise : chute de l'investissement autonome. Étant donné le décalage entre la fixation du taux d'intérêt et son impact sur l'économie, cette évolution imprévue (et que nous considèrerons comme temporaire) crée un ralentissement de l'économie. le PIB est plus faible que prévu, l'inflation aussi. Disons qu'elle est tombée à 1%. Par conséquent, pour l'année suivante, la courbe de Phillips est plus basse (anticipations adaptatives encore une fois). Si la banque centrale fixe un taux réel correspondant au PIB d'équilibre, les anticipations d'inflation à 1% se vérifieront, alors que la cible est de 2%. La banque centrale se doit donc de recréer des anticipations d'inflation à la hausse.

Sa politique est représentée par la troisième courbe du modèle : la courbe MR (pour Monetary Rule), qui coupe la courbe PC dans le graphique du bas :

Etant donné que la banque centrale sait qu'elle ne peut pas obtenir dès la période 2 une inflation conforme à sa cible en même temps qu'un PIB d'équilibre, cette courbe MR représente le compromis qu'elle fait entre ses deux objectifs (stabilité de l'inflation, stabilité de l'activité). Le point d'intersection entre la courbe MR et la nouvelle courbe de Phillips (en rouge ci-dessus) donne le couple inflation-PIB qu'elle vise pour la période 2. Pour obtenir ce résultat, elle fixe un taux d'intérêt réel qui correspond à ce PIB. Il est plus bas que le taux d'équilibre. Et le taux nominal d'autant plus, puisqu'il est associé à une inflation plus faible. Notez que, dans l'exemple, la courbe IS est revenue à sa position initiale, puisqu'on considère le choc comme temporaire (s'il était définitif, on aurait simplement travaillé sur la courbe IS' en rouge).

A la période 2, le PIB est maintenant supérieur à son niveau d'équilibre, ce qui fait remonter l'inflation, passant de 1% à, disons, 1,5%.

Pour trouver le nouveau couple inflation-PIB ciblé par la banque centrale, on cherche à nouveau l'intersection entre la courbe MR et la nouvelle courbe de Phillips, celle représentée en vert, et indexée pour une inflation de 1,5%. Le taux d'intérêt correspondant à ce PIB est plus élevé que celui de la période précédente, mais encore inférieur au taux d'équilibre. Graduellement, période après période, le taux d'intérêt va remonter vers son niveau d'équilibre, de même que l'inflation. Le PIB, après avoir chuté fortement en période 1 puis augmenté au-dessus de son niveau d'équilibre en raison du coup de pouce monétaire, redescend lui-même progressivement à son niveau d'équilibre.

Un modèle riche.

Ce modèle, plus réaliste que le modèle IS-LM-OG-DG, permet de traiter de tas de questions macroéconomiquement pertinentes. Par exemple, la question épineuse des trappes à liquidités se pose ici de la façon suivante : si la crise est très grave, causant une anticipation d'inflation négative, alors le taux réel sera supérieur au taux nominal. Or le taux nominal ne peut être négatif. Ainsi, au lieu de rehausser les anticipations d'inflations, le taux réel plonge un peu plus le pays dans la récession, avec une boucle vicieuse déflation -> taux réels trop forts -> récession -> déflation.

Comme dans la version IS-LM, cette situation peut être traitée par un décalage vers la droite de la courbe IS, autrement dit par des politiques budgétaires. Mais l'histoire, ici, est plus réaliste que celle racontée avec une courbe LM horizontale.

On peut également introduire dans le modèle la sphère financière de la façon suivante : le taux d'intérêt qui influence l'économie n'est pas celui de la banque centrale, mais celui auquel les banques prêtent de l'argent à long terme à leurs clients. la différence entre les deux est une marge bancaire (spread), qui dépend du risque assumé par les banques. Un accroissement du risque lié à l'insolvabilité des emprunteurs conduit à une augmentation des spreads, et donc joue le même effet qu'une augmentation du taux réel. Dans cette situation, la baisse des taux directeurs risque d'être insuffisante, car la limite du 0% s'impose, encore une fois, au taux nominal. L'action de la banque centrale consiste alors à acheter des actifs à long terme pour faire baisser non pas la position de la courbe des taux, mais sa pente (faisant ainsi repartir les spreads à la baisse). c'est exactement ce qu'ont fait les banques centrales avec le quantitative easing.

Bien entendu, une autre extension du modèle est sa version d'économie ouverte, ce qui est classique pour ce type de modèles (je ne développe pas)

Un modèle d'avenir.

Le modèle de Carlin et Soskice est peut être trop orthodoxe pour les hétérodoxes (il consacre les règles de politiques monétaires basées sur le ciblage d'inflation, il est 'hydrolique' au sens où il pourrait sembler trop déterministe, il valide le NAIRU...), et trop hétérodoxe pour les orthodoxes (l'hypothèse d'anticipations adaptatives, pourtant présente chez Milton Friedman, est aujourd'hui souvent considérée comme trop keynésienne pour être honnête).

Pourtant, si l'on évaluait un modèle sur ses capacités à prédire le réel, et non sur son adéquation à telle ou telle chapelle souvent artificielle, on devrait probablement en faire le nouveau socle de l'enseignement de la macroéconomie. Comme je suis optimiste sur le fonctionnement de ma profession, j'en fais le pari.

mercredi 19 juillet 2017

Hysteresis

En macroéconomie, la question de l'hystérèse est probablement une des plus intéressantes actuellement. Le principe de l'hystérèse est très simple à comprendre. Un évènement A provoque une conséquence B. Si A, la cause, disparaît, mais que la conséquence B continue à se manifester, on est en présence d'un phénomène d'hystérèse. Les macroéconomistes s'y intéressent pour la raison suivante : dans la théorie macroéconomique la plus standard, les questions d'offre et de demande sont déconnectées. L'offre concerne le fonctionnement du marché du travail, du marché des biens et services, la fiscalité, la productivité du travail etc. La demande concerne la politique monétaire, l'investissement, la consommation etc.

Lorsqu'une crise provient d'un problème de demande insuffisante, on considère généralement qu'une politique de relance de la demande permet de régler le problème. La demande ayant retrouvé son niveau pré-crise, la crise devrait ne pas laisser de traces.

La thèse de l'hystérèse s'oppose à cette vision des choses, en disant que le ralentissement provoqué par un problème de demande peut affecter l'offre, et donc continuer d'affecter l'économie même après résolution du problème initial. Un exemple souvent cité est celui de la productivité du travail : après une crise caractérisée par une forte hausse du chômage, les travailleurs se voyant contraints de passer plusieurs mois au chômage à cause de la crise peuvent perdre leur capacité de travail (perte de confiance en soi, oubli de certains savoirs-faire, découragement...). Un doctorant de l'université de Cambridge, Maarten de Ridder, apporte un argument très fort en faveur de la théorie de l'hystérèse (cf cette présentation sur VOX, trouvée grâce au tweeter de Pierre Aldama, qui serait bien inspiré de tenir un blog soit dit en passant). Le mécanisme mis en avant par De Ridder concerne les investissements en recherche et développement, centraux pour faire croître la productivité du travail, et qui sont affectés par la crise. Ici, l'idée est que les économies avancées ne peuvent pas connaître de croissance sans progrès technique. Les dysfonctionnements bancaires qui sont au cœur de la crise de 2008 auraient eu comme effet secondaire d'empêcher les entreprises de disposer des liquidités nécessaires pour financer leur recherche et développement. Ainsi, malgré le travail des banques centrales pour sortir de la crise, le ralentissement de la productivité provoqué par cette baisse de la recherche empêcherait nos économies de retrouver le trend des années pré-crise. Le graphique suivant, extrait de l'article de Vox, présentant l'évolution du PIB de trois zones économiques avancées, illustre cette persistance du ralentissement :

L'hypothèse formulée par de Ridder n'a rien de bien nouveau. La chute de l'investissement fait partie des mécanismes théoriquement connus d’émergence d'un effet d'hystérèse. Et après tout, on pourrait très bien interpréter les choses autrement : par exemple, c'est la baisse des perspectives de découvrir de nouvelles idées fécondes qui pourrait expliquer la baisse des investissements en recherche et la croissance plus faible qu'avant la crise.

La force de l'argument de Ridder est qu'il repose sur le fait que les différentes banques n'ont pas toutes été touchées avec la même violence par la crise. Or les entreprises ont en général une banque "préférée", qui est tout simplement la banque qui les suit habituellement. La relation banque-entreprise est une relation de confiance, de long terme, basée sur une connaissance fine de la situation et de la stratégie de l'entreprise par la banque qui la finance. Si l'on accepte l'idée que le choix par une entreprise d'une banque a peu de chance de dépendre des facteurs qui expliquent l'exposition des différentes banques à la crise, alors on peut interpréter la crise comme une expérience naturelle. Si les entreprises habituellement financées par une banque ayant été touchée fortement par la crise ont moins investi en recherche que les autres, alors c'est probablement le signe que les contraintes de crédit provoquées par cette crise sont effectivement responsables d'une partie au moins de la chute de l'investissement.

Et c'est le cas. Ridder s'appuie sur des données portant sur des firmes américaines. Pour chaque firme, on connait : sa banque, ses investissements en R&D et sa productivité. Pour chaque banque, on connait la gravité avec laquelle elle a été touchée par la faillite de Lehman Brothers. Le premier résultat frappant est que les entreprises dont les banques ont été les plus touchées par la crise ont effectivement moins investi dans la technologie que les autres. Le graphique suivant représente l'impact d'une chute d'un écart-type de la qualité des actifs d'une banque sur les investissements en technologie des entreprises qu'elle finance habituellement :

Ce graphique ce lit de la façon suivante : avoir une banque qui a plus souffert de la crise que la moyenne d'un écart-type a entraîné une baisse des efforts de recherche de 1 ou 2 points de pourcentage sur la période post-crise. Le chercheur dispose ici de ce qu'on appelle un instrument, c'est-à-dire une manière de transformer une corrélation en causalité. En effet, les investissements en recherche et la productivité, c'est un peu l'histoire de la poule et de l'oeuf. Est-ce que la productivité stagne à cause d'un manque d'investissement, ou est-ce l'investissement en recherche qui freine lorsque les opportunités de croissance se tarissent, comme le pensent les prophètes d'une stagnation séculaires ?

Ici, la question est de savoir si la chute de l'investissement provoquée par les difficultés financières de 2008 ont affecté la productivité. Autrement dit : les entreprises ayant eu de mauvaises banques ont-elles connu un ralentissement de leur productivité plus marqué que les autres ?

La réponse est positive. Le graphique suivant représente l'impact d'une diminution d'un écart-type des investissements en recherche due à la mauvaise situation de la banque sur la croissance de la productivité des firmes :

Ce qui est frappant dans ce graphique, c'est que les entreprises ayant des banques très exposées à la crise n'avaient pas de performances significativement moins bonnes que les autres avant la crise. La dégradation est continue entre 2009 et 0014. Il semble donc qu'il existe bel et bien un lien entre la crise et le recul de la productivité.

D'après les calculs de Ridder, si les investissements en technologie étaient restés au même niveau qu'avant la crise, le PIB aurait été aujourd'hui entre 3% et 4% supérieur à ce qu'il est, ce qui correspond à un tiers de l'écart entre le PIB et le trend d'avant la crise. D'autres facteurs doivent donc être mobilisés pour expliquer les deux tiers restants, mais pour un doctorant, retrouver la trace de 650 milliards de dollars dans le cadre de sa thèse, c'est quand même un bel exploit !

Comme quoi, tout n'est pas à jeter dans la recherche actuelle en macroéconomie. Puisse cette tendance persister !

samedi 27 mai 2017

Scandale des attachés parlementaires : une solution simple

Ainsi donc, après François Fillon et Bruno Leroux, c'est au tour de Richard Ferrand de faire scandale pour avoir embauché des proches en tant qu'assistants parlementaires. Comme il se murmure que le nombre de parlementaires concernés par cette pratique est à trois chiffres, on peut s'attendre à ce que des journalistes malicieux nous distillent les noms au compte goutte à mesure que tel ou tel membre de la liste passera sur le devant de la scène (devenant ou s'apprêtant à devenir ministre, président de région, maire d'une grande ville...). Pour ce qui est des pratiques passées, il n'y a pas grand chose d'autre à faire que d'attendre le grand déballage, en souhaitant qu'il soit le plus rapide possible, et en espérant que la classe politique ne renouera pas avec la détestable pratique de la loi d'amnistie qui avait entaché les années 90 en France.

Que faire pour que ces pratiques disparaissent à l'avenir ? Il existe une solution très simple et dont je n'entends personne parler : diviser par 2 le budget alloué aux parlementaires pour l'embauche de leurs assistants. Car au-delà de ce que révèlent ces affaires sur la probité de nos parlementaires, ce qu'elles nous apprennent de façon plus fondamentale est que les quelques 10'000 euros mensuels de salaires bruts que chaque parlementaire peut consacrer à ses assistants parlementaires sont tout simplement excessifs. Si, pour exercer correctement leur mandat, les députés avaient vraiment besoin de trois ou quatre assistants à temps plein, ils n'embaucheraient leur conjoint qu'à titre exceptionnel, dans les cas où celui-ci aurait des compétences particulières, en phase avec les attentes du métier. Je suis prêt à parier que les ministres utilisent une fraction bien moindre du budget de rémunération de leurs cabinets à embaucher des proches. Et ce pour une raison simple : il est impossible de gérer un ministère sans être entouré de gens compétents et professionnels. Gaspiller de l'argent en embauches de complaisance est un luxe vraisemblablement plus difficile à se permettre pour un ministre que pour un député.

En entendant parler d'assistants parlementaires, les amateurs de séries ont probablement en tête des scènes de House of Cards, ou 24, ou encore Designated Survivor, dans lesquelles un ministre, un sénateur ou tout simplement le président est entouré de 3 ou 4 jeunes diplômés de Harvard surexcités, lui conseillant, pour l'un, d'accepter tel accord proposé par le chef de la majorité républicaine, pour l'autre de le refuser pour éviter de troubler son image, et pour le troisième de temporiser en faisant une contre-proposition qu'il pourra faire passer par un de ses contacts travaillant pour l'autre camp.

Ce genre de conseillers de l'ombre existent certainement, dans l'entourage des ministres, des chefs de partis, voire des présidents de groupe au parlement. Mais il est assez douteux que le quotidien des assistants parlementaires ressemble à cela. L'assemblée a publié en 2013 un rapport sur les assistants parlementaires dont ressortent les points suivants : ce ne sont pas de vieux briscards de la politique. 60% d'entre eux ont moins d'un an d'ancienneté (en 2013, soit un an après les dernières législatives. On peut penser qu'ils ont aujourd'hui 4 ans d'ancienneté en plus). L'essentiel des députés a au moins 3 assistants, plus de la moitié en a au moins 4. La plupart d'entre eux n'ont donc probablement pas un salaire mirobolant. Le salaire de base brut moyen est de 2146 euros, soit bien moins de 2000 pour le net.

Les députés fabriquent des lois. On pourrait imaginer qu'ils se payent les services de sommités de la science juridique. A ce prix-là, il n'en est rien. Les idées, les conseils, la technicité, tout cela est apporté par les ministères qui préparent les projets de loi, ou par des think tanks, ou par les partis politiques directement. La chaîne parlementaire diffuse régulièrement des séances de travail au cours desquelles les députés interrogent des spécialistes des questions sur lesquelles une loi est prévue. C'est à ces occasions également que les députés acquièrent la technicité et la connaissance des problèmes qui leur permettent d'apporter des contributions pertinentes à la création de la loi. Manifestement, les assistants parlementaires ne sont pas au premier plan dans ce processus (je parle de l'extérieur, tout assistant parlementaire lisant ce billet est invité à me contredire en commentaire).

Cela ne signifie pas qu'ils ne sont pas utiles. Il semble évident qu'un député ait besoin d'un assistant pour organiser des réunions, préparer son agenda, filtrer sa correspondance, etc. On peut facilement imaginer que les députés souhaitent avoir un collaborateur accomplissant ces tâches à Paris, et un autre en circonscription. Mais quid du troisième (dans 92% des cas), et a fortiori du quatrième (58%) ? Les lois serraient-elles plus mauvaises en leur absence ?

Je fais la différence, en termes de probité, entre un député qui embauche une personne avec qui il partage un compte bancaire, et un député qui embauche un jeune militant de son parti en année de césure dans le cadre de son cursus science po, éventuellement fils d'un cadre du parti. Mais la différence n'est pas si grande. Dans le second cas, le député consolide un réseau de personnes qui lui sont redevables, et qui font grâce à lui leurs premiers pas dans la cour des grands.

Un des arguments avancés par certains défenseurs maladroits de François Fillon dans les premiers temps de son affaire était : "Si Mme Fillon n'avait pas fait le travail pour lequel elle était payée, qui donc l'aurait fait bénévolement à sa place ?". Le couple Fillon est présumé innocent, mais si la justice devait confirmer la lecture du parquet financier, elle ferait ainsi la démonstration qu'on peut être un député tout à fait valable en renonçant aux services normalement payés par la moitié de la masse salariale dédiée aux assistants.

Si cette dotation est, comme j'incline à le penser, surdimensionnée, alors les solutions mises en avant dans le débat public ratent leur cible. Faut-il interdire aux députés d'embaucher des membres de leur famille ? S'il y a une part de complaisance dans ces embauches, je suis parfaitement indifférent, en tant que contribuable, aux relations familiales qui lient celui qui les alloue à celui qui en bénéficie. C'est la complaisance en tant que telle qui me gêne. Faut-il obliger les parlementaires à recruter des assistants issus de formations agréées ? Il est évident que l'assistant parlementaire est une personne de confiance, et on ne saurait décemment obliger un député à recruter quelqu'un issu de telle ou telle formation, s'il n'a pas de personne de confiance dans le lot. Faut-il contrôler l'effectivité du travail effectué ? Si les ressources étaient correctement calibrées, pas besoin de contrôler une activité par ailleurs assez difficile à contrôler (faut-il qu'une commission ad-hoc se voie remettre la totalité de la correspondance traitée par l'assistant ?), car il est dans l'intérêt du député qu'elle soit bel et bien effectuée.

Diviser par 2 le budget des assistants parlementaires éviterait les abus des députés, leur permettrait de garder un contrôle sur les embauches et une certaine confidentialité sur le contenu des échanges avec leur assistant, et ferait économiser quelques 30 millions d'euros par an aux finances publiques. Mon petit doigt me dit que ça ne suffit pas pour qu'une telle mesure soit adoptée par les parlementaires.

mercredi 12 avril 2017

Déclin des centres-villes et lutte des classes

On parle beaucoup depuis quelques mois du déclin des centres-villes des villes françaises moyennes. L'indicateur qui illustre ces craintes est celui de la vacance commerciale, qui correspond au pourcentage de commerces fermés dans une  ville donnée. Un rapport de l'inspection générale des finances et du conseil général de l'environnement et du développement durable a mis en lumière sa forte augmentation dans de nombreux centres de villes moyennes depuis une dizaine d'années. La ville de Bézier est souvent citée en exemple, en raison de son taux particulièrement élevé (un quart) et du lien qu'on peut faire sans trop se mouiller avec l'élection dans cette ville d'un maire proche du Front National. On peut citer également des villes comme Dreux, Montélimar ou Libourne. En ligne de mire du rapport et des commentateurs, les grands centres commerciaux installés en périphérie qui poussent les petits commerçants du centre à fermer boutique. Les centres historiques auxquels nous tenons tant sont-ils condamnés à la paupérisation ? Notre futur est-il condamné à s'inscrire dans ces périphéries impersonnelles et froides que le vingtième siècle a greffé à nos villes ?

Ces angoisses sont compréhensibles, mais elles ne devraient pas conduire à préconiser des politiques défavorables aux classes les plus populaires. Car la question du déclin des centres-villes est aussi une question d'inégalités économiques. Et la frontière est mince entre l'attachement sentimental à nos villes et le simple mépris de classe. 

La photo qui illustre ce billet est prise à Detroit, ville sinistrée s'il en est. Le centre-ville de Detroit est pauvre et délabré, les classes aisées l'ont abandonné, remplacées par des ghettos. L'évolution connue par Detroit depuis la deuxième moitié du 20ème siècle est à l'opposé exact de ce qui s'est passé à Paris. Le centre-ville de Paris est riche et entretenu comme un musée vivant. Ici, la crainte n'est pas la paupérisation mais au contraire la gentrification, qui menace de chasser du centre les rares pauvres qui peuvent encore y vivre. Trois économistes, Jan Brueckner, Jacques-François Thisse et Yves Zenou, ont consacré un article en 1999 à l'explication de cette différence. Cet article est très théorique, les cas de Detroit et Paris n'étant que des illustrations. On pourra donc en transposer les résultats aux cas des villes moyennes françaises dont il est question ici (Paris n'est pas concerné par le rapport). Voilà ce que nous dit cette théorie : supposez qu'il y ait, dans une ville donnée, des riches et des pauvres. L'essentiel de l'activité économique est situé au centre ville, et habiter loin du centre est coûteux. Le fonctionnement du marché contraint les propriétaires de terrains éloignés du centre à proposer des prix plus faibles qu'au centre, afin de compenser le coût de déplacement des périurbains. Dans ce contexte, qui, des riches et des pauvres, habitera plus prés du centre ? Gardez-vous bien de vous dire que ce sont nécessairement les riches au prétexte que les pauvres vont chercher des prix plus faibles en périphérie. Les propriétaires fonciers utiliseront leurs terres pour créer des logements correspondant aux catégories qui sont disposées à leur payer le prix le plus élevé dans chaque quartier. Les riches ont, par définition, des capacités financières plus élevées que les pauvres, qui pourraient faire penser que ce sont eux qui proposeront toujours le prix le plus élevé pour vivre dans un quartier donné. Mais cette même capacité financière fait qu'ils sont moins pénalisés que les pauvres par l'éloignement au centre. Confronté à un prix au centre très élevé, un riche peut plus facilement qu'un pauvre 'faire jouer la concurrence' avec la périphérie, où il pourra s'acheter une très grande villa de laquelle il fera des allers-retours vers le centre, dans son SUV spacieux et énergivore. Il est donc plausible que le prix qu'un riche est prêt à payer pour se loger parte d'une valeur relativement modeste au centre, pour décliner légèrement en fonction de la distance au centre. Inversement, le prix offert par un pauvre déclinera rapidement avec la distance au centre, en raison même du coût de l'éloignement qu'il pourra supporter plus difficilement. Le prix offert par un pauvre donc doit partir d'une valeur plus élevée au centre pour qu'il puisse se loger. En effet, sauf à imaginer que les pauvres disparaissent complètement de la carte, il doit bien y avoir des quartiers dans lesquels ils sont prêts à payer plus que les riches pour vivre. Pour comprendre le mécanisme, imaginez une vente aux enchères. Partant d'un prix très bas, un propriétaire foncier aura une demande plus élevée que la surface qu'il possède, émanant de riches autant que de pauvres. Il peut donc augmenter son prix. Le seuil à partir duquel les riches abandonneront l'enchère au centre intervient assez rapidement, grâce à la possibilité de s'installer en périphérie. Ce sont donc les pauvres qui remporteront l'enchère. Cela ne veut pas dire que les riches ne peuvent pas s'aligner, bien entendu, mais simplement qu'ils ne souhaitent pas le faire. En d'autres termes, au centre, les pauvres sont plus captifs que les riches. Cette histoire est celle de Detroit, les pauvres au centre, les riches à l'extérieur.

Quid de Paris ? La différence entre les deux agglomérations, pour les auteurs, est question d'aménités. Non que Detroit en soit dépourvue. Mais la question est la manière dont les aménités évoluent à mesure que l'on s'éloigne du centre-ville. C'est là que réside la clé de leur modèle. Selon eux, les aménités déclinent rapidement dans le cas de Paris (très fortes au centre, puis rapidement beaucoup plus faibles), alors qu'elles déclinent moins vite dans le cas de Detroit (un centre moins intéressant, et une périphérie assez bien dotée en aménités). Or la vitesse à laquelle déclinent les aménités lorsqu'on s'éloigne du centre peut inverser la logique du modèle. En effet, les riches sont plus enclins que les pauvres à accepter un sur-coût de leur logement pour bénéficier d'aménités importantes. En tenant compte de ces aménités, il est possible que, finalement, leur consentement à payer diminue plus rapidement que celui des pauvres avec la distance au centre. Dans ce cas, ce sont eux qui sont les plus captifs au centre, et qui sont donc disposés à payer les loyers les plus chers, reléguant les pauvres en périphérie.

Ce qu'il faut comprendre dans ce modèle, c'est qu'un rééquilibrage même modeste des aménités entre centre et périphérie peut conduire à un basculement radical de l'occupation de l'espace entre les catégories sociales.

Revenons à Bézier, Dreux et Montélimar. Si l'on devait interpréter le déclin de leurs centres-villes à l'aune de ce modèle, on le ferait de la manière suivante : l'apparition de centres commerciaux en périphérie revient à atténuer le différentiel d'aménités entre centre et périphérie. Ainsi, l'effet-Paris (qui pousse les riches au centre) perd de l'importance, l'effet-Detroit (qui pousse les pauvres au centre) en gagne. Autrement dit, l'amélioration des aménités en périphérie rend théoriquement envisageable un scenario à la Detroit, avec un centre totalement délabré, rongé par la misère et la criminalité. Les fermetures en série de commerces au centre donne du crédit à cette histoire.


Les commentaires sur le déclin des centres-villes s'accompagnent souvent de critiques acerbes sur les municipalités qui autorisent l'ouverture de grands centre commerciaux en périphérie (y compris dans le rapport cité plus haut). Ces critiques sont parfaitement déplacées. Soyons clairs : je déteste les centres commerciaux. De l'extérieur, ils sont moches. A l'intérieur, ils recréent de petites villes très artificielles, hors-sol, quasiment identiques d'un pays à l'autre. Mais ne nous y trompons pas : tout le monde les déteste. Croyez-vous vraiment que les centaines de gens qui se bousculent au rayon des plats surgelés avant de faire la queue à la caisse n°25 aient le sentiment de passer un moment magique dans un temple de l'architecture et du bon goût ? Ils sont simplement prêts à sacrifier une heure ou deux de leur temps pour optimiser cette tâche extrêmement ingrate qui consiste à se réapprovisionner en vivres. C'est pratique (on peut se garer), c'est plutôt bon marché, et une fois la corvée terminée, ils passent à autre chose : rando en montagne, flânerie dans les rues du centre ancien, musée, ciné... Le fait que les masses s'entassent dans les centres commerciaux est, en soi, la preuve qu'ils constituent une aménité valorisable, quelle que soit l'impression de vulgarité qu'ils inspirent. Et lorsqu'une ville autorise la construction d'un centre commercial en périphérie, elle permet d'accroître le niveau d'aménités disponibles pour les habitants de cette périphérie. Qui, à priori, sont plus modestes que les habitants des centres anciens.

Reprenons le modèle de Thisse Brueckner et Zenou. Quelle conséquence doit-on attendre d'un accroissement des aménités en périphérie ? Deux possibilités : soit cet accroissement est trop modeste pour inverser la répartition spatiale entre riches et pauvres. Dans ce cas, ces aménités supplémentaires accroissent le bien-être des pauvres vivant en périphérie. Vouloir interdire cela au nom de la défense des centres-villes revient tout simplement à mettre la loi au service des rentes des riches propriétaires des centres-villes, au détriment du bien-être des pauvres des périphéries. Soit, seconde possibilité, l'accroissement des aménités en périphérie est telle qu'elle provoque un basculement : les riches vont envahir la périphérie, et laisser la place au centre aux plus pauvres. Qu'y a-t-il de choquant dans cette hypothèse ? Les pauvres sont-ils tellement repoussants qu'ils seraient indignes de vivre au milieu de ces reliques médiévales qui font l'âme de nos vieilles villes ? Craint-on que si ces quartiers deviennent populaires ils soient laissés à l'abandon par les municipalités au détriment du patrimoine historique ? Pourquoi ? Laissent-elles généralement à l'abandon les quartiers populaires ? Est-ce moins grave lorsqu'ils sont situés en périphérie ? Il n'y a pas que l'urbanisme qui différencie l'Europe et les USA, il y a aussi les systèmes sociaux. Ce qui est choquant dans les ghettos de Detroit, ce n'est pas tant qu'ils soient situés au centre, c'est qu'ils existent ! Il y a, en France, des quartiers difficiles, mais le phénomène est sans doute d'ampleur moindre qu'aux USA. Et lorsqu'ils existent, il est scandaleux de laisser s'y installer violence et délabrement : le fait qu'ils soient généralement périphériques rend le scandale moins visible, mais pas moins réel.

Je suis prêt à accepter l'idée que le scenario 'Detroit' soit angoissant, et conduise à demander aux autorités d'interdire la création de centres commerciaux pour l'éviter, mais encore faut-il formuler cette demande de façon complète, pour révéler le mépris de classe qu'elle comporte : "communes, n'autorisez pas la construction de centres commerciaux en périphérie, car ils amélioreraient la qualité de vie dans ces quartiers aujourd'hui pauvres, au risque de donner aux riches l'envie de quitter le centre-ville, et donc de transformer celui-ci en quartier populaire, donc forcément sale et délabré, car vous ne l’entretiendrez alors plus". Libre à chacun de penser ça, mais il est toujours préférable de rentrer dans le détail plutôt que de se contenter d'un très hypocrite : "Communes, n'autorisez pas la construction de centres commerciaux en périphérie qui font disparaître le petit commerce qui fait tout le charme de nos centres historiques".

Au-delà de ce qu'on peut penser de ces tensions entre grandes surfaces et petit commerce, entre peur des pauvres et de la gentrification, faire reposer le diagnostic sur la répartition et la taille des commerces passe probablement à côté de l'essentiel dans cette affaire. Car le déclin des centres des villes moyennes est peut être moins une question d'économie urbaine qu'une question d'économie géographique. Cette distinction est un peu jargonneuse, j'en conviens. De façon schématique, l'économie urbaine s'intéresse à l'occupation de l'espace dans une ville donnée : étalement urbain, rente foncière, congestion des réseaux de transports (etc) sont au cœur de ses préoccupations. L'économie géographique (en fait surtout ladite 'nouvelle' économie géographique, inventée par Paul Krugman en 1991) s'intéresse moins à l'espace. Son sujet est l'interaction entre les régions, avec la notion de concentration comme problématique centrale. Son but est d'identifier les conditions d'émergence d'effets boule-de-neige, qui font que les régions ayant la plus grande concentration en population ou en entreprises industrielles tendent à voir cette concentration se renforcer au détriment des autres. Or il n'est pas exclu que, indépendamment des ouvertures de grandes surfaces, ce soit essentiellement un phénomène de concentration géographique d'une certaine classe aisée au niveau national qui soit à l’œuvre dans le déclin de certains centres-villes.

Regardez la carte suivante, extraite du rapport, qui fait apparaître en rose-rouge les villes concernées par le déclin commercial (taux de vacance commerciale >7.5%) et en bleu celles qui échappent au phénomène (taux <7,5%)



Il est assez flagrant que les villes qui échappent au phénomène de déclin sont des villes dans lesquelles sont présentes des activités offrant des emplois très qualifiés, et potentiellement très concentrées : aéronautique à Toulouse, Chimie à Lyon, institutions européennes à Strasbourg... La liste n'est pas exhaustive, mais, à l'exception notable de Marseille, les villes relativement centrales ne sont pas concernées par le phénomène. En revanche, cherchez les points rouge-vif (vacance >15%), ils correspondent généralement à des villes de taille assez modeste, et situées soit dans d'anciens bassins industriels sinistrés (nord et est) soit au milieu de nulle part (les lecteurs de ce blog originaires d'Aubenas, Marmande ou Châtellerault me pardonneront cette caricature).

Ce constat accrédite l'idée qu'une certaine forme au moins de concentration géographique des richesses est à l’œuvre en France. La deuxième globalisation consiste en une internationalisation des chaînes de valeur. Cette internationalisation requiert de la coordination, donc de la proximité, donc de la concentration urbaine. Les travailleurs les plus qualifiés ont donc intérêt à quitter les petites villes pour travailler dans ces chaînes de valeur globalisées. Lorsque les riches quittent les petites villes, ils laissent la place aux moins riches, que ce soit au centre-ville ou en périphérie. C'est triste. Ça crée de la polarisation. Ça crée du vote extrême. Ça fragmente les peuples. Ça donne tout son poids à la question politique des inégalités et du sort réservé aux plus démunis ou aux catégories déclinantes. Cette question n'est pas simple, mais l'idée d'interdire aux pauvres d'aller faire leurs courses à Lidl fait bien plus partie du problème que de la solution.



mercredi 22 mars 2017

Cédric Villani est-il un nazi ? (des effets de composition et de leur bon usage)

Quatre entreprises différentes payent à leur salariés des salaires annuels moyens de 30'000€, 25'000€, 30'000€ et 29'000€. Avant d'en inférer que les entreprises 1 et 3 sont les plus généreuses, suivies de près par la 4, et que la 2 s'avère la plus pingre, regardez d'abord ce tableau, qui décompose le salaire moyen en salaire des exécutants et salaire des cadres :

Vous le voyez, les choses ne sont pas si simples ! L'entreprise 2 n'est pas moins généreuse que la 1, puisque ses exécutants d'un côté, et ses cadres de l'autre, sont payés exactement comme ceux de l'entreprise 1. Simplement, elle compte moins de cadres, et plus d'exécutants. La différence dans le salaire moyen est ce qu'on appelle un effet de composition. Si l'on compare l'entreprise 1 à la 4, l'effet composition est encore plus marqué, car l'entreprise 4 donne des salaires plus élevés que la 1 tant à ses exécutants qu'à ses cadres. Simplement, elle a beaucoup moins de cadres, si bien que son salaire moyen apparait plus faible. Enfin, comparer les entreprises 1 et 3 pourrait laisser penser que leur politique salariale est identique, puisque leurs salaires moyens sont identiques. Il n'en est rien : l'entreprise 3 est la plus généreuse à type d'emploi donné, mais l'effet de composition fait qu'elle semble payer les mêmes salaires que la 1.

On le voit à travers cet exemple, négliger les effets de composition peut conduire à de mauvaises interprétations des données. Néanmoins, la mise en avant d'effets de composition comme argument dans un débat devrait toujours s'accompagner de précisions sur la théorie qu'elle entend soit confirmer, soit réfuter, afin que l'interprétation de ces effets soit claire. Ce n'est pas toujours le cas. Pour poursuivre l'exemple, il est certain que si le propos est de déterminer quelle entreprise payera le plus de cotisations sociales par travailleur, alors l'effet de composition perd toute pertinence, et ce sont bel et bien les entreprises 1 et 3 qui seront les meilleures sur ce plan. Ou encore, si une politique éducative ambitieuse au niveau d'un pays permettait d'accroitre la part des cadres dans le travail salarié, alors avoir une structure de l'emploi ressemblant à celle de l'entreprise 1 serait plus satisfaisant qu'une structure calquée sur celle de l'entreprise 2, effet de composition ou pas.

Venons-en à la question, volontairement grossière et provocatrice je l'admets, qui donne son titre à ce post. Cédric Villani, soutien d’Emmanuel Macron, candidat plutôt cosmopolite à cette élection présidentielle, a suscité une polémique en liant les difficultés du système scolaire français à l'immigration.

https://www.youtube.com/watch?v=xdyaQqDpiwQ

J'ai eu un bref échange sur twitter avec le sociologue Denis Colombi, qui a réagit du tac-au-tac en dénonçant l'ignorance de Villani. Il a par la suite développé son argument dans un long article, dont je recommande la lecture sans réserve. Je la recommande parce qu'elle vous apprendra, comme elle me l'a apprise à moi-même, une chose qui mérite d'être connue : à origine sociale égale, les enfants d'immigrés n'obtiennent pas des résultats scolaires moins bons que les autres élèves. Leur résultats moins bons dans l'ensemble ne sont donc qu'un effet de composition, lié au fait qu'ils sont plus susceptibles d'être socialement défavorisés à l'entrée du système scolaire. La conclusion qu'en tire Denis Colombi est que l'analyse de Villani est erronée. Je ne sais pas si l'analyse de Villani est erronée, mais je sais que l'effet de composition dont il est question ici est tout à fait insuffisant pour aboutir à cette conclusion. Le propos de Villani ne dit ni ne sous-entend nullement que les difficultés scolaires des enfants d'immigrés correspondent à un facteur spécifiquement lié à l'immigration, une sorte de tare qui ne pourrait s'expliquer par des variables socio-économiques objectives. Son propos, tel que je l'entends en tout cas, transpose au niveau de la comparaison entre pays le débat 'proficiency vs growth' qui est central dans le monde de l'éducation, et qui consiste à savoir s'il faut évaluer les performances des élèves par le niveau qu'ils atteignent ou par les progrès qu'ils accomplissent. Les enquêtes PISA soulignent les mauvaises performances de la France en matière d'égalité au plan éducatif. C'est d'ailleurs précisément sur cette question là que Villani est interrogé (« L’école française […] est une des plus inégalitaires qui soit malgré les moyens qui sont alloués […] qu’est-ce qui ne fonctionne pas ? […] Par rapport aux systèmes étrangers qu’est-ce qui vous frappe ? »). Or, comparer les inégalités à la sortie du système scolaire peut être trompeur si l'on ne tient pas compte des inégalités à l'entrée du système scolaire. Villani apparaît ici comme un défenseur du système français, expliquant qu'étant données les inégalités sociales ou culturelles auxquelles le système est confronté, il ne s'en sort pas si mal. Mais, pourrait-on lui objecter, le système n'est-il pas lui-même responsable des inégalités en amont, autrement dit de l'inégalité qui existe entre les parents des élèves aujourd'hui scolarisés ? Pas si l'on tient compte du fait qu'au moins une partie d'entre eux n'étaient pas scolarisés en France lorsqu'ils étaient enfants. Le modèle est donc le suivant : l'immigration contribue aux inégalités éducatives en amont, car les enfants d'immigrés ont des situations familiales en moyennes moins favorables que les autres enfants. Les résultats du système français sont assez bons étant donnée cette inégalité en amont.

Ce modèle est-il pertinent ? Je ne sais pas. Mais je sais de quelles données nous aurions besoin pour le déterminer : part des enfants d'immigrés dans les populations ayant les situations sociales les moins favorables à la réussite scolaire, mesure pays par pays de ces inégalités en amont, mesure pays par pays de la réduction ou de l'accroissement de ces inégalités à la sortie du système éducatif, et enfin vérification du positionnement de la France du point de vue de cet accroissement. En revanche, l'effet de composition mis en lumière par Denis Colombi ne permet pas de se prononcer sur la validité de ce modèle.

Je suis bien conscient de ce qu'il y a de délicat à parler d'immigration. Il est bien possible que des enfants d'immigrés ayant entendu l'interview de Villani se soient sentis stigmatisés par ses propos. Je mesure par ailleurs l'écart qu'il y a entre le sentiment diffus qui existe dans une grande partie de la population que l'immigration constitue une difficulté économique, et ce que disent les études sur le sujet, qui mettent en avant l'importance des effets positifs et le caractère marginal des effets négatifs.

La seule attitude saine, à cet égard, est d'accepter que toutes les questions soient posées, et que les réponses soient cherchées avec minutie en confrontant des modèles exprimés clairement aux données pertinentes. Pas d'évacuer ces questions. n'oublions pas que si l'on peut affirmer que les enfants d'immigrés s'en sortent aussi bien que les autres, en France, à origine sociale donnée, c'est bien parce que des chercheurs ont pris l'initiative de se poser la question et de mener l'enquête qu'il fallait pour y répondre.

mardi 24 janvier 2017

Quelques idées rapides sur le revenu universel

L'idée d'un revenu universel, versé à chaque citoyen sans aucune condition, fait beaucoup parler depuis quelques semaines. J'aimerais y consacrer un article long, mais faute de temps, voici quelques random thoughts sur le sujet.

Sur les motivations :

Pourquoi donner un revenu de base à tout le monde alors que seuls ceux qui sont dans le besoin en ont... besoin ?

2 éléments de réponse à cette question : (la liste n'est pas exhaustive)

- Les aides sociales conditionnées imposent des contrôles sur les vies des bénéficiaires, ce qui est à la fois intrusif et couteux. Dans le cas d'un revenu universel, on n'a pas à embaucher des fonctionnaires pour étudier et contrôler tous les cas individuels, puisque tout le monde a droit au revenu.

- Les aides sociales conditionnées ont des effets-seuil qui peuvent générer des trappes à pauvreté : une mère de famille isolée et sans emploi ne gagne pas grand chose à travailler si l'on soustrait de son salaire la perte de certaines aides. Dans le cas d'un revenu universel, pas de problème de ce type.

Sur l'impact sur l'incitation à travailler :


C'est une question extrêmement difficile. Deux facteurs sont souvent mis en avant pour expliquer les comportement en matière d'offre de travail (comprenez, en matière de temps de travail souhaité par les travailleurs) :

Le premier est le niveau de richesse ou de revenu, considéré comme défavorable à l'offre de travail : une personne très pauvre souhaite travailler beaucoup pour améliorer ses conditions de vie, tandis qu'une personne aisée est plus sensible à ses loisirs et au temps qu'elle consacre à sa vie de famille.

Le second est le coût d'opportunité du loisir, c'est-à-dire le manque à gagner associé à nos heures de loisir, pendant lesquelles nous ne sommes pas rémunérés. Ce coût d'opportunité est, lui, considéré comme favorable à l'offre de travail : plus mon salaire horaire est élevé, plus je suis réticent à renoncer à une heure de salaire pour me détendre.

Comment ces deux facteurs interviennent-ils dans le cas du revenu universel ?

Garantir à chacun un revenu permanent accroît la richesse des bénéficiaires, dès lors qu'ils sont gagnants nets au dispositif (c'est à dire dès lors que l'augmentation de leurs impôts pour financer le dispositif n'excède pas le revenu universel). Ici, l'effet richesse joue donc en défaveur de l'offre de travail. C'est l'idée de l'oisiveté que pourrait susciter un revenu universel : pourquoi travailler à temps plein, si un salaire à mi-temps cumulé au revenu universel me permet de subvenir à mes besoins ?

Pour ce qui concerne l'effet 'coût d'opportunité', la situation est ambigüe. Pour les personnes qui se situent à proximité des trappes à pauvreté, le revenu permanent accroît le coût d'opportunité du temps libre, car il fait disparaître les effets-seuil. Dès lors que je ne perds plus le bénéfice de mes aides en acceptant un travail, alors ce travail va me rapporter réellement de l'argent, et c'est donc un vrai manque à gagner de ne pas l'accepter. Donc je l’accepte. En revanche, le dispositif devant être financé par des hausses d'impôts, le salaire horaire net d'impôts des travailleurs qui se situent au-delà des trappes à pauvreté serait diminué par un tel dispositif, les incitant à travailler moins.

L'un dans l'autre, l'impact sur l'offre de travail dépend probablement des catégories concernées. Plus précisément, les personnes les plus précaires travailleraient vraisemblablement plus (pas assez riches pour renoncer à un revenu du travail + disparition des effets-seuil). Les personnes gagnant un revenu plus élevé travailleraient probablement moins (le revenu permanent leur paiera les vacances à la place des heures sup, lesquelles seront rendues moins intéressantes par une fiscalité plus élevée).

Remarque : le fait que cela augmente ou diminue l'offre de travail n'est pas en soi un critère décisif. Après tout, les gens sont libres d'utiliser leur temps comme ils le souhaitent. Mais cela a des répercussions évidentes sur le coût du dispositif.

Sur le positionnement idéologique :

Le revenu universel est une idée qui plait à une partie de la gauche, mais également à une partie des libéraux (y compris au sens étroitement économique du terme). La vision de gauche y voit une possibilité d'exister en dehors du marché. Les libéraux y voient la façon la moins interventionniste d'éviter que le jeu du marché ne crée des situations de grande pauvreté. Ces deux visions ne sont pas totalement incompatibles, mais elles peuvent se traduire par des projets assez différents. Typiquement, la vision libérale du revenu universel en fait un substitut de tous les autres dispositifs de lutte contre la pauvreté, et s'accompagnera donc volontiers d'une suppression de la sécurité sociale (votre revenu universel vous permet de souscrire une mutuelle), du salaire minimum (le revenu universel vous garantit que vous ne serez pas pauvre, la suppression du SMIC aidera les travailleurs les moins qualifiés à trouver du travail), des allocations chômages... Évidemment, ça change un peu le coût du dispositif.

Sur le lien avec un 'impôt négatif' :

C'est la même chose ! Voici comment pourrait marcher un revenu universel. Imaginez un monde dans lequel l'administration fiscale vous prélèverait, tout les mois, votre impôt sur les revenus du mois courant. Vous avez un compte auprès de cette administration fiscale, qui vous prélève, tous les mois, une somme égale à votre impôt moins la valeur du revenu universel. Si le résultat de la soustraction est négatif, c'est le fisc qui vous donne de l'argent. Si vous n'avez rien gagné du tout, il vous donne tout simplement le revenu universel. Imaginons un exemple chiffré :

revenu universel : 700€/mois
Niveau de revenu à partir duquel les impôts sont supérieurs au revenu universel : 2100€ (le triple)
Taux marginal d'imposition entre 0 et 2100€ : 1/3 (33,33%)

Vous voyez dans cet exemple une conséquence à mon avis inévitable du dispositif : l'accroissement du taux marginal d'imposition pour les bas salaires. Comme dit plus haut, ça s'accompagne néanmoins d'une disparition des effets-seuil, qu'on peut assimiler logiquement à un taux marginal de près de 100%.

Cas 1 : Pierre n'a rien gagné en janvier 2017. Le fisc lui prend donc (1/3)*0-700=-700€. Autrement dit, Pierre reçoit 700€.

Cas 2 : En février, il accepte un travail au SMIC à mi-temps payé (j'arrondis) 540€. Le fisc lui prend (1/3)*540-700=-520€. Il reçoit donc 520€ qui s'ajoutent à son salaire, soit 1060€ en tout.

Cas 3 : En mars, il accepte de passer à temps plein pour 1080€. Le fisc lui prend (1/3)*1080-700=-340€. Il reçoit donc 340€ qui s'ajoutent à son salaire, soit 1420€ en tout. On voit bien dans cet exemple qu'un SMICARD est à la fois gagnant au dispositif (effet-richesse), mais que son revenu ne s’accroît que modestement quand il passe de mi-temps à temps-plein.

Cas 4 : En avril, on lui propose une promotion, il va gagner 2100€. Le fisc lui prend donc (1/3)*2100-700=0€. Son revenu universel est compensé par son impôt.

Cas 5 : Encore une augmentation en Mai ! Il gagne maintenant 3000€. Le fisc lui prend (1/3)*3000-700=300€. Ça y est, il paie des impôts ! Son revenu net d'impôts est de 2700€

Sur la faisabilité :

Voilà la vraie question ! Pour être sincère, bien qu'attiré par le principe du revenu universel, je crains que sa mise en œuvre dans un pays comme la France, avec un système social extrêmement développé, des attentes assez fortes d'une attitude paternaliste de l'Etat, et une fiscalité assez élevée, concevoir un projet acceptable ne relève de la quadrature du cercle. J'espère pouvoir, dans un futur proche, écrire sur ce blog des choses un peu plus précises, mais commençons par les ordres de grandeurs. Pour que le public accepte le remplacement de diverses allocations par ce revenu universel, celui-ci ne doit pas être trop faible. Le chiffre de 700€/mois de l'exemple ci-dessus semble être un minimum. Or, verser 700€ par mois à 50 millions d'adultes (j'arrondis) représente 420 milliards d'euros. Environ un cinquième du PIB. Dans l'exemple, je propose un accroissement à 1/3 du taux marginal d'imposition sur les revenus les plus bas. Ce taux remplacerait des taux actuellement fixés à 0% pour les premières tranches et 14% pour les deuxièmes. En raisonnant à distribution constante des revenus, on peut s'attendre à ce que cette hausse du taux marginal rapporte environ une centaine de milliards d'euros. On peut attendre également un gain en accroissant les taux des tranches d'imposition plus élevées. Mais ces taux sont déjà assez importants, je doute qu'on puisse tabler sur plus de 20 milliards d'euros.

Il resterait donc 300 milliards à financer. Ces 300 milliards correspondraient à des baisses de prestations sociales ayant vocation à être remplacées par le revenu universel. Bien entendu, on s'empressera de supprimer le RSA et les APL. Mais on n'économisera là guère plus de 30 mds. Restent 270 mds. Cette somme peut être réduite, mais il va falloir commencer à s'orienter vers l'interprétation libérale du dispositif. Par exemple, en touchant aux retraites. Le propos n'est pas ici de remplacer les retraites par le revenu universel, mais de le déduire des montants des retraites. Par exemple, Jacques, retraité de 70 ans, perçoit une pension de 1800€. Il bénéficie d'un revenu universel de 700€, mais sa pension tombe à 1100€. Une autre façon de dire la même chose est de dire que les retraités ne sont pas bénéficiaires du dispositif. Une économie d'environ 100 mds. On peut imaginer un système similaire en matière d'allocations chômages. Celles-ci seraient calculées selon le mode de calcul actuel, moins la valeur du revenu universel, ou égales au revenu universel si le mode de calcul actuel conduit à une allocation qui lui est inférieure (peut-être 20mds d'économies). On peut également imaginer une suppression des allègements de charges sociales pour les bas salaires (environ 35mds), à condition de compenser cela par une diminution du SMIC, pour éviter des effets pervers sur l'emploi (le revenu universel ferait plus que compenser cette baisse, en termes de revenu mensuel). Il reste encore une grosse centaine de milliards à trouver ! Il va falloir commencer à taper sur des choses de plus en plus sensibles. Par exemple, on peut envisager de diminuer considérablement le remboursement des dépenses de santé, en créant une sorte de mutuelle publique qui permettrait à toute personne le désirant de conserver le niveau de remboursement actuel... moyennant une cotisation plus importante. Mais difficile d'imaginer que ça permette de récupérer 100mds.

Je ne suis, hélas, pas en mesure, à ce jour, de chiffrer précisément toutes ces options. On reste sur une estimation au doigt mouillé, j'encourage les lecteurs de ce blog à m'aider à être plus précis. Mais j'ai le sentiment que pour parvenir à couvrir ces 420mds, il faut en passer par des mesures assez drastiques, qui seraient vraisemblablement vécues comme des purges par une grande partie de l'opinion, et ne seraient donc pas une option crédible politiquement. There Ain't No Such Thing As A Free Lunch! J'ai mentionné plus haut la difficulté de savoir si un revenu universel conduirait à plus ou moins de travail. Dans la première hypothèse, le coût de la mesure serait amoindri, mais il serait évidemment alourdi dans la seconde.

Alors... pour ou contre ?

Philosophiquement, je suis très séduit par le principe du revenu universel. C'est une façon efficace de lutter contre la pauvreté, sans s’immiscer dans la vie des pauvres, sans créer de trappes à pauvreté. C'est une mesure particulièrement attirante dans une époque qui, dans les pays développés, est particulièrement anxiogène pour les travailleurs faiblement qualifiés. Peut-être un dirigeant politique habile parviendra-t-il, à terme, à faire accepter par l'opinion publique une mesure de ce genre, ainsi que les coûts qui vont avec. Ce qui m'empêche de croire que le revenu universel verra le jour dans un futur proche, c'est l'Histoire. Si le conseil national de la résistance avait cru dans les vertus d'un revenu universel, il aurait peut-être pu le mettre en place dans un pays qui, jusque-là, avait assez peu de dispositifs sociaux. Partant d'une situation dans lequel le poids de l'Etat dans l'économie est assez faible, on peut imaginer créer un revenu universel initialement assez faible, puis le faire croître progressivement, en même temps que la fiscalité qui l'accompagne. Mais dans un pays qui dispose déjà d'une batterie de dispositifs ciblés, représentant environ un quart du PIB, instaurer un revenu universel vous condamne soit à porter la fiscalité à des niveaux intolérables, soit à détruire des dispositifs auxquels les gens sont attachés. 

A défaut d'une DeLorean, seuls 10 ans de thatchérisme radical ramèneraient le pays dans une forme de virginité sociale qui rendrait politiquement envisageable un revenu universel. Je ne suis pas sûr que le jeu en vaille la chandelle.

dimanche 1 janvier 2017

The Great Convergence

Si le dernier billet de ce blog vous a donné envie de lire la compétitivité des pays de Flora Bellone et Raphaël Chiappini, et si vous avez envie d'en savoir encore davantage sur les spécificités de la mondialisation actuelle, alors vous devriez commencer l'année en lisant The Great Convergence: Information Technology and the New Globalization de Richard Baldwin.

Pour ceux qui connaissent les travaux académiques de Baldwin, le contenu de ce livre ne constituera pas une surprise, mais cette synthèse vient combler un vide dans la littérature sur la mondialisation à destination du grand public. La thèse de Baldwin peut se résumer de la façon suivante : l'organisation spatiale de l'activité économique dépend du coût avec lequel on peut déplacer 1- les produits, 2- les idées et 3- les hommes. Avant la première mondialisation du 19ème siècle, les trois types de déplacements étaient coûteux. Les activités industrielles (par ailleurs balbutiantes à l'époque) devaient avoir lieu à proximité des consommateurs. Or, la plupart des consommateurs étant des paysans relativement dispersés géographiquement (loi des rendements décroissants de la terre oblige), l'industrie était elle-même faiblement concentrée. Les pays n'étaient pas très spécialisés, car la production devait fournir toute la diversité des biens demandés par les consommateurs locaux.

La première mondialisation consiste essentiellement en une baisse des coûts de transport des biens (chemins de fer, bateaux à vapeur...). Être éloigné du consommateur n'est plus réellement une contrainte. Les pays commencent alors à se spécialiser, selon la logique des avantages comparatifs. De plus, au plan géographique, des centres industriels apparaissent, permettant aux fabricants de produits finis de se rapprocher de leurs fournisseurs. Les produits finis s'échangent d'un pays à l'autre, mais la chaîne de la valeur demeure nationale. Si un pays produit des voitures, tous les agents économiques du pays ont un intérêt commun dans la voiture : l'ouvrier qui la fabrique, l'ingénieur qui la conçoit, le responsable marketing qui fixe son prix, le mineur qui extrait sa matière première...

La seconde mondialisation, commencée dans les années 1990, se caractérise par une baisse du coût de déplacement des idées, c'est à dire du coût de communication. Cette évolution tend à dé-nationaliser les avantages comparatifs. Dorénavant, la spécialisation des pays ne se fonde pas sur des produits finis, mais sur des étapes de production de ces produits. L'ouvrier et l'ingénieur de l'industrie automobile ne sont plus dans le même bateau. L'ingénieur continue à concevoir des modèles qui seront fabriqués par des ouvriers à bas salaires des pays du sud. Les moyens de communication actuels permettent des transferts de technologie impossibles il y a encore 50 ans. La mondialisation actuelle est le fruit de l'alliance entre la haute technologie du nord et les bas salaires du sud.

Mais une partie importante de la technologie est constituée de connaissances tacites, difficilement codifiables, qui requièrent une proximité physique, des face-à-faces, entre différents intervenants d'une même chaîne de valeur. Ainsi, bien que cette nouvelle mondialisation prenne la forme d'un rééquilibrage de l'activité économique entre le nord et le sud, elle demeure un phénomène extrêmement concentré : au nord, parce que les activités de R&D nécessitent des contacts entre un grand nombre de personnes qualifiées (silicon valley, Villes Allemandes...), au sud parce qu'il serait trop coûteux de coordonner des unités de production trop dispersées. Les managers du nord devant faire des aller-retours fréquents dans leurs usines du sud, il est préférable que celles-ci soient concentrées dans un faible nombre de pays à bas salaires. Ce ne sont donc pas tous les pays du sud qui s'industrialisent. Baldwin appelle les 'I6' (qu'il oppose aux pays du 'G7') 6 principaux bénéficiaires de ce phénomène : Chine, Inde, Thaïlande, Corée du Sud, Pologne et Indonésie. Cela ne signifie pas que d'autres pays du sud n'en bénéficient pas également, mais de façon indirecte, via la hausse du prix des matières premières provoquée par la croissance mondiale.

Cette façon de concevoir la mondialisation actuelle a des implications politiques. Par exemple, la question "Que devraient faire les États du nord pour soutenir leur économie ?" trouve des réponses spécifiques à ce contexte. Prenons l'exemple des aides à la R&D. Le souvenir des 30 glorieuses nous conditionne à penser que des entreprises innovantes auront tendance à embaucher davantage d'ouvriers, et à offrir de meilleurs salaires. Dans la logique de la deuxième mondialisation, les résultats de la R&D ne sont pas localisés dans le pays qui les a vus naître, mais dans la multinationale qui les a produits. Le pays dans son ensemble a beaucoup à gagner à avoir des entreprises à la pointe de la technologie, mais les ouvriers qui en tireront profit sont plus vraisemblablement localisés dans un pays à bas salaire.

Les politiques industrielles ont vocation à encourager les activités génératrices d'externalités pour l'ensemble de l'économie, et la R&D est souvent présentée comme une activité ayant cette caractéristique. Baldwin propose d'ajouter une deuxième variable pour guider les politiques à l'ère de la seconde globalisation : le caractère 'collant' (stickiness) des activités encouragées. Certaines activités ont plus ou moins de facilité à fuir le pays. Baldwin compare 3 activités génératrices d'externalités : la R&D, le travail hautement qualifié, et ce qu'il appelle le 'capital social', c'est-à-dire cette chose difficilement mesurable, qui fait que les individus se rencontrent volontiers, échangent, se font confiance. Les politiques visant à encourager ces activités doivent être conscientes qu'elles sont plus ou moins mobiles internationalement. La R&D est celle qui l'est le plus, le capital social celle qui l'est le moins, le travail qualifié est entre les deux.

Les politiques de la ville constituent un autre aspect à ne pas négliger pour Baldwin. C'est un point de vue qui ne convaincra probablement pas Olivier Bouba-Olga, mais qui mérite d'être entendu. La globalisation étant ce qu'elle est, les pays du nord doivent faire en sorte de draguer les managers, programmeurs, ingénieurs qui capitalisent les gains associés. Et la ville est un instrument 'collant' par nature (on ne peut pas bénéficier de la qualité de vie proposée par une ville si l'on n'y vit pas), et qui peut être déterminant pour accueillir ces têtes pensantes de la mondialisation. Ne nous trompons pas, il ne s'agit pas simplement d'encourager toutes les villes à être accueillantes, mais bien d'encourager les États à favoriser leurs villes qui sont déjà les plus grosse et les plus attractives. 

La lecture de The Great Convergence constitue un complément fort utile aux travaux de Piketty sur les inégalités. En effet, alors que Piketty met l'accent sur la fiscalité, jugée insuffisamment forte pour les hauts revenus, comme facteur de croissance de la part du top 1%, Baldwin insiste sur des causes probablement plus profondes. Soyons clairs, les deux explications ne sont pas incompatibles. Mais les données mises en avant par Piketty montrent que les inégalités (par le haut) s'accroissent pour les revenus avant impôt. A cet égard, le rôle de la fiscalité ne peut être qu'indirect (en empêchant l'accumulation des patrimoines à long terme essentiellement). L'alliance entre la technologie du nord et les travailleurs du sud qui est au cœur de la seconde globalisation constitue une explication plus fondamentale.

Concernant les pays du sud, cette fois, le modèle proposé par Baldwin rend caduques, dans le cadre de la deuxième globalisation, les politiques dites de 'big push'. Ces politiques, inspirées par le cas coréen, considéraient que l'industrialisation d'un pays se heurtait à un obstacle à ses débuts : en l'absence d'un savoir-faire industriel et d'un réseau de clients et fournisseurs bien établis, une industrie naissante ne pouvait souffrir la concurrence internationale des industries déjà développées, condamnant un pays pauvre à le rester. L'industrialisation devait donc être vue en grand, avec un État stratège à la direction d'orchestre. Dans le cas très emblématique de l'automobile, une industrie naissante devait commencer par acheter des pièces détachées à l'étranger pour les assembler localement, puis apprendre, progressivement, à fabriquer ces pièces détachées elle-même pour devenir une industrie mure. Dans la globalisation actuelle, ce schéma est obsolète. Les chaînes de valeur sont de toutes façon globales, et un pays pauvre peut tenter de s'insérer directement dans ces chaînes de valeurs, en convainquant les sièges sociaux des grandes firmes qu'elles peuvent venir fabriquer leurs pots d'échappement dans ses usines. La technologie sera apportée par les ingénieurs des multinationales, la main d’œuvre bon marché, la stabilité politique et le bon état des routes seront garantis par l'Etat en question.

De la même manière qu'il complète les travaux de Piketty pour comprendre la situation dans les pays riches, le livre me semble également un complément utile aux thèses d'Acemoglu et Robinson sur la question du développement. Rappelons que, pour Acemoglu et Robinson, le développement se produit dans les pays qui, généralement par hasard, ont vu émerger des institutions dites inclusives (Etat de droit, démocratie, liberté d'entreprendre, marchés ouverts...), qui les ont poussés dans un cercle vertueux rendant possible l'innovation et la destruction créatrice. Bien que très stimulante, cette thèse fait l'impasse sur la dimension internationale du développement. Comme nous l'avons dit plus haut, la tendance à la convergence qui caractérise la mondialisation actuelle demeure un phénomène extrêmement concentré. Il est certain que tous les pays d’Amérique latine gagneraient à avoir des institutions inclusives. Mais, à qualité institutionnelle donnée, il est aussi certain que les multinationales américaines préfèreront toujours créer des usines au Mexique qu'en Argentine, car les aller-retours fréquents du laboratoire de R&D jusqu'à l'usine sont moins coûteux (en temps d'ingénieur) si l'usine est installée au Mexique qu'en Argentine.

Notons que, pour les politiques industrielles ou de compétitivité comme pour les politiques de développement, The Great Convergence met le doigt sur ce qui change, dans la mondialisation actuelle, tout en restant très général sur le type de politiques à conduire. Une bonne politique de la ville, créer du capital social, s'insérer dans les chaînes de valeurs globales etc. sont de bons principes, mais comment les mettre en œuvre concrètement et efficacement est une question largement ouverte, et Baldwin ne rentre guère dans les détails. Cela tient certainement à deux choses : la première est que le livre est relativement court (329 pages) et se focalise davantage sur la démonstration de la pertinence du modèle proposé par Baldwin pour décrire la mondialisation actuelle que sur ces questions politiques. La seconde, plus fondamentale, est que ces questions sont, à l'heure actuelle, insuffisamment traitées par la recherche pour avoir des réponses très concrètes et très sûres.

Néanmoins, avoir un bon diagnostic est déjà énorme, et à ce titre, The Great Convergence propose un modèle argumenté et convaincant de la deuxième mondialisation, dont on peut espérer qu'il aura une influence sur le débat public.

Bonne année 2017 à tous !

- page 1 de 39