Reminder - May 9, with Meïli Baragatti

11 views
Skip to first unread message

All About That Bayes

unread,
May 8, 2023, 3:03:54 PM5/8/23
to All About That Bayes

Dear all,


a gentle reminder about tomorrow's session with Meïli Baragatti ('Institut Agro Montpellier). The link to access the session is the following : http://cds.biosp.org

Meïli will talk about Promenade en statistique bayésienne: une méthode d'élicitation, une méthode sans vraisemblance et un exemple simple dans un cadre de modèle épidémiologique de transmission de maladie. (abstract below). 

Best regards,
The All about that Bayes organising team
----
Abstract

Dans le cadre de votre séminaire orienté sur la statistique bayésienne, je me propose de vous présenter deux méthodes et éventuellement un exemple d’application utilisant le logiciel Stan.

La première méthode que je vous propose concerne l’information a priori utilisée dans toute analyse bayésienne. En effet, une partie importante de la modélisation statistique bayésienne consiste à spécifier une distribution a prori. Si des connaissances expertes en la matière sont disponibles, il est possible de construire un modèle qui inclut ces informations a priori. Cependant, l'acquisition de ces connaissances expertes est une tâche délicate car le statisticien doit formuler les connaissances des experts en termes probabilistes. Je vous présenterais deux approches d’élicitation permettant d’obtenir les connaissances des experts dans un cas spécifique : le modèle Bliss, qui est un modèle de régression linéaire fonctionnelle bayésienne parcimonieuse. Dans ce contexte, les connaissances a priori sont difficiles à formuler car le paramètre principal du modèle n'est pas facilement interprétable. Le principe de ces deux approches peut être facilement transposé dans un cadre plus général, à d’autres modèles. Je montrerai les résultats obtenus sur des données simulées, ainsi que sur un jeu de données permettant d’estimer l'influence de la pluviométrie sur les rendements de truffe noire du Périgord.

La seconde méthode proposée est une méthode Approximate Bayesian Computation (ABC) ou encore dite sans-vraisemblance (Likelihood-Free).
Dans de nombreuses situations, la fonction de vraisemblance joue un rôle clé dans l'inférence fréquentiste ou bayésienne. Cependant, il n'est pas rare que cette vraisemblance soit difficile à utiliser, soit parce qu'il n'existe pas d'expression explicite : soit le modèle statistique correspondant est trop complexe, soit son coût de calcul est prohibitif. Dans ce cas, les approches ABC font partie des méthodes d'inférence sans vraisemblance les plus populaires, et permettent d’obtenir des distributions a posteriori approximées des paramètres d’intérêts. Le calcul de la fonction de vraisemblance est remplacé par la nécessité de pouvoir simuler à partir du modèle statistique considéré. Dans le cadre « classique » de l’ABC, le degré d'approximation dépend fortement des choix de statistiques résumées, d’une distance entre simulations et jeu de données observé, ainsi que d’un certain niveau de tolérance. Ces choix ne sont pas toujours faciles, en particulier celui des statistiques résumées. De nombreux travaux ont proposé des alternatives, pour palier à ces difficultés. En particulier, Akesson et al. (2021) ont proposé d’utiliser la moyenne a posteriori du paramètre d’intérêt comme statistique résumé, cette moyenne a posteriori étant estimée par un réseau de neurones convolutionnel. Leur approche est très intéressante mais ne permet pas d’obtenir de mesure de l’incertitude sur l’estimation a posteriori. Nous proposons donc de compléter leur approche en utilisant des réseaux de neurones avec drop out (Gal et al. 2017). Cette méthode ABC-DeepLearning permet d’obtenir de bonnes estimations a posteriori, associées à des incertitudes, tout en évitant certains des inconvénients de la plupart des approches ABC.

Enfin, si nous avons le temps je pourrais vous montrer un exemple assez simple d’application de la statistique bayésienne dans un cadre épidémiologique. En effet, nous souhaitons estimer des taux de transmission annuels d’une certaine maladie au sein d’une population. Le modèle associé est simple et connu, le choix des distributions a priori ne pose pas de problème particulier. Un algorithme Hamiltonian Monte Carlo est utilisé (extension d’un algorithme Metropolis-Hastings classique). Cet exemple servira à montrer que ce type d’approche bayésienne, dans un cadre de modèle pas trop complexe, est facilement utilisable par des personnes non spécialistes du bayésien, à l’aide de logiciels dédiés (le logiciel Stan a été utilisé ici).
Reply all
Reply to author
Forward
0 new messages