Dear all,
The next seminar in our series of statistics talks for people interested in quantitative methods in biology and medicine will take place on Thursday 11 December 2014 at 11h00 in the Salle Delachaux (Biopôle 2, premier étage, Route de la Corniche 10, Lausanne, M2: Vennes).
The speaker will be Prof. Jacques Savoy (Informatic Institute, University of Neuchâtel) who will speak about language models.
Titre: modèles statistiques de langue et applications en informatique
Résumé: Dans cette présentation, nous aborderons les problèmes sous-jacents à l’emploi des modèles de langue en informatique. Dans le cadre de cette approche, nous estimons la probabilité d’occurrence des mots (ou des lettres) ainsi que des séquences de mots (ou de lettres). Le problème central de cette démarche consiste à estimer de la manière la plus précise et économique l’occurrence des mots isolés, des séquences de mots ou des phrases entières. Mais les langues naturelles comme l’anglais, le français ou le chinois possèdent des propriétés rendant cette estimation complexe. Nous présenterons la loi de Zipf, et des techniques de lissage apportant une réponse partielle à nos attentes. Enfin, nous présenterons quelques applications possibles comme l’attribution d’auteur (« qui a écrit ce texte ou ce courriel ? »).
The slides will be written in English and questions can be asked in French or English.
Hope to see you there!
Valentin
(for the organizers: Jérôme Goudet, Valentin Rousson, Frédéric Schütz)
----------------------------------------------------
Valentin Rousson
Unité de Statistique
Institut Universitaire de Médecine Sociale et Préventive
Centre Hospitalier Universitaire et Université de Lausanne
Biopôle 2
Route de la Corniche 10
CH-1010 Lausanne
Tél : ++41 (021) 314 73 28
Fax : ++41 (021) 314 73 73
Email: Valentin.Rousson(a)chuv.ch<mailto:Valentin.Rousson@chuv.ch>