Advanced AI for Data Analysis Program
Le volume de données à traiter sur Internet connaît une croissance exponentielle. Des quantités remarquables de données non structurées telles que des textes, des images, des relevés temporels, sont disponibles, toutes produites à un rythme effréné. Ces dernières années, la disponibilité d'une puissance de traitement très élevée combinée à l'intérêt de l'industrie a donné naissance à de nouvelles méthodes d'IA, telles que l'apprentissage profond et l'apprentissage par renforcement. Elles permettent d'extraire des volumes d'informations significatifs en un temps très court, de résoudre des problèmes complexes et d'ouvrir de nouvelles perspectives.
Le programme Advanced AI est conçu pour fournir des informations approfondies sur ces nouvelles méthodes et leurs applications à des données massives et hautement hétérogènes. Parmi les domaines d'application de ces méthodes figurent le marketing, les jeux vidéos, les systèmes de recommandation, l'exploration de textes, la programmation neurolinguistique, les réseaux sociaux, la détection des fraudes et la reconnaissance images et vidéo.
Cette formation en data intelligence donne l'opportunité à des professionnels de devenir des spécialistes de la big data (donnée massive). Ce programme est conçu pour apprendre à collecter, modéliser, stocker et analyser la data. Il est porté par des enseignants-chercheurs reconnus dans le domaine de l'advance AI, et l'analyse de la donnée industrielle (data analyst industriel).
Contenu du programme
- Introduction à l'écosystème de l'IA et de la Data Science
Objectif : Faire des rappels sur les fondamentaux en science des données, présenter les spécificités des données massives et non structurées.
Ce module rappelle l'écosystème actuel de la data et de l'IA, les opportunités, les enjeux et les points de vigilance à considérer pour un projet de ce type. Il permet à tous les participants de revoir les bases essentielles (normalement déjà acquises par les participants) en Data Science et Big Data.
- Deep Learning pour texte / traitement du langage naturel (NLP)
Objectif : Les textes sont des données non structurées fréquentes, notamment dans les données web mais aussi celle des contrats, des lois (par exemple).
Ce module présente les méthodes et les outils pour le prétraitement, l'indexation, la recherche et le classement de textes dans un document ou une collection.
- IA appliquée aux graphes et réseaux sociaux
Objectif : les graphes sont des données issus notamment du web et des réseaux sociaux.
Ce module explique et permet de mettre en oeuvre des méthodes et outils de niveau avancé pour le pré-traitement des graphes, leur recherche et classement ainsi que l'évaluation de noeuds ou de communautés.
- IA pour les séries temporelles, l'images/vision et les recommandations pour le web marketing
Objectif : Donner les outils et les méthodologies permettant la prévision des données de type séries temporelles. Présenter l'état de l'art des méthodes de recommandation. Présenter une introduction complète aux méthodes d'IA pour les images et les applications de computer vision.
- Data Challenge
Objectif : appliquer les techniques vues dans les cours précédents à une étude de cas venant d'un problème industriel ou académique. Deux journées complètes en équipe pour réaliser une analyse permettant de mettre en oeuvre la méthodologie et les techniques vues dans les modules précédents.
Objectifs du programme
- Comprendre et d’utiliser des réseaux de neurones (Deep Learning) sur des volumes importants de données (Big Data) non structurées de type textes et graphes
- Maîtriser les spécificités de ces données et d’apprendre quelles sont les techniques d’analyse les plus récentes