Subscribe


Initiation à OpenRefine : nettoyer et préparer ses données

Thème :

Traiter : réseaux et outils, outils et techniques de gestion documentaire, traitement, analyse, indexation et cartographie de l'information

Objectifs

Initiation à OpenRefine.

OpenRefine est un outil libre et gratuit potentiellement utile dans de nombreuses disciplines scientifiques et dans les métiers de l’information et de la documentation. Il permet de préparer le traitement de données tabulées hétérogènes, incomplètes, formatées de manière inconsistante, ou bien dont le format natif nécessite une transformation avant analyse.

Le logiciel propose une interface graphique permettant de garder une trace de chaque opération de nettoyage, découpage, regroupement ou enrichissement de données.

Aucune compétence en programmation n’est nécessaire pour maîtriser les fonctions de base, mais un langage spécifique permet de réaliser des opérations avancées.

Programme

- Intérêts respectifs d’OpenRefine et d’autres outils pour le nettoyage de données,
- Importer et exporter des données dans OpenRefine,
- Harmoniser des expressions présentant des variantes,
- Extraire des motifs (expressions régulières),
- Scinder des cellules contenant plusieurs valeurs,
- Enrichir un fichier en récupérant automatiquement des données sur le web,
- Croiser des fichiers,
- Si le timing le permet, introduction au langage GREL (spécifique d’Openrefine).

Prérequis

Aucun. Mais un projet de "traitement" de données sera un plus

Public concerné

Enseignant du supérieur, chercheur Doctorant Professionnels de l’information

Prochaine session


Voir le stage
Comment s'inscrire ?

Rappel : les stages sont gratuits pour tous les personnels d’établissements d’enseignement supérieur et de recherche, ainsi que pour les doctorants.