Introduction

URL courte : http://bit.ly/OpenrefineLyon2019

Ce mini-site contient le matériel utilisé lors de la formation ‘Nettoyer, préparer et transformer des données avec Openrefine : des premiers pas aux usages avancés’ réalisée le 22 novembre 2019 à l’URFIST de Lyon.

Il peut également être utilisé en autonomie.

Il s’appuie sur la version 3.3 (béta) d’Openrefine

cover image

Auteur

Mathieu Saby, Université Nice Côte d’Azur(Service commun de documentation)

Contact : rubrique Contact sur http://mathieusaby.fr ; Twitter

Objectifs

OpenRefine est un logiciel libre et gratuit destiné à nettoyer, préparer, transformer et enrichir des données. Il est utilisable dans de nombreuses contextes scientifiques et dans les métiers de l’information et de la documentation. Son interface est proche de celle d’un tableur et permet de réaliser des opérations au moyen de menus ou en écrivant des formules dans un langage spécifique.

Au cours de la formation, les fonctionnalités simples et avancées d’OpenRefine seront présentées de manière progressive et dynamique, en s’appuyant sur des exemples et des exercices pratiques. Des supports et éléments de documentation en français seront fournis.

Déroulement

  • Matinée : 9h30 - 12h30
    • Présentation du logiciel, installation, personnalisation
    • Création d’un projet : import d’un jeu de données
    • Exploration : filtres, facettes
    • Transformations simples : remplacements, regroupements
  • Après-midi : 13h30h - 17h
    • Restructuration, créations de nouvelles lignes et colonnes
    • Transformations avancées avec le langage GREL
    • Export des données et des traitements
    • Aperçu rapide de l’enrichissement par utilisation d’API, réconciliation et web scraping

Annexes



Remerciements

Un grand merci à la communauté des développeurs, concepteurs de cours et de tutoriels, et utilisateurs réguliers ou occasionnels d’Openrefine : Qi Jacky Cui, Thad Guidry, Martin Magdinier, Owen Stephens, Antonin Delpeuch, Aaron Tay, Seth van Hooland, Ruben Verborgh, Max De Wilde, Ettore Rizza, Sylvain Machefert, Antoine Courtin, Gautier Poupeau, Julien Benedetti, Maïwenn Bourdic et tous ceux que j’oublie… Yihui Xie pour ses packages knitr et bookdown ; John Little pour son modèle de question/réponse dynamique en rmarkdown.

Aspects techniques

Ce site est écrit en R Markdown et mis en ligne à l’aide du package Bookdown développé par Yihui Xie

Les sources sont accessibles sur https://gitlab.com/msaby/formation-openrefine-Lyon20191122

Licence

Cette œuvre est mise à disposition selon les termes de la Licence Creative Commons Attribution 4.0 International.(CC BY license)

Creative Commons Attribution 4.0 International License logo

Creative Commons Attribution 4.0 International License logo