Tutoriel OpenRefine 3.4 : nettoyer, préparer et transformer des données - 06/11/2020
06/11/2020
Introduction
URL courte : http://bit.ly/tutoOpenRefine
Ce tutoriel est basé sur les formations réalisées pour les URFIST de Nice, Paris et Lyon de 2017 à 2019 et la formation réalisée pour le consortium MASA d’Humanum.
Il s’appuie sur la version 3.4 d’OpenRefine
Auteur
Mathieu Saby, Université Nice Côte d’Azur (Service commun de documentation)
Contact : rubrique Contact sur http://mathieusaby.fr ; Twitter
Objectifs
OpenRefine est un logiciel libre et gratuit destiné à nettoyer, préparer, transformer et enrichir des données. Il est utilisable dans de nombreuses contextes scientifiques et dans les métiers de l’information et de la documentation. Son interface est proche de celle d’un tableur et permet de réaliser des opérations au moyen de menus ou en écrivant des formules dans un langage spécifique.
- Aide mémoire rapide
- Structure de données et langage GREL
- Langage Jython
- Expressions régulières
- Analyse de JSON
- Analyse de HTML et XML
- Liste des changements depuis OpenRefine 2.7
- Exemples de “recettes”
Remerciements
Un grand merci à la communauté des développeurs, concepteurs de cours et de tutoriels, et utilisateurs réguliers ou occasionnels d’OpenRefine : Qi Jacky Cui, Thad Guidry, Martin Magdinier, Owen Stephens, Antonin Delpeuch, Aaron Tay, Seth van Hooland, Ruben Verborgh, Max De Wilde, Ettore Rizza, Sylvain Machefert, Antoine Courtin, Gautier Poupeau, Julien Benedetti, Maïwenn Bourdic et tous ceux que j’oublie… Yihui Xie pour ses packages knitr et bookdown ; John Little pour son modèle de question/réponse dynamique en rmarkdown.
Aspects techniques
Ce site est écrit en R Markdown et mis en ligne à l’aide du package Bookdown développé par Yihui Xie
Les sources sont accessibles sur https://gitlab.com/msaby/tutoriel-openrefine
Licence
Cette œuvre est mise à disposition selon les termes de la Licence Creative Commons Attribution 4.0 International.(CC BY license)

Creative Commons Attribution 4.0 International License logo