Nettoyer et préparer des données avec OpenRefine : atelier pour les journées du consortium MASA - 14/11/2018
Mathieu Saby
14/11/2018 (mis à jour le 19/11/2018)
Introduction
Ce mini-site contient le matériel utilisé lors de l’atelier ‘Nettoyer et préparer des données avec OpenRefine’ organisé pour le consortium MASA d’Huma-Num à Aix-en-Provence le 14/11/2018 dans le cadre des journées annuelles du consortium, ainsi que de la documentation générale sur Openrefine.
Il repose sur la version 3.1 (beta) d’Openrefine
Les données utilisées sont extraites du DOAJ.
Auteur
Mathieu Saby, Université de Nice Sophia Antipolis (Service commun de documentation)
Contact : prenom.nom@univ-cotedazur.fr
(remplacez prenom et nom par mathieu et saby)
Table des matières
- Présentation d’Openrefine
- Installation, lancement, désinstallation
- Gestion des projets et import de données
- Explorer et nettoyer ses données
- Transformer des données
- Exporter les données et les traitements
- Enrichissement de données à partir d’API
- Enrichissement de données à partir de sites web
- Alignement de données avec des référentiels externes
- Introduction au langage Jython
- Annexes
Remerciements
La communauté des développeurs et des utilisateurs réguliers ou occasionnels d’Openrefine, et en particulier Qi Jacky Cui, Thad Guidry, Martin Magdinier, Owen Stephens, Antonin Delpeuch, Ettore Rizza, Sylvain Machefert, Antoine Courtin, Gautier Poupeau, Julien Benedetti
Yihui Xie pour ses packages knitr et bookdown
Aspects techniques
Ce site est écrit en R Markdown et mis en ligne à l’aide du package Bookdown développé par Yihui Xie
Les sources sont accessibles sur https://gitlab.com/msaby/atelier-openrefine-MASA
Cette œuvre est mise à disposition selon les termes de la Licence Creative Commons Attribution 4.0 International.(CC BY license)