Erstellung wiederverwendbarer RDF-Geodaten mit Google Refine
Identifier (Artikel)
Identifier (Dateien)
Abstract
Das Forschungsinformationssystem VIVO bietet als Linked-Data-basiertes System die Möglichkeit, Daten aus anderen Quellen wiederzuverwenden. In der Praxis kann man dabei auf Konvertierungsprobleme stoßen. Oft liegen Daten nur in tabellarischem Format vor, z.B. als CSV-Datei. Zur Konvertierung dieser Daten existieren verschiedene Werkzeuge, viele dieser Werkzeuge erfordern jedoch entweder spezielle technische Umgebungen (oft Linux-Systeme) oder sie sind in der Bedienung sehr anspruchsvoll. Im Artikel wird ein Workflow für die Konvertierung von Daten aus GeoNames für VIVO mit Google Refine beschrieben.
Statistiken
![loading loading](https://journals.ub.uni-heidelberg.de/plugins/generic/hdStatistic/img/activity.gif)
Literaturhinweise
Harlow, Christina 2015. Data Munging Tools in Preparation for RDF: Catmandu and LODRefine. Code4Lib(30). Online im Internet: URL: http://journal.code4lib.org/articles/11013.
Hawksey, Martin 2015. OpenRefine(ing) and visualizing library data, in Engard, Nicole C. & Sauers, Michael P. (Hg.): More library mashups: Exploring new ways to deliver library data. London: Facet, 43–58.
Internet Engineering Task Force (IETF) 2010. A Uniform Resource Identifier for Geographic Locations ('geo' URI). URL: http://tools.ietf.org/html/rfc5870.
Larsson, Per 2013. Evaluation of Open Source Data Cleaning Tools: Open Refine and Data Wrangler. URL: http://courses.cs.washington.edu/courses/cse544/13sp/final-projects/p12-plarsson.pdf.
Liventsova, Elena & Hauschke, Christian 2014. geodata: Populated places for VIVO. (Zenodo). URL: http://dx.doi.org/10.5281/zenodo.13101.
OpenRefine: A free, open source, powerful tool for working with messy data 2015. URL: http://openrefine.org/ [Stand 2015-07-09].
Qasmi, Muhammad A. 2014. RDF Quality Extension for OpenRefine. Masterarbeit. Rheinische Friedrich-Wilhelms-Universität Bonn. URL: http://eis-bonn.github.io/Theses/2014/Muhammad_Ali_Qasmi/thesis.pdf [Stand 2015-10-20].
Schelper, Katja 2015. Open Refine, in Blümel, Ina (Hg.): VIVO-Handbuch. URL: http://handbuch.io/w/VIVO-Handbuch/Open_Refine.
Silbermann, Jascha, u.a. 2013. RefPrimeCouch--a reference gene primer CouchApp. Database : the journal of biological databases and curation. Online im Internet: URL: http://dx.doi.org/10.1093/database/bat081.
van Hooland, Seth & Verborgh, Ruben 2015. Linked Data for Libraries, Archives and Museums: How to clean, link and publish your metadata. London: Facet Publishing.
Verborgh, Ruben & Wilde, Max de 2013. Using OpenRefine: The essential OpenRefine guide that takes you from data analysis and error fixing to linking your dataset to the web. Birmingham: Packt. (Community experience distilled).
Wong, Carmen K., u.a. 2015. Standardisation of the FAERS database: a systematic approach to manually recoding drug name variants. Pharmacoepidemiology and drug safety 24(7), 731–737. URL: http://dx.doi.org/10.1002/pds.3805