Erstellung wiederverwendbarer RDF-Geodaten mit Google Refine
Identifiers (Article)
Identifiers (Files)
Abstract
Das Forschungsinformationssystem VIVO bietet als Linked-Data-basiertes System die Möglichkeit, Daten aus anderen Quellen wiederzuverwenden. In der Praxis kann man dabei auf Konvertierungsprobleme stoßen. Oft liegen Daten nur in tabellarischem Format vor, z.B. als CSV-Datei. Zur Konvertierung dieser Daten existieren verschiedene Werkzeuge, viele dieser Werkzeuge erfordern jedoch entweder spezielle technische Umgebungen (oft Linux-Systeme) oder sie sind in der Bedienung sehr anspruchsvoll. Im Artikel wird ein Workflow für die Konvertierung von Daten aus GeoNames für VIVO mit Google Refine beschrieben.
Statistics
References
Harlow, Christina 2015. Data Munging Tools in Preparation for RDF: Catmandu and LODRefine. Code4Lib(30). Online im Internet: URL: http://journal.code4lib.org/articles/11013.
Hawksey, Martin 2015. OpenRefine(ing) and visualizing library data, in Engard, Nicole C. & Sauers, Michael P. (Hg.): More library mashups: Exploring new ways to deliver library data. London: Facet, 43–58.
Internet Engineering Task Force (IETF) 2010. A Uniform Resource Identifier for Geographic Locations ('geo' URI). URL: http://tools.ietf.org/html/rfc5870.
Larsson, Per 2013. Evaluation of Open Source Data Cleaning Tools: Open Refine and Data Wrangler. URL: http://courses.cs.washington.edu/courses/cse544/13sp/final-projects/p12-plarsson.pdf.
Liventsova, Elena & Hauschke, Christian 2014. geodata: Populated places for VIVO. (Zenodo). URL: http://dx.doi.org/10.5281/zenodo.13101.
OpenRefine: A free, open source, powerful tool for working with messy data 2015. URL: http://openrefine.org/ [Stand 2015-07-09].
Qasmi, Muhammad A. 2014. RDF Quality Extension for OpenRefine. Masterarbeit. Rheinische Friedrich-Wilhelms-Universität Bonn. URL: http://eis-bonn.github.io/Theses/2014/Muhammad_Ali_Qasmi/thesis.pdf [Stand 2015-10-20].
Schelper, Katja 2015. Open Refine, in Blümel, Ina (Hg.): VIVO-Handbuch. URL: http://handbuch.io/w/VIVO-Handbuch/Open_Refine.
Silbermann, Jascha, u.a. 2013. RefPrimeCouch--a reference gene primer CouchApp. Database : the journal of biological databases and curation. Online im Internet: URL: http://dx.doi.org/10.1093/database/bat081.
van Hooland, Seth & Verborgh, Ruben 2015. Linked Data for Libraries, Archives and Museums: How to clean, link and publish your metadata. London: Facet Publishing.
Verborgh, Ruben & Wilde, Max de 2013. Using OpenRefine: The essential OpenRefine guide that takes you from data analysis and error fixing to linking your dataset to the web. Birmingham: Packt. (Community experience distilled).
Wong, Carmen K., u.a. 2015. Standardisation of the FAERS database: a systematic approach to manually recoding drug name variants. Pharmacoepidemiology and drug safety 24(7), 731–737. URL: http://dx.doi.org/10.1002/pds.3805