DatenRichtlinien

Aus Salzwiki
Version vom 15. Juni 2011, 13:18 Uhr von Hschwarz (Diskussion | Beiträge) (→‎Workflow zum Einstellen von Daten)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Zur Navigation springen Zur Suche springen

<accesscontrol>administrators</accesscontrol> Autoren: Hans-Jürgen Schwarz


zurück zu Autorenseite

Abstract[Bearbeiten]

Der Zugang zu wissenschaftlichen Primärdaten ist eine grundlegende Voraussetzung für die Forschungsarbeit in den Naturwissenschaften. Aus diesem Grund ist es von größter Bedeutung, dass diese möglichst allen Wissenschaftlern zur Verfügung stehen [1][2]. Die Bedingungen, unter denen diese Forschungsdaten im Rahmen des Fachwikis "Schäden durch Salze" im Internet bereit gestellt werden, werden formuliert und auf unterschiedliche Nutzergruppen abgestimmt.


Einleitung[Bearbeiten]

Primär- und Projektdaten sind breit über viele Forschungsinstitute verstreut und werden in der Regel von den Wissenschaftlern erhoben und meist selbst verwaltet. Aufgrund der fehlenden Anerkennung der mit der Aufbereitung verbundenen Arbeit sind Projektdaten häufig schlecht dokumentiert, oft schwer zugänglich sowie meist nicht langfristig gesichert. Große Datenbestände bleiben ungenutzt, da sie nur einem kleinen Kreis von Wissenschaftlern bekannt und zugänglich sind. Viele Primärdaten bleiben ungenutztes Rohmaterial und sind häufig nach wenigen Jahren verloren.

Im wissenschaftlichen Bereich besteht zwar die grundsätzliche Bereitschaft, Daten für eine interdisziplinäre Nutzung zur Verfügung zu stellen, aber es ist zur Zeit unüblich, dass die erforderliche Mehrarbeit für Aufbereitung, Kontextdokumentation und Qualitätssicherung im Wissenschaftsbetrieb anerkannt wird. Die klassische Form der Verbreitung wissenschaftlicher Ergebnisse ist ihre Veröffentlichung in Fachzeitschriften, normalerweise ohne Veröffentlichung der zugrunde liegenden Primärdaten. Diese klassische Publikation wird im "Citation Index" erfasst. Dieser Index wird zur Leistungsbewertung von Wissenschaftlern herangezogen. Datenveröffentlichungen werden darin bisher nicht berücksichtigt. (Zitierfähige Datensätze Primärdaten-Management durch DOIs, Dr. Jan Brase)[3]

Eine Möglichkeit Daten im Bereich der Erhaltung von Kulturgütern - im Speziellen bei "Schäden durch Salze"  - langfristig zu sichern wird durch das Fachwiki "Schäden durch Salze" zusammen mit dem dazugehörenden Repositorium angestrebt.

Damit möglichst viele Forscher = Autoren der Daten auch ihre Daten zur Verfügung stellen, müssen das Wie? und Wo? und die dazugehörigen Rahmenbedingungen genau formuliert werden. Als ein  Anreiz hierzu und um wissenschaftliche Daten in gleicher Art wie Literatur zitierfähig zu machen, soll ein persistenter Identifier[4] wie z.B. der DOI (digital object identifier) eingesetzt werden.

Was ist Open Access?[5][Bearbeiten]

"Open Access meint, dass diese [= die wissenschaftliche] Literatur kostenfrei und öffentlich im Internet zugänglich sein sollte, so dass Interessierte die Volltexte lesen, herunterladen, kopieren, verteilen, drucken, in ihnen suchen, auf sie verweisen und sie auch sonst auf jede denkbare legale Weise benutzen können, ohne finanzielle, gesetzliche oder technische Barrieren jenseits von denen, die mit dem Internet-Zugang selbst verbunden sind. In allen Fragen des Wiederabdrucks und der Verteilung und in allen Fragen des Copyright überhaupt sollte die einzige Einschränkung darin bestehen, den jeweiligen Autorinnen und Autoren Kontrolle über ihre Arbeit zu belassen und deren Recht zu sichern, dass ihre Arbeit angemessen anerkannt und zitiert wird." (Budapester Open Access Initiative)

Welche Daten?[Bearbeiten]

Prinzipiell können alle Arten von Daten im Repositorium gespeichert werden. Ziel von SalzWiki ist es, möglichst viele Daten im Repositorium zu erfassen und zugänglich zu machen. In Abhängigkeit von der Art der Daten werden diese zusammen mit geeigneten Metadaten erfasst und auch in einem Format gespeichert, das langfristig den Zugriff auf die Daten zulässt.

Alle neueren Textverarbeitungsprogramm  und auch Tabellenkalkulationsprogramme, in denen viele der vorliegenden Daten erfasst sind, erlauben mittlerweile die Ausgabe im XML- Format.


Datentypen im Repositorium von SalzWiki
Typ Format Speicherformat Beschreibung Metadatenschema





Foto alle möglichen Fotoformate
jpg, png, gif

exif, xmp
Diagramm alle Grafikfformate
jpg, png

exif, xmp
Grafik alle Grafikfformate
jpg, png

exif, xmp
Literatur Textformate
xml, pdf

dublin core
Berichte Textformate
xml, pdf

dublin core
Merkblätter Textformate
xml, pdf

dublin core
Analysen Tabelleformate, csv
xml

dublin core
Kennzahlen Datenformate
xml

dublin core

Daten für alle?[Bearbeiten]

Die Daten im Repositorium sollen allen zum Zwecke der Forschung und Lehre zur Verfügung stehen. Da es sich zum großen Teil um noch nicht vollständig publizierte Daten handelt, werden alle Datensätze mit den von den Autoren gewünschten Lizenzen ausgestattet, die die Nutzung der Daten regeln.

Dabei ist es zunächst einmal unwesentlich um welche Daten es sich handelt, also ob es sich um Fotos, Diagramme oder Primärdaten in Tabellenform handelt. Von Bedeutung ist vielmehr, ob ein anderer diese Daten auswerten und für seine Forschungen benutzen darf, ob er sie  (z.B. Abbildungen) verändern darf, unter welchen Bedingungen (Lizenzen) er sie benutzen darf.

Sinn des Repositorium ist es, bezogen auf seine Aufgabe als "Virtuelle Forschungsumgebung":

  • Daten langfristig zu sichern: Viele Daten werden erzeugt aber oft vom Urheber selber nur zum Teil vollständig ausgewertet, so dass dise auch anderweitig noch von Nutzen sein können. Auch im Sinne der "Guten Wissenschaftlichen Praxis" ist das langfristige Sichern der Primärdaten erforderlich, was im normalen Betrieb oft nicht optimal betrieben werden kann.
  • Daten anderen zur Verfügung stellen: Viele Daten sind vom Urheber ausgewertet und publiziert. In der Regel erfolgt die Publikation nicht durch Veröffentlichen der Primärdaten an sich, sondern einer zusammenfassenden Auswertung, in der meist Diagramme oder z.B. Abbildungen die Primärdaten wiederspiegelen. In einem Repositorium können diese Daten allen Interessierten zu Verfügung gestellt werden.
  • Primärdaten publizieren: In einem Repositorium ist es möglich seine Primärdaten zu publizieren und Sie damit zitierfähig zu machen. Dies bedeutet, wenn andere ihre Daten benutzen, können diese z.B. mit einem DOI zitiert werden. Anhand von Metadaten wären diese sogar wie eine "normale" Publikation recherchierbar.


Workflow zum Einstellen von Daten[Bearbeiten]

Ganz Wesentlich ist, dass nur solche Daten hochgeladen werden, bei denen die Herkunft genau bekannt und auch die Erstellung der Datensätze nachvollziehbar beschrieben werden kann. Daten können nur dann sinnvoll wiederverwendet werden, wenn der Nutzer diese in Ihre Qualität beurteilen kann.

Zur Qualitätssicherung und Vereinfachung gelten folgende Vereinbarungen:

  • Das Metadatenschema ist vollständig auszufüllen
  • Werden Analysen bzw. Messwerte in Datensätzen erfasst, so ist das entsprechende Kürzel des Messverfahrens bzw. Analysevorschrift anzugeben.
  • Ist das Messverfahren bzw. die Analysevorschrift noch nicht erfasst http://193.175.110.91/repository/index.php/Analysen#Messverfahren
 {{MetadatenFoto_upload
|Beschreibung=
|Quelle=
|Datum=
|Autor=
|Erlaubnis=
|Bemerkungen=
}} 

{{MetadatenDaten_upload
|Bearbeiter   =
|Datum        =
|Fragstellung =
|Methode      =
|Objekt       =
|Bericht      =
|Publikation  =
|DOI          =
}}

{{MetadatenProben_upload
|+Für jede Probe(Analyse)ist jeweils eine neue Zeile anzulegen, 
d.h. die Vorlage MetadatenProben_upload zu kopieren und auszufüllen.
|Probennummer=
|Probentyp=
|Probenart=
|Probengröße=
|Bedingungen=
|Umfeld=
}}

WORKFLOW

  1. Datensatz auf Vollständigkeit prüfen
  2. Liegt der Datensatz im richtigen Format vor (pdf-A, xls, xml), wenn nicht umformatieren
  3. Vollständigkeit der Metadaten anhand der Vorlage [6], wenn nicht vollständig ergänzen
  4. Ist das Analysen- bzw. Messschema schon vorhanden, wenn nicht, bitte unter [7] erstellen
  5. Die Upload Seite im Repopsitorium öffnen und alle notwendigen Informationen erfassen: Kategorisierung und Lizenz nicht vergessen!
  6. Datei Hochladen und prüfen, ob sie richtig hochgeladen wurde
  7. Prüfen, ob ein DOI für den Datensatz vergeben werden soll, wenn ja, Info an Redakteur und Hornemann Institut (soll später als Klickkästchen automatisch geschehen.

Weblinks[Bearbeiten]