Was sind Rohdaten?

Rohdaten, auch als Quelldaten oder Atomdaten bekannt, sind Informationen, die nicht verarbeitet wurden, um in irgendeiner vorzeigbaren Form angezeigt zu werden. Die Rohform kann ohne Verarbeitung sehr unkenntlich und fast bedeutungslos aussehen, kann aber auch in einer Form vorliegen, die je nach Situation von einigen interpretiert werden kann. Diese Daten können manuell oder maschinell verarbeitet werden.

In einigen Fällen können Rohdaten nur eine Reihe von Zahlen sein. Die Reihenfolge dieser Zahlen und manchmal sogar deren Abstand können jedoch sehr wichtige Informationen sein. Ein Computer kann diese Informationen interpretieren und eine Anzeige ausgeben, die dann für den Leser sinnvoll sein kann.

Binärcode ist ein gutes Beispiel für Rohdaten. Als Ausdruck für sich genommen, bringt ein Binärcode für den Computerbenutzer sehr wenig – zumindest für die allermeisten Benutzer. Wenn es hingegen durch einen Computer verarbeitet wird, liefert es verständlichere Informationen. Tatsächlich ist Binärcode normalerweise der Quellcode für alles, was ein Computerbenutzer sieht.

In einigen Fällen wird diese Art von Daten möglicherweise nie in ihrer endgültigen Form angezeigt, insbesondere von Personen, die in Dateneingabeanwendungen arbeiten. In diesen Situationen ist der Benutzer nur für die Eingabe der Informationen verantwortlich, und manchmal weiß die Person, die die Daten eingibt, möglicherweise nicht einmal genau, was sie eingibt oder warum. Dies ist besonders hilfreich, wenn Sicherheit oder Datenschutz wichtig sind, da so sichergestellt wird, dass kein Mitarbeiter voreingenommene oder absichtlich falsche Informationen einfügt, um jemanden zu verletzen oder zu fördern.

Bei einigen medizinischen Anwendungen kann es beispielsweise sehr strenge Vorschriften bezüglich der Privatsphäre des Patienten geben, dennoch müssen die Daten möglicherweise in eine Datenbank eingegeben werden. Um zu verhindern, dass möglichst viele Personen die Patienten identifizieren, kann jedem eine Nummer zugewiesen werden. Ihre Bedingungen können ebenso wie ihre Behandlungsmöglichkeiten mit einer Nummer versehen werden. Ohne das Wissen um die Bedeutung dieser Zahlen gibt es keine Möglichkeit, den Patienten oder die Erkrankung zu identifizieren. Diese identifizierenden Informationen sind möglicherweise nur einer Handvoll Personen zugänglich.

Dieses Beispiel ist eigentlich ziemlich ungewöhnlich, da Informationen selten in eine Form umgewandelt werden, die als roh betrachtet wird. Stattdessen werden in der Regel Rohdaten verarbeitet, um sie zu verfeinern. Es gibt jedoch viele verschiedene Anwendungen, bei denen unverarbeitete Daten auftauchen, und die Regeln, was damit zu tun ist, hängen von der Situation ab.