Dateiorganisation
Übersicht
zuletzt besuchte Definitionen...
1. Begriff: Methoden und Prinzipien zur Strukturierung einer Datei, bes. zur Anordnung der Datensätze (Datensatz) und zum Wiederauffinden der Datensätze.
2. Aspekte: a) Die Zugriffsform gibt an, in welcher Reihenfolge man die Datensätze einer Datei ansprechen (lesen oder schreiben) kann.
(1) Sequenzieller Zugriff (fortlaufender Zugriff) bedeutet, dass die Datensätze nur in einer bestimmten Reihenfolge angesprochen werden können. Diese ist entweder durch einen auf- bzw. absteigenden Schlüssel definiert oder durch den Datenträger vorgegeben (z.B. ist bei einem Magnetband nur sequenzieller Zugriff möglich).
(2) Direkter Zugriff (wahlfreier Zugriff, Random Access) liegt vor, wenn die Sätze einer Datei in beliebiger Reihenfolge über ihre Schlüssel angesprochen werden können. Voraussetzung hierfür ist, dass die Datei auf einem Datenträger mit direkter Adressierung (z.B. Magnetplattenspeicher, Diskette, CD-ROM) residiert.
b) Die Speicherungsform definiert die Anordnung der Datensätze in der Datei.
(1) Bei sequenzieller Speicherung (fortlaufender Speicherung) sind die Datensätze hintereinander fortlaufend angeordnet und können auch nur in dieser Reihenfolge wieder bereitgestellt werden.
(2) Bei index-sequenzieller Speicherung werden die Datensätze nach folgendem Prinzip zu Blöcken zusammengefasst: Innerhalb eines Blocks sind die Sätze nach ihren Schlüsseln sequenziell geordnet. Für jeden Block ist in einer Indextabelle der größte Schlüsselwert festgehalten. Soll nun auf einen bestimmten Satz zugegriffen werden, kann über die Indextabelle der richtige Datenblock identifiziert und dann (sequenziell) durchsucht werden. Auf die Indextabelle selbst wird meist das gleiche Prinzip analog angewendet; dies führt zu mehrstufigen Indextabellen.
Realisierungen der index-sequenziellen Speicherung als Dateiorganisationsform sind in der betrieblichen Datenverarbeitung unter dem Namen ISAM (Index Sequential Access Method) bzw. in fortgeschrittener Form als VSAM (Virtual Sequent Access Method) bekannt.
3. Zusammenhänge zwischen Speicherungsform und Zugriffsform: Die Speicherungsform setzt Restriktionen für die Zugriffsform. Bei sequenzieller Speicherung ist nur sequenzieller Zugriff möglich; bei index-sequenzieller Speicherung ist sowohl direkter als auch sequenzieller Zugriff möglich.
4. Einsatzschwerpunkte: a) Sequenzielle Speicherung wird v.a. dann eingesetzt, wenn große Datenbestände nach Ordnungsbegriffen sortiert zu verarbeiten sind.
b) Index-sequenzielle Speicherung ist in der betrieblichen Datenverarbeitung die häufigste Organisationsform, wenn sowohl sequenzieller Zugriff als auch direkter Zugriff zu Datensätzen aufgrund eines Schlüssels (z.B. aufgrund einer klassifizierenden Artikelnummer) erforderlich ist.
5. Probleme der Dateiorganisation: a) Dateien werden i.d.R. aus den Anforderungen der sie verarbeitenden Programme heraus organisiert; daher besteht eine enge Kopplung zwischen Dateien und Programmen. Als Folge müssen bei Änderungen der Dateiorganisation auch die Programme geändert werden (Softwarewartung).
b) Aufgrund der engen Datei-Programm-Kopplung können verschiedene Programme, die teilweise die gleichen Daten benötigen, dieselben Dateien nicht unmittelbar verarbeiten; Daten müssen vielmehr erst in eine für das andere Programm geeignete Form umgesetzt werden. Wenn z.B. ein Programm zwei Daten, die bereits in einer sequenziell organisierten Datei für Programm 1 existieren, in einer anderen Reihenfolge als Programm 1 benötigt, so muss durch Sortieren eine neue Datei erzeugt werden.
c) Datenredundanz: Die gleichen Daten sind in jeweils für spezifische Programme adäquater Form mehrfach vorhanden.
d) Datenkonsistenz (Datenintegrität): Aufgrund der Redundanz und der jeweils isolierten Betrachtung der einzelnen Dateien ist die Widerspruchsfreiheit und Vollständigkeit der Daten nicht gesichert.