Datenredundanz kann zu Datenanomalien in einer Datenbank führen – am häufigsten Fehler beim Einfügen, Löschen und Aktualisieren. Der Prozess der Datennormalisierung hilft, Datenredundanz und die daraus resultierenden Anomalien zu beseitigen.
Datenredundanz tritt auf, wenn ein bestimmtes Datenelement in mehr als einem Bereich der Datenbank gefunden werden kann. Ein gängiges Beispiel wäre die Datenbank einer Universität oder Hochschule über die aktuelle Einschreibung in Kurse. Ein Student kann in mehreren verschiedenen Kursen eingeschrieben sein, so dass sein individueller Studentenausweis mehrmals reproduziert werden kann. In einem Fertigungsszenario kann ein einzelner Anbieter für verschiedene Projekte und Produkte verwendet werden.
Es ist wichtig, das Auftreten von Datenredundanzen zu eliminieren und gleichzeitig die Datenintegrität durch den mehrstufigen Normalisierungsprozess aufrechtzuerhalten. Redundanz führt in der Regel zu drei häufigen Datenanomalien – oder zu Fällen, in denen die Daten inkonsistent sind.
- Einfügungsanomalie - Daten können nicht gespeichert oder aktualisiert werden, es sei denn, es werden gleichzeitig andere Daten gespeichert. Im Beispiel der Schülerakte kann dies der Fall sein, wenn es nicht möglich ist, eine Schülerakte zu erfassen, bis sie sich in einen Kurs eingeschrieben haben.
- Aktualisierungsanomalie – wenn eine der Kopien eines Datensatzes aktualisiert wird, während die andere nicht aktualisiert wird; alle Kopien sollten gleichzeitig aktualisiert werden.
- Anomalie beim Löschen - Dies tritt auf, wenn beim Löschen eines Datenelements auch andere Informationen verloren gehen. In den Schülerbeispielen kann dies vorkommen, wenn das Löschen eines Kurses auch das Löschen der zugehörigen Schülerdatensätze bedeutet.