Optische Mustererkennung im Kanal-TV – Auf dem Weg von inhomogen zu homogen?
Nachdem in Teil 1 der Fachartikelserie „KI-unterstützte Zustandsbewertung von Abwassersystemen“ die Funktionsweise der künstlichen Intelligenz beleuchtet sowie eine Einordnung in Workflow, Chancen und Grenzen vorgenommen wurde, erläutert Teil 2, was große Herausforderungen bei der Entwicklung einer KI-Bilderkennung für Kanalinspektionen sind.


Wie im ersten Artikel dieser Serie im Dezember 2022 geschrieben, entsteht schnell der subjektive Eindruck, dass die optischen Verhältnisse einer Kanalbefahrung homogen und durch eine KI gut bewältigbar seien. Letztere beherrscht heutzutage schließlich vermeintlich weitaus komplexere Systeme wie den Straßenverkehr. Skepsis über diese These kam bei uns jedoch im Zuge der Recherchen für diese Artikelserie auf. Schon in den ersten willkürlich gewählten Befahrungsvideos begegneten uns unerwartet viele „irreguläre“ Situationen.
In diesem Artikel werden derartige Unregelmäßigkeiten zunächst systematisch und anschaulich dargelegt. Darauf basierend wird der Schwierigkeitsgrad der automatisierten optischen Mustererkennung in Kanalbefahrungen objektiv beurteilt.

Betrachtungshorizont: Aufnahmen von Haltungen beliebiger Kamerasysteme
Die Aussagen dieses Beitrags werden durch Bilder aus Haltungsbefahrungen veranschaulicht, da sich die Entwicklung von KI-Systemen bisher auf diese Komponente, und eher nachrangig auf die Kodierung von Leitungs- bzw. Schachtvideos, konzentriert hat.

Zustände innerhalb und außerhalb der Systemgrenzen
Der Betrachtungsraum einer TV-Untersuchung beginnt am Rohranfang des inspizierten Hauptrohrs (meist Haltung) und endet an dessen Rohrende bzw. an einem Bewegungshindernis bei Inspektionsabbruch. Weist das Hauptrohr Anschlüsse auf, wird der Einmündebereich zwischen der letzten Rohrverbindung im Anschluss und dem Hauptrohr selbst aus sanierungspraktischen Gründen dem Hauptrohr zugeordnet. Die oberhalb der letzten Anschlussverbindung gelegenen Rohrabschnitte gehören dagegen zur jeweiligen Anschlussleitung.
TV-Inspektionen enthalten häufig Videosequenzen von Auffälligkeiten bzw. Schäden, die außerhalb dieses Betrachtungshorizonts liegen, z.B.:
- Anschlüsse und/oder Schäden innerhalb der zulaufenden Leitung, sichtbar beim Hineinschwenken in den Anschluss vom Hauptrohr aus (Abbildung 1)
- Anschlüsse und/oder Schäden innerhalb des Start-/Endschachtes der Inspektion, abgebildet beim initialen/finalen Rundum-Schwenken im Schacht (Abbildung 2 und Abbildung 3)
- Alle Auffälligkeiten bzw. Schäden, die beim Zurückziehen der noch angeschalteten Kamera im Videobild sichtbar sind – Gefahr der doppelten Dokumentation!
- Bei einer ausschließlich Bild-basierten Kodierung durch das KI-System würden solche Fälle in der Zustandsdokumentation des inspizierten Rohrs fälschlicherweise erscheinen. Das KI-Tool muss – ebenso wie der menschliche Betrachter – in der Lage sein, derartige Feststellungen für die inspizierte Haltung als irrelevant zu verwerfen.

Zusammenfassung von auf mehreren Einzelbildern sichtbaren Zuständen
Von Dreh-Schwenkkopf-Kameras erzeugte Videos bestehen aus sehr vielen, nacheinander aufgenommenen Einzelbildern, die das menschliche Auge aufgrund der Kanal-TV-typischen hohen Bildfrequenz von 25 Bildern pro Sekunde („frames per second“) als bewegte Szene wahrnimmt. Die gängigen KI-Analysen beziehen sich jedoch auf die im einzelnen Bild enthaltenen Informationen.
Dies kann insofern zu einer Herausforderung für ein KI-System werden, da derselbe Zustand auf mehreren Einzelbildern oftmals nur teilweise und mit veränderlicher Beschaffenheit sichtbar ist, wie bspw. der komplexe Riss in Abbildung 4, der auf Abbildung 5 und Abbildung 6 radial abgeschwenkt wird. Im Videoframe aus Abbildung 5 ist ein verhältnismäßig breiter Abschnitt des Risses abgebildet – im Einzelbild in Abbildung 6 ist dagegen nur sein „Haarriss-artiger Ausläufer“ vorhanden.

Auch hier muss eine KI-Anwendung mehr beherrschen als nur die direkte Übersetzung von Bildinformation in Zustandsfeststellung. Dann würde die Dokumentation im Beispiel nämlich fälschlicherweise zwei verschiedene Kodes – einen für den breiteren und einen für den schmäleren Riss – enthalten. Stattdessen muss das KI-System die Zusammengehörigkeit mehrerer Teilabbildungen zu ein und derselben Feststellung erkennen und mit einem einzigen Kode beschreiben.

Optisch anspruchsvolle Situationen
Während der Recherchen für diesen Beitrag sind uns einige Fälle begegnet, für die selbst der menschliche Betrachter ein hohes Maß an Aufmerksamkeit und Konzentration für die richtige Zustandsbeschreibung benötigt. Die richtige Beschreibung derartiger Sonderfälle durch ein KI-System ist wesentlich schwieriger.
· Sehr große optische Ähnlichkeit zwischen einem Anschluss (Abbildung 7) und einer fehlenden Wandung (Abbildung 8) im Steinzeug-Rohr
· Identifizierung der weißen Linie am linken Kämpfer als Spinnwebe und nicht als Haarriss, indem bei laufendem Video sichtbar ist, wie das markierte Insekt beim Vorbeifliegen daran stößt und dadurch den weißen Faden zum Pendeln bringt (Abbildung 9)
· Optische Hindernisse auf der Linse, die einen Teil des Videobilds nur so weit stören, dass Objekte wie der Anschluss am linken Kämpfer durch das menschliche Auge weiterhin erfasst werden können (Abbildung 10). Derartige Anomalien können die Erkennungsgüte eines KI-Systems jedoch stark beeinträchtigen.

Individuelles Kamerahandling des Operators

Bildauflösung und Brennweite

Selbstversuch: Video ist nicht gleich Video
Abschließend möchten wir Sie als Leser dazu animieren, beliebig gewählte Videos aus Ihrem Kanalinspektionsfundus, sofern vorhanden, mit den Kernaussagen dieses Artikels im Hinterkopf zu betrachten. Möglicherweise entdecken Sie ähnliche optische Unregelmäßigkeiten, die in der Zustandsfeststellung eine Herausforderung für Mensch und/oder Maschine darstellen.

Fazit und Ausblick
Die erläuterten Inhomogenitäten in den Videodaten von Haltungsinspektionen belegen, dass die Übersetzung von Bildmaterial in eine vollumfängliche Zustandskodierung eine sehr anspruchsvolle Aufgabe darstellt. Insbesondere wird deutlich, dass zahlreiche fachtechnische Zusammenhänge über die reine Bildverarbeitung hinaus mit in den Dokumentationsprozess einbezogen werden müssen.

Für KI-basierte Kodierung der Videodaten von Schächten und Anschlussleitungen ist aus unserer Sicht ein noch höheres Anforderungslevel zu erwarten, da die Objekte selbst variablere, unberechenbarere Eigenschaften aufweisen. So sind Inspektionen insbesondere von Anschlussleitungen sehr heterogen, aufgrund ihrer dreidimensionalen Verläufe, kleinen Durchmesser, komplexen Schadensgeometrien und der daraus resultierenden, schwierigen Kameraführung.

Im Teil 3 der Fachartikelserie möchten wir beleuchten, inwieweit die Welt der KI-Entwickler eine Herausforderung in den geschilderten Aspekten sieht und wie damit umgegangen wird. In diesem Zuge werden wir diverse KI-Systeme detaillierter vorstellen.

Autor: Marco Deubler, Leiter KI-Implementierung, ISAS GmbH
Rohrpost abonnieren!
Wir graben für Sie nach Neuigkeiten. Die Ergebnisse gibt es bei uns im Newsletter.
Jetzt anmelden!


Lesen Sie auch:
Weiterlesen:
Neueste Beiträge:
Meistgelesene Artikel
Für welche Leistungsart interessieren Sie sich?


Bauleistungen


Dienstleistungen


Lieferleistungen
Verwandte Bau-Themen:
Top Bau-Themen:
Aktuelle Termine für unterirdische Infrastruktur
Alle wichtigen Termine für unterirdische Infrastruktur
Jetzt zum Newsletter anmelden:
Leitungsbau, Kanalsanierung, Abwasser – erfahren Sie das wichtigste rund ums Thema unterirdische Infrastruktur.