Wissensdatenbank Wirtschaftsrecht: TutoriumBildverarbeitungMustererkennungSoSe19

Version [95310]

Dies ist eine alte Version von TutoriumBildverarbeitungMustererkennungSoSe19 erstellt von MoD am 2019-08-13 20:27:05.

Die Hough-Transformation ist ein robustes globales Verfahren zur Erkennung von Geraden, Kreisen oder beliebigen anderen parametrisierbaren geometrischen Figuren in einem binären Gradientenbild, also einem Schwarz-Weiß-Bild, nach einer Kantenerkennung. Das Verfahren wurde 1962 von Paul V. C. Hough unter dem Namen „Method and Means for Recognizing Complex Patterns“ patentiert.

Zur Erkennung von geometrischen Objekten wird ein Dualraum erschaffen (speziell: Parameterraum, Hough-Raum), in den für jeden Punkt im Bild, der auf einer Kante liegt, alle möglichen Parameter der zu findenden Figur im Dualraum eingetragen werden. Jeder Punkt im Dualraum entspricht damit einem geometrischen Objekt im Bildraum. Bei der Geraden kann das z. B. die Steigung und der formel
&#121
formel Geradenerkennung formel
&#121
formel
-Achse parallele Geraden eine unendliche Steigung haben und daher im (für die Berechnung zwangsläufig) endlichen Parameterraum nicht mehr abgebildet werden können. Dieses Problem kann man umgehen, wenn man eine zweite Hough-Transformation auf dem um 90° gedrehten Bildraum durchführt, was aber recht umständlich ist. In der neueren Literatur überwiegt daher der Ansatz, Geraden durch ihre hessesche Normalform zu repräsentieren. Als Parameter wählt man den Winkel
formel
&#945
formel
und den (euklidischen) Abstand
formel
&#100
formel
, wobei
formel
&#945
formel
der Winkel zwischen der Normalen der Gerade (= Lot) und der
formel
&#120
formel
-Achse ist, und
formel
&#100
formel
den Abstand vom Ursprung zum Lotfußpunkt auf der Gerade bezeichnet.

Damit haben wir die Parametergleichung formel
&#100&#61&#120&#183&#99&#111&#115&#40&#945&#41&#43&#121&#183&#115&#105&#110&#40&#945&#41
formel
, mit der wir für alle Punkte auf Kanten im Bild die entsprechende Kurve im Dualraum einzeichnen. Dabei bezeichnen
formel
&#945
formel
und
formel
&#100
formel
die Variablen, während
formel
&#120
formel
und
formel
&#121
formel
jetzt zu Parametern umfunktioniert wurden.
formel
&#120
formel
und
formel
&#121
formel
sind die Koordinaten der vorher detektierten Kantenpunkte. Das Ausgangsbild wird zunächst einem Kantendetektor-Algorithmus unterzogen (z. B. Canny- oder Sobel-Filter) und dadurch der zu untersuchende Punktraum auf mögliche Kanten eingeschränkt.

Der Dualraum wird nun also von formel
&#945
formel
und
formel
&#100
formel
aufgespannt. Zu jedem errechneten Wert
formel
&#100
formel
wird jetzt im Dualraum (repräsentiert als Matrix) an der Stelle
formel
&#40&#945&#124&#100&#41
formel
der Wert um 1 erhöht, also quasi für die dadurch repräsentierte Gerade „gevotet“. Deshalb nennt man die Matrix auch oft „Voting-Matrix“.

Der nächste Schritt besteht in der Analyse des Dualraums, bei der man nach Häufungspunkten in der Voting-Matrix sucht. Diese Häufungspunkte im Dualraum repräsentieren mögliche Geraden im Bildraum, da sie offensichtlich unter dem gleichen Winkel formel
&#945
formel
mit der gleichen Entfernung
formel
&#100
formel Probabilistische Hough Linien Transformation formel
&#109
formel
Kantenpunkten aus den eingestellten
formel
&#77
formel
Kantenpunkten. Die Komplexität der Abstimmungsstufe reduziert sich von
formel
&#79&#40&#77&#46&#78_&#952&#41
formel
auf
formel
&#79&#40&#109&#46&#78_&#952&#41
formel
. Dies funktioniert, weil eine zufällige Teilmenge von
formel
&#77
formel
die Kantenpunkte und das umgebende Rauschen und die Verzerrung weitgehend repräsentiert.

Ein kleinerer Wert von m führt zu einer schnellen Berechnung bei geringerer Genauigkeit. Daher sollte der Wert von formel
&#109
formel
in Bezug auf
formel
&#77
formel
entsprechend gewählt werden.

Kiryati et al. führten eine Analyse durch, die auf das Vorhandensein eines Schwelleneffekts für den Wert von formel
&#109
formel
schloss. Werte von
formel
&#109
formel
unterhalb der Schwelle lieferten schlechte Ergebnisse, während Werte oberhalb der Schwelle sehr gute Ergebnisse lieferten. Dieser Schwelleneffekt wurde experimentell bestätigt, wobei gute Ergebnisse erzielt wurden, wobei nur 2% der Kantenpunkte erfasst wurden. Der Wert von
formel
&#109
formel Durchführung formel
&#40&#109&#44&#98&#41
formel

Im Polarkoordinatensystem: Parameter: formel
&#40&#114&#44&#952&#41
formel

Für Hough Transforms werden wir Linien im Polarsystem ausdrücken. Daher kann eine Liniengleichung wie folgt beschrieben werden:

(image: https://hssm.hqedv.de/uploads/TutoriumBildverarbeitungMustererkennungSoSe19/hough_formula1.png)

Umgeformt/umgestellt:

(image: https://hssm.hqedv.de/uploads/TutoriumBildverarbeitungMustererkennungSoSe19/hough_formula2.png)

(image: https://hssm.hqedv.de/uploads/TutoriumBildverarbeitungMustererkennungSoSe19/hough1.jpg)

Im Allgemeinen können wir für jeden Punkt formel
&#40&#120_&#48&#44&#121_&#48&#41
formel
die Familie der Linien, die durch diesen Punkt verläuft, festlegen als:
formel
&#114_&#952&#61&#120_&#48&#183&#99&#111&#115&#40&#952&#41&#43&#121_&#48&#183&#115&#105&#110&#40&#952&#41
formel
Das bedeutet, dass jedes Paar
formel
&#40&#114_&#952&#44&#952&#41
formel
jede Zeile repräsentiert, die an
formel
&#40&#120_&#48&#44&#121_&#48&#41
formel
vorbeikommt. Wenn wir für einen gegebenen
formel
&#40&#120_&#48&#44&#121_&#48&#41
formel
die Familie der Linien zeichnen, die durch ihn hindurchgeht, erhalten wir ein Sinusoid. Zum Beispiel erhalten wir für
formel
&#120&#61&#56
formel
und
formel
&#121&#61&#54
formel
die folgende Darstellung (in einer Ebene
formel
&#952&#45&#114
formel
):

(image: https://hssm.hqedv.de/uploads/TutoriumBildverarbeitungMustererkennungSoSe19/hough2.jpg)

Wir berücksichtigen nur Punkte, bei denen formel

&#114&#62&#48

formel

und

formel

&#48&#60&#952&#60&#50&#960

formel

.

Wir können die gleiche Operation für alle Punkte in einem Bild durchführen. Wenn sich die Kurven zweier verschiedener Punkte in der Ebene formel
&#952&#45&#114
formel
schneiden, bedeutet das, dass beide Punkte zu einer gleichen Linie gehören. Zum Beispiel, wenn wir dem obigen Beispiel folgen und die Grafik für zwei weitere Punkte zeichnen:
formel
&#120_&#49&#61&#52
formel
,
formel
&#121_&#49&#61&#57
formel
und
formel
&#120_&#50&#61&#49&#50
formel
,
formel
&#121_&#50&#61&#51
formel
, erhalten wir:

(image: https://hssm.hqedv.de/uploads/TutoriumBildverarbeitungMustererkennungSoSe19/hough3.jpg)

Die drei Diagramme schneiden sich in einem einzigen Punkt formel

&#40&#48&#46&#57&#50&#53&#44&#57&#46&#54&#41

formel

, diese Koordinaten sind die Parameter

formel

&#40&#952&#44&#114&#41

formel

oder die Linie, auf der

formel

&#40&#120_&#48&#44&#121_&#48&#41

formel

,

formel

&#40&#120_&#49&#44&#121_&#49&#41

formel

und

formel

&#40&#120_&#50&#44&#121_&#50&#41

formel

.

Das bedeutet im Allgemeinen, dass eine Linie erkannt werden kann, indem man die Anzahl der Schnittpunkte zwischen den Kurven ermittelt, und je mehr Kurven sich schneiden, desto mehr Punkte hat die durch diesen Schnittpunkt dargestellte Linie. Im Allgemeinen können wir einen Schwellenwert für die minimale Anzahl von Schnittpunkten definieren, die zum Erkennen einer Linie erforderlich sind.

Das ist es, was die Hough Line Transformation bewirkt. Es verfolgt den Schnittpunkt der Kurven jedes Punktes im Bild. Wenn die Anzahl der Kreuzungen über einem Schwellenwert liegt, wird sie als Linie mit den Parametern formel
&#40&#952&#44&#114_&#952&#41
formel Einfacher Algorithmus

max_d := sqrt ((bildhöhe)^2 + (bildbreite)^2)
min_d := max_d * -1
houghRaum[0…π][min_d…max_d] := 0
foreach pixel != 0 do
for α := 0 to π do
d := pixelx * cos (α) + pixely * sin (α)
houghRaum[α][d]++
end
end

Resultate HLT und PHLT

Kreise und generalisierte Hough-Transformation formel
&#40&#120&#44&#121&#41
formel
-Koordinaten in beiden Fällen die Lage des Kreismittelpunktes beschreiben. Zusätzlich dazu ist laut der Kreisgleichung
formel
&#120^&#50&#43&#121^&#50&#61&#114^&#50
formel
der Radius
formel
&#114
formel
der dritte Parameter, der beachtet werden muss. Man spricht bei Kreisen daher von einem 3-dimensionalen Hough-Raum
formel
&#40&#120&#99&#44&#121&#99&#44&#114&#41
formel Resultate HCT
- Als Wavelet-Transformation (WT, englisch wavelet transform) wird eine Familie von linearen Zeit-Frequenz-Transformationen in der Mathematik und den Ingenieurwissenschaften (primär: Nachrichtentechnik, Informatik) bezeichnet. Die WT setzt sich zusammen aus der Wavelet-Analyse, welche den Übergang der Zeitdarstellung in die Spektral- bzw. Waveletdarstellung bezeichnet, und der Wavelet-Synthese, welche die Rücktransformation der Wavelettransformierten in die Zeitdarstellung bezeichnet.
- Der Begriff Wavelet bezeichnet die für die Transformation benutzte Basisfunktion, mit der das zu analysierende Signal oder Bild – im Allgemeinen eine N-dimensionale Funktion – „verglichen“ wird.
- Die Wurzeln der Waveletschule liegen in Frankreich, wo auch der ursprünglich französische Begriff ondelette geprägt wurde, dessen englisches Pendant wavelet sich jedoch später als Bezeichnung durchgesetzt hat. Ins Deutsche übersetzt bedeutet Wavelet so viel wie kleine Welle oder Wellchen und drückt den Umstand aus, dass man im Gegensatz zur Fourier-Transformation zeitlich lokalisierte Wellen bzw. Funktionen als Basis benutzt, wodurch die eingangs erwähnte Zeit- und Frequenzauflösung möglich wird. Wie alle linearen Zeit-Frequenz-Transformationen unterliegt auch die Wavelettransformierte der Unschärferelation der Nachrichtentechnik, d. h. ein Ereignis kann nicht gleichzeitig beliebig genau in Zeit und Frequenz lokalisiert werden. Es gibt immer nur einen Kompromiss aus guter zeitlicher Auflösung oder guter Auflösung im Frequenzbereich.
- Die Wavelet-Transformation unterteilt sich in erster Linie in zwei Lager, nämlich die kontinuierliche Wavelet-Transformation, welche ihre Hauptanwendung in der Mathematik und der Datenanalyse hat, und die diskrete Wavelet-Transformation, welche eher in den Ingenieurswissenschaften zu finden ist und deren Anwendung im Bereich der Datenreduktion, Datenkompression und Signalverarbeitung liegt.
- Die Diskrete Wavelet-Transformation oder DWT ist eine Wavelet-Transformation, die zeit- und frequenzdiskret durchgeführt wird.
- Die Wavelet-Analyse kann verwendet werden, um die Informationen eines Bildes in Approximations- und Detail-Subsignal zu unterteilen.
- Das Approximations-Subsignal zeigt den allgemeinen Trend der Pixelwerte und drei Detail-Subsignale auf den horizontalen, vertikalen und diagonalen Details.
- Wenn diese Details klein sind, können sie auf Null gesetzt werden, ohne dass sich das Bild wesentlich verändert. Dadurch können Filterung und Kompression erreicht werden.
Wavelets

Zerlegung 2D DWT

Darstellung

Rekonstruktion 2D DWT

Nyquist-Shannon-Abtasttheorem formel
&#102_{&#109&#97&#120}
formel
enthält, durch eine beliebige Reihe von Funktionswerten im Abstand
formel
&#964&#60{&#49 \above 1pt &#50&#102_{&#109&#97&#120}}
formel
eindeutig bestimmt ist. Eine hinreichende Bedingung dafür ist die Quadratintegrierbarkeit der Funktion.

Der Funktionsverlauf kann dann rekonstruiert werden, indem jeder Abtastwert formel
&#120&#770&#40&#107&#964&#41
formel
durch eine sinc-Funktion
formel
&#115&#105&#40&#50&#960&#102_{&#109&#97&#120}&#40&#116&#45&#107&#964&#41&#41&#183&#120&#770&#40&#107&#964&#41
formel
mit gleicher Amplitude ersetzt und anschließend über alle
formel
&#107
formel
aufsummiert wird.

In der Signalverarbeitung entspricht dies der Abtastung mit einer Abtastrate formel
&#102_{&#97&#98&#116&#97&#115&#116}&#62&#50&#102_{&#109&#97&#120}
formel
. Die so erhaltene Signaldarstellung wird Pulsamplitudenmodulation genannt. Zur Rekonstruktion wird dieses Signal durch einen idealen Tiefpass mit Grenzfrequenz
formel
&#102_{&#109&#97&#120}
formel
gefiltert.

Bei Nicht-Basisband-Signalen, d. h. solchen mit minimaler Frequenz formel
&#102_{&#109&#105&#110}
formel Quellen

https://de.wikipedia.org/wiki/Hough-Transformation
https://docs.opencv.org/2.4/doc/tutorials/imgproc/imgtrans/hough_lines/hough_lines.html
https://de.wikipedia.org/wiki/Wavelet-Transformation#Diskrete_Wavelet-Transformation
https://de.wikipedia.org/wiki/Nyquist-Shannon-Abtasttheorem

CategoryTutorienFKITWS1819 ;CategoryTutorienFKITSS18

Diese Seite wurde noch nicht kommentiert.

Alle Kategorien:
Forschungsdatenbank
Lehrveranstaltungen
Lexikon
Literatur
Rechtsgebiete
Rechtsprechung
Service
Studium F H S
Wissensmanagement