Znikający punkt - Vanishing point

Na drugim końcu tej linii kolejowej widać znikający punkt.

Punkt znikające jest punkt na płaszczyźnie obrazu z widoku perspektywicznym , gdzie dwuwymiarowe rzuty perspektywiczne (lub rysunki) wzajemnie równoległych linii w przestrzeni trójwymiarowej wydaje się zbieżne. Gdy układ równoległych linii jest prostopadły do płaszczyzny obrazu , konstrukcja nazywana jest perspektywą jednopunktową, a ich punkt zbiegu odpowiada oculusowi , czyli „punktowi oka”, z którego obraz powinien być oglądany pod kątem prawidłowej geometrii perspektywy. Tradycyjne rysunki liniowe wykorzystują obiekty z jednym do trzech zestawów równoległości, definiując jeden do trzech punktów zbiegu.

Notacja wektorowa

Konstrukcja 2D widoku perspektywicznego, pokazująca powstawanie znikającego punktu

Punkt zbiegu może być również określany jako „punkt kierunkowy”, ponieważ linie mające ten sam wektor kierunkowy, powiedzmy D , będą miały ten sam punkt zbiegu. Matematycznie niech q ≡ ( x , y , f ) będzie punktem leżącym na płaszczyźnie obrazu, gdzie f jest ogniskową (kamery powiązanej z obrazem), a v q ≡ ( x/h, tak/h, F/h) będzie wektorem jednostkowym powiązanym z q , gdzie h = x 2 + y 2 + f 2 . Jeśli weźmiemy pod uwagę prostą w przestrzeni S z wersorem n s ≡ ( n x , n y , n z ) i jej zbiegiem v s , wersor powiązany z v s jest równy n s , zakładając oba punkty w kierunku płaszczyzna obrazu.

Gdy płaszczyzna obrazu jest równoległa do dwóch osi współrzędnych świata, linie równoległe do osi przeciętej przez tę płaszczyznę obrazu będą miały obrazy, które spotykają się w jednym punkcie zbiegu. Linie równoległe do pozostałych dwóch osi nie będą tworzyć punktów zbiegu, ponieważ są równoległe do płaszczyzny obrazu. To jest perspektywa jednopunktowa. Podobnie, gdy płaszczyzna obrazu przecina dwie osie współrzędnych świata, linie równoległe do tych płaszczyzn spotkają się tworząc dwa znikające punkty na płaszczyźnie obrazu. Nazywa się to perspektywą dwupunktową. W perspektywie trzypunktowej płaszczyzna obrazu przecina osie x , y i z , a zatem linie równoległe do tych osi przecinają się, w wyniku czego powstają trzy różne punkty zbiegu.

Twierdzenie

Znikający punkt twierdzenie jest głównym twierdzenie w nauce perspektywy. Mówi ona, że ​​obraz w płaszczyźnie obrazu π prostej L w przestrzeni, nierównoległej do obrazu, jest określony przez jego przecięcie z π i jego znikającym punktem. Niektórzy autorzy użyli sformułowania „obraz linii zawiera jej znikający punkt”. Guidobaldo del Monte podał kilka weryfikacji, a Humphry Ditton nazwał wynik „główną i wielką propozycją”. Brook Taylor napisał pierwszą książkę w języku angielskim na temat perspektywy w 1714 roku, która wprowadziła termin „punkt zbiegu” i jako pierwsza w pełni wyjaśnił geometrię perspektywy wielopunktowej, a historyk Kirsti Andersen skompilował te obserwacje. Zauważa, że ​​pod względem geometrii rzutowej punkt zbiegu jest obrazem punktu w nieskończoności związanego z L , ponieważ linia wzroku od O przez punkt zbiegu jest równoległa do L .

Znikająca linia

Tak jak znikający punkt ma początek w linii, tak znikająca linia ma swój początek w płaszczyźnie α, która nie jest równoległa do obrazu π . Mając punkt oka O , a β płaszczyznę równoległą do α i leżącą na O , to znikająca linia α to βπ . Na przykład, gdy α jest płaszczyzną podłoża, a β jest płaszczyzną horyzontu, to znikająca linia α jest linią horyzontu βπ . Anderson zauważa: „Występuje tylko jedna konkretna linia znikania, często określana jako „horyzont”.

Mówiąc prościej, znikającą linię jakiejś płaszczyzny, powiedzmy α , otrzymujemy przez przecięcie płaszczyzny obrazu z inną płaszczyzną, powiedzmy β , równoległą do płaszczyzny zainteresowania ( α ), przechodzącą przez środek kamery. Dla różnych zestawów linii równoległych do tej płaszczyzny α ich odpowiednie punkty zbiegu będą leżeć na tej linii zbiegu. Linia horyzontu to teoretyczna linia, która reprezentuje poziom oczu obserwatora. Jeśli obiekt znajduje się poniżej linii horyzontu, jego znikające linie są ustawione pod kątem do linii horyzontu. Jeśli obiekt znajduje się powyżej, opadają w dół. Wszystkie znikające linie kończą się na linii horyzontu.

Właściwości znikających punktów

1. Rzuty dwóch zestawów równoległych linii leżących w pewnej płaszczyźnie π A wydają się zbiegać, tj. punkt zbiegu związany z tą parą na linii horyzontu lub linii zbiegu H utworzonej przez przecięcie płaszczyzny obrazu z płaszczyzną równoległą do π A i przechodząc przez otworek. Dowód: Rozważ płaszczyznę podłoża π , ponieważ y = c, która jest, dla uproszczenia, prostopadła do płaszczyzny obrazu. Rozważmy również prostą L leżącą w płaszczyźnie π , która jest zdefiniowana równaniem ax + bz = d . Korzystając z perspektywicznych rzutów otworkowych, punkt na L rzutowany na płaszczyznę obrazu będzie miał współrzędne zdefiniowane jako,

x′ = f ·x/z= f ·dbz/Az
y′ = f ·tak/z= f ·C/z

Jest to reprezentacja parametryczna obrazu L ' z linią L z Z jako parametr. Gdy z → −∞ zatrzymuje się w punkcie ( x′ , y′ ) = (−pełne wyżywienie/a,0) na osi x′ płaszczyzny obrazu. Jest to punkt zbiegu odpowiadający wszystkim liniom równoległym o nachyleniu b/aw płaszczyźnie π . Wszystkie punkty zbiegu związane z różnymi liniami o różnych nachyleniach należące do płaszczyzny π będą leżeć na osi x′ , która w tym przypadku jest linią horyzontu.

2. Niech A , B i C będą trzema prostopadłymi do siebie prostymi w przestrzeni i v A ≡ ( x A , y A , f ) , v B ≡ ( x B , y B , f ) , v C ≡ ( x C , y C , f ) będą odpowiednio trzema odpowiednimi punktami zbiegu. Jeśli znamy współrzędne jednego z tych punktów, powiedzmy v A , i kierunek prostej na płaszczyźnie obrazu, która przechodzi przez drugi punkt, powiedzmy v B , możemy obliczyć współrzędne zarówno v B jak i v C

3. Niech A , B i C będą trzema prostopadłymi do siebie prostymi w przestrzeni i v A ≡ ( x A , y A , f ) , v B ≡ ( x B , y B , f ) , v C ≡ ( x C , y C , f ) będą odpowiednio trzema odpowiednimi punktami zbiegu. Ortocentrum trójkąta z wierzchołkami w trzech znikających punktach jest przecięciem osi optycznej i płaszczyzny obrazu.

Perspektywa krzywoliniowa i odwrócona

Krzywoliniowy perspektywiczny rysunek w 4 lub 5 punktów zbiegu. W perspektywie 5-punktowej punkty zbiegu są odwzorowane w okrąg z 4 punktami zbiegu w nagłówkach kardynalnych N, W, S, E i jednym na początku okręgu.

Odwrotna perspektywa jest rysunkiem z znikające punkty, które są umieszczone na zewnątrz obraz z iluzji, że są one „przed” malarstwa.

Wykrywanie znikających punktów

Kilka metod wykrywania znikających punktów wykorzystuje segmenty linii wykryte na obrazach. Inne techniki obejmują bezpośrednie uwzględnienie gradientów intensywności pikseli obrazu.

Na obrazie występuje znacznie duża liczba znikających punktów. Dlatego celem jest wykrycie znikających punktów, które odpowiadają głównym kierunkom sceny. Zwykle odbywa się to w dwóch etapach. Pierwszy krok, jak sama nazwa wskazuje, nazywany krokiem akumulacji, grupuje odcinki linii przy założeniu, że klaster będzie miał wspólny punkt zbiegu. Następny krok znajduje główne skupienia obecne na scenie i dlatego nazywa się to krokiem wyszukiwania.

W kroku akumulacji obraz jest mapowany na ograniczoną przestrzeń zwaną przestrzenią akumulacji. Przestrzeń akumulatora podzielona jest na jednostki zwane komórkami. Barnard założył, że ta przestrzeń to sfera Gaussa wyśrodkowana w optycznym środku kamery jako przestrzeń akumulacyjna. Odcinek linii na obrazie odpowiada wielkiemu okręgowi na tej sferze, a znikający punkt na obrazie jest odwzorowany na punkt. Sfera Gaussa ma komórki akumulacyjne, które zwiększają się, gdy przechodzi przez nie wielkie koło, tj. na obrazie odcinek linii przecina znikający punkt. Od tego czasu wprowadzono kilka modyfikacji, ale jedną z najbardziej wydajnych technik było użycie transformacji Hough , mapującej parametry odcinka linii do przestrzeni ograniczonej. Kaskadowe transformacje Hougha zostały zastosowane dla wielu punktów zbiegu.

Proces odwzorowania obrazu na przestrzenie ograniczone powoduje utratę rzeczywistych odległości między odcinkami linii a punktami.

W kroku wyszukiwania znajduje się komórka akumulatora z maksymalną liczbą przechodzących przez nią segmentów linii. Po tym następuje usunięcie tych segmentów linii, a etap wyszukiwania jest powtarzany, aż ta liczba spadnie poniżej pewnego progu. Ponieważ dostępna jest większa moc obliczeniowa, można znaleźć punkty odpowiadające dwóm lub trzem wzajemnie ortogonalnym kierunkom.

Zastosowania znikających punktów

Wykorzystanie współczynników krzyżowych w geometrii rzutowej do pomiaru rzeczywistych wymiarów obiektów przedstawionych w rzucie perspektywicznym . A, B, C, D i V to punkty na obrazie, ich separacja podana w pikselach; A', B', C' i D' są w świecie rzeczywistym, ich odległość w metrach.
  • W (1) szerokość bocznej ulicy W jest obliczana ze znanych szerokości sąsiednich sklepów.
  • W (2) szerokość tylko jednego sklepu jest potrzebna, ponieważ widoczny jest punkt zbiegu , V.
  1. Kalibracja kamery: Znikające punkty obrazu zawierają ważne informacje dotyczące kalibracji kamery. Wprowadzono różne techniki kalibracji, wykorzystując właściwości punktów zbiegu w celu znalezienia wewnętrznych i zewnętrznych parametrów kalibracji.
  2. Rekonstrukcja 3D : środowisko stworzone przez człowieka ma dwie główne cechy – kilka linii w scenie jest równoległych, a wiele obecnych krawędzi jest ortogonalnych. Znikające punkty pomagają zrozumieć otoczenie. Używając zestawów równoległych linii w płaszczyźnie, orientację płaszczyzny można obliczyć za pomocą punktów zbiegu. Torre i Coelho przeprowadzili szeroko zakrojone badania dotyczące wykorzystania punktów zbiegu w celu wdrożenia pełnego systemu. Przy założeniu, że otoczenie składa się z obiektów o tylko równoległych lub prostopadłych bokach, zwanych również Lego-landem, wykorzystując punkty zbiegu skonstruowane na pojedynczym obrazie sceny, odzyskali geometrię 3D sceny. Podobne pomysły są również wykorzystywane w dziedzinie robotyki, głównie w pojazdach nawigacyjnych i autonomicznych oraz w obszarach związanych z wykrywaniem obiektów .

Zobacz też

Bibliografia

Zewnętrzne linki