Bezpośrednie wprowadzanie głosowe - Direct voice input

Bezpośrednie wprowadzanie głosowe ( DVI ) (czasami nazywane sterowaniem głosowym ( VIC )) to styl interakcji człowiek-maszyna „HMI”, w którym użytkownik wydaje polecenia głosowe, aby wydać instrukcje do maszyny .

DVI został wprowadzony w kokpitach kilku nowoczesnych samolotów wojskowych, takich jak Eurofighter Typhoon , Lockheed Martin F-35 Lightning II , Dassault Rafale i Saab JAS 39 Gripen . Takie systemy były również wykorzystywane do różnych innych celów, w tym przemysłowych systemów sterowania i wspomagania rozpoznawania mowy dla osób z upośledzeniem.

Przegląd

Systemy DVI można podzielić na dwie główne kategorie funkcjonalności: „zależne od użytkownika” lub „niezależne od użytkownika”. System zależny od użytkownika wymaga, aby osobisty szablon głosu był generowany dla określonej osoby; szablon dla tej osoby musi zostać załadowany na przypisaną do niej maszynę przed użyciem systemu DVI, aby działała ona prawidłowo. W przeciwieństwie do tego, system niezależny od użytkownika nie wymaga żadnego osobistego szablonu głosowego, mając na celu prawidłowe reagowanie na głos dowolnego użytkownika. Można je również podzielić na kategorie „rozpoznawanie dyskretne” i „rozpoznawanie ciągłe”. Użytkownicy systemu dyskretnego rozpoznawania mowy muszą robić przerwy między każdym słowem, aby system DVI mógł zidentyfikować rozróżnienia między każdym słowem, podczas gdy system ciągłego rozpoznawania mowy jest w stanie zrozumieć normalną szybkość mowy.

W połowie 2000 roku naukowcy z National Aerospace Laboratory w Holandii zbadali zastosowanie DVI w symulatorze „GRACE”; W kolejnym eksperymencie uczestniczyło łącznie dwunastu pilotów. Przeprowadzone testy ujawniły podobno, że chociaż sam sprzęt działał dobrze, kilka ulepszeń było pożądanych przed wdrożeniem na samolotach w świecie rzeczywistym, ponieważ operacje DVI faktycznie zajmowały więcej czasu w porównaniu z tradycyjnymi istniejącymi metodami. Zalecenia dotyczące ulepszeń obejmowały przyjęcie prostszej składni , osiągnięcie większego wskaźnika rozpoznawalności i skrócenie czasu odpowiedzi; wszystkie napotkane problemy miały charakter technologiczny i uznano, że można je rozwiązać. Naukowcy doszli do wniosku, że w kokpitach, zwłaszcza w sytuacjach awaryjnych, w których piloci muszą działać całkowicie samodzielnie, system DVI może być bardzo istotny, ale nie miał on kluczowego znaczenia w większości innych możliwych scenariuszy.

W tym samym czasie w ramach koordynowanego przez Unię Europejską projektu SafeSound prowadzono ewaluacje systemów DVI na potrzeby lotnictwa cywilnego . Polegał on na obserwacji obciążenia pracą pilota w rzeczywistych kokpitach i zestawieniu go z aktywnością pilota w symulatorach lotu, wykorzystujących zarówno systemy konwencjonalne, jak i wspomaganie DVI. Projekt miał na celu poprawę bezpieczeństwa lotniczego i zmniejszenie obciążenia pracą zarówno w operacjach naziemnych, jak i lotniczych poprzez zastosowanie ulepszonych funkcji audio.

Aplikacje

Lotnictwo

Przed powszechnym wdrożeniem kilka konwencjonalnych samolotów wojskowych zostało przekonwertowanych na próbne systemy DVI; przykłady obejmują Harrier AV-8B i F-16 VISTA . W innym przypadku symulator General Dynamics F-16 Fighting Falcon został zmodyfikowany za pomocą DVI na potrzeby badania sterowania głosem, które zostało przeprowadzone przez Królewskie Holenderskie Siły Powietrzne . Testy DVI przeprowadzono również na śmigłowcach , w tym Boeing AH-64 Apache , pokazując potencjał poprawy bezpieczeństwa lotów i skuteczności misji.

Wiele nowoczesnych myśliwców zostało wyposażonych w systemy DVI, często w połączeniu z różnymi innymi schematami interfejsu człowiek-maszyna, takimi jak sterowanie zgodne z HOTAS i inne zaawansowane technologie sterowania. Połączenie schematów sterowania Voice i HOTAS jest czasami określane jako koncepcja „V-TAS”. Wybitnym myśliwcem wyposażonym w kokpit V-TAS jest Eurofighter Typhoon . Lockheed Martin F-35 Lightning II posiada również system DVI, który został opracowany przez Adacel . Inne przykłady obejmują Dassault Rafale i Saab JAS 39 Gripen .

W wielu samolotach przewidziano wykorzystanie DVI. W pewnym momencie Siły Powietrzne Stanów Zjednoczonych próbowały zintegrować DVI z samolotem Lockheed Martin F-22 Raptor ; Ostatecznie jednak uznano, że technologia ta stwarza zbyt wiele zagrożeń technicznych w tamtym momencie, w związku z czym zaniechano takich wysiłków.

Osobisty

Do 1990 r. Demonstrowano działające prototypy cyfrowych systemów rozpoznawania słów; były one promowane w celu zapewnienia efektywnego interfejsu człowiek-maszyna dla osób z upośledzonymi mówcami mówiącymi. Zastosowane techniki obejmowały zakodowaną w czasie cyfrową mowę i automatyczny wybór zestawu tokenów. Badania tych wczesnych systemów DVI podobno obejmowały zastosowanie automatycznych rutynowych procedur diagnostycznych i badań na ograniczoną skalę z udziałem ochotników.

W 2010 roku różne firmy oferowały ogółowi społeczeństwa systemy rozpoznawania głosu. Jednym z przykładów jest usługa Google Voice , która umożliwia użytkownikom zadawanie pytań za pośrednictwem pakietu DVI zainstalowanego na komputerze osobistym , tablecie lub telefonie komórkowym . Opracowano wielu asystentów cyfrowych , takich jak Amazon Echo , Siri i Cortana , które używają DVI do interakcji z użytkownikami.

Reklama w telewizji

Technologia DVI umożliwiła szerokie zastosowanie automatycznych systemów telefonicznych . Wiele firm zwykle korzysta ze scentralizowanych systemów telefonicznych, które kierują dzwoniących do właściwego działu za pomocą takich metod. Różni producenci samochodów również wyposażyli swoje pojazdy drogowe w systemy DVI; zazwyczaj umożliwiają one kierowcom sterowanie systemami informacyjno-rozrywkowymi i interakcję z telefonami komórkowymi z większą wygodą niż starsze metody.

W późnych latach 80. trwały badania nad wykorzystaniem systemów DVI do sterowania maszynami CNC i innymi urządzeniami produkcyjnymi. W latach 2010 takie systemy były wykorzystywane do celów logistycznych i magazynowych.

Bibliografia

  1. ^ Jarrett, DN (2005), Cockpit Engineering. Aldershot, Ashgate Publishing Limited ISBN   978-0-7546-1751-8 .
  2. ^ a b c d e "Rozpoznawanie głosu" . computerhope.com. 16 maja 2020 r.
  3. ^ Zon, GDR and Roerdink, MI, (2007), Using Voice to Control the Civil Flightdeck , Report NLR-TP-2006-720, (Ten raport jest oparty na prezentacji, która odbyła się w HCI Aero, Seattle, USA, 20– 22 września 2006). [1] Zarchiwizowano 04.03.2016 w Wayback Machine
  4. ^ „Warsztaty na temat przyszłych projektów stacji sterowania i problemów związanych z wydajnością człowieka w elektrowniach jądrowych” . Międzynarodowa Agencja Energii Atomowej (MAEA). 8–10 maja 2006 r., S. 296–320.
  5. ^ a b Gibbon, D ,, Mertins, I. and Moore, RK (2000) „Handbook of Multimodal and Spoken Dialogue Systems Resources, Terminology and Product Evaluation” (The Springer International Series in Engineering and Computer Science, tom 565), Massachusetts, Kluwer Academic Publishers ISBN   978-0-7923-7904-1
  6. ^ Hunter, Donald James (grudzień 2003). „Identyfikacja zadań załogi w celu korzystania z bezpośredniego wprowadzania głosowego (DVI) w celu zmniejszenia obciążenia pilota w AH-64D Apache Longbow” . trace.tennessee.edu.
  7. ^ Herdman, Chris., Johannsdottir, Kamilla., Lessard, Lynda., Jarmasz, Jerzy., Churchill, Laura and Farrell, Philip (styczeń 2001). „Uwagę zwraca korzyści i koszty związane z integracją systemu bezpośredniego wprowadzania głosu (DVI) w środowisku helikoptera z załogą wieloosobową” . CS1 maint: używa parametru autorów ( link )
  8. ^ Owen, Paul S. "Kokpit Eurofightera". Eurofighter-typhoon.co.uk 7 grudnia 1997. Pobrano: 28 listopada 2009. Zarchiwizowano 28 sierpnia 2008 w Wayback Machine
  9. ^ Schutte, John (10 października 2007). „Naukowcy dostrajają system mowy pilot-samolot F-35” . af.mil . Siły Powietrzne Stanów Zjednoczonych. Zarchiwizowane od oryginału w dniu 23 kwietnia 2016 r.
  10. ^ Goebel, Greg. „Lockheed Martin F-22 Raptor”. airvectors.net, 1 lipca 2011. Źródło: 10 listopada 2012.
  11. ^ a b A. G. Warner, RD Hughes i RA King (1990). „Strategia interfejsu człowiek-maszyna z bezpośrednim wprowadzaniem głosu, zapewniająca dostęp głosowy dla głośników o poważnych wadach” . Konferencja UK IT 1990. pp. 279–285. CS1 maint: używa parametru autorów ( link )
  12. ^ JY Zhu i CG Xu (07 stycznia 1988). „Badanie dotyczące systemu wprowadzania głosu dla obrabiarek CNC” . Nanjing Aeronautical Institute. CS1 maint: używa parametru autorów ( link )
  13. ^ „Aplikacje sterowane głosem” . lucasware.com . Źródło 9 sierpnia 2020 r .

Linki zewnętrzne