Głęboki Umysł - DeepMind

DeepMind Technologies Limited
DeepMind logo.png
Rodzaj biznesu Pomocniczy
Założony 23 września 2010 ; 11 lat temu ( 2010-09-23 )
Siedziba
Założyciel(e)
CEO Demis Hassabis
Główny menadżer Lila Ibrahim
Przemysł Sztuczna inteligencja
Produkty AlphaGo , AlphaStar , AlphaFold , AlphaZero
Pracowników >1000 (czerwiec 2020)
Rodzic Niezależny (2010-2014)
Google Inc. (2014-2015)
Alphabet Inc. (2015-obecnie)
URL www.deepmind.com

DeepMind Technologies to brytyjska spółka zależna Alphabet Inc. zajmująca się sztuczną inteligencją i laboratorium badawcze założone we wrześniu 2010 r. DeepMind zostało przejęte przez Google w 2014 r. Firma ma siedzibę w Londynie, a centra badawcze znajdują się w Kanadzie, Francji i Stanach Zjednoczonych. W 2015 roku stał się spółką zależną należącą w całości do Alphabet Inc , firmy macierzystej Google.

DeepMind stworzyła sieć neuronową , która uczy, jak grać w gry wideo w sposób podobny do tego z ludźmi, jak również maszyny Neural Turinga lub sieci neuronowe, które mogą być w stanie uzyskać dostęp do pamięci zewnętrznej jak konwencjonalne maszyny Turinga , co skutkuje w komputerze, który naśladuje pamięć krótkotrwałą ludzkiego mózgu.

DeepMind trafił na pierwsze strony gazet w 2016 roku po tym, jak jego program AlphaGo pokonał profesjonalnego gracza Go , Lee Sedola , mistrza świata, w pięciomeczowym meczu , który był tematem filmu dokumentalnego. Bardziej ogólny program, AlphaZero , pokonał najpotężniejsze programy grające w go , szachy i shogi (japońskie szachy) po kilku dniach gry przeciwko sobie przy użyciu uczenia się przez wzmacnianie . W 2020 roku DeepMind poczynił znaczne postępy w problemie fałdowania białek .

Historia

Wejście do budynku, w którym znajdują się Google i DeepMind przy 6 Pancras Square, Londyn, Wielka Brytania.

Rozruch został założony przez Demis Hassabis , Shane Legg i Mustafa Sulejmana w 2010. Hassabis i Legg pierwszy spotkali się na University College London „s Gatsby Computational Neuroscience jednostki .

W jednym z wywiadów Demis Hassabis powiedział, że start-up rozpoczął pracę nad technologią sztucznej inteligencji, ucząc go grać w stare gry z lat siedemdziesiątych i osiemdziesiątych, które są stosunkowo prymitywne w porównaniu z dostępnymi dzisiaj. Niektóre z tych gier to Breakout , Pong i Space Invaders . Sztuczna inteligencja była wprowadzana do jednej gry na raz, bez wcześniejszej znajomości jej zasad. Po spędzeniu trochę czasu na nauce gry, sztuczna inteligencja w końcu stałaby się w niej ekspertem. „Procesy poznawcze, przez które przechodzi sztuczna inteligencja, są bardzo podobne do procesów człowieka, który nigdy nie widział gry, aby ją zrozumieć i spróbować ją opanować”. Celem założycieli jest stworzenie sztucznej inteligencji ogólnego przeznaczenia, która może być użyteczna i skuteczna w prawie wszystkim.

W spółkę zainwestowały największe firmy venture capital Horizons Ventures i Founders Fund , a także przedsiębiorcy Scott Banister, Peter Thiel i Elon Musk . Jaan Tallinn był pierwszym inwestorem i doradcą firmy. 26 stycznia 2014 r. Google ogłosił, że firma przejęła DeepMind za 500 milionów dolarów i zgodziła się przejąć DeepMind Technologies. Sprzedaż do Google miała miejsce po tym, jak Facebook podobno zakończył negocjacje z DeepMind Technologies w 2013 roku. Następnie firma została przemianowana na Google DeepMind i utrzymywała tę nazwę przez około dwa lata.

W 2014 roku DeepMind otrzymał nagrodę „Firma roku” od Cambridge Computer Laboratory .

We wrześniu 2015 r. DeepMind i Royal Free NHS Trust podpisały początkową umowę o udostępnianiu informacji (ISA) w celu wspólnego opracowania aplikacji do zarządzania zadaniami klinicznymi, Streams.

Po przejęciu Google firma utworzyła radę etyczną sztucznej inteligencji . Rada ds. etyki badań nad sztuczną inteligencją pozostaje tajemnicą, a zarówno Google, jak i DeepMind odmawiają ujawnienia, kto zasiada w radzie. DeepMind, wraz z Amazon, Google, Facebook, IBM i Microsoft, jest członkiem-założycielem Partnership on AI , organizacji zajmującej się interfejsem społeczeństwo-AI. DeepMind otworzył nową jednostkę o nazwie DeepMind Ethics and Society i skupił się na kwestiach etycznych i społecznych podnoszonych przez sztuczną inteligencję, której doradcą jest wybitny filozof Nick Bostrom . W październiku 2017 r. DeepMind uruchomił nowy zespół badawczy, aby zbadać etykę AI.

W grudniu 2019 r. współzałożyciel Suleyman ogłosił, że odejdzie z DeepMind, aby dołączyć do Google, pracując w roli polityki. W 2021 r . Wall Street Journal ujawnił, że Suleyman został przeniesiony na urlop w DeepMind w 2019 r. po dochodzeniu w sprawie zarzutów pracowników, że ich zastraszał. Firma zatrudniła zewnętrznego prawnika, aby zbadał zarzuty, że Suleyman znęcał się nad pracownikami, i został umieszczony na urlopie przed odejściem do Google. W wiadomości e-mail wysłanej do personelu po ujawnieniu tej historii, opublikowanej przez Business Insider , stwierdzono, że „styl zarządzania” Suleymana nie spełnia oczekiwanych standardów.

Business Insider opublikował również dalsze szczegóły historycznych zarzutów o zastraszanie wobec Sulejmana, w tym twierdzenia, że ​​chwalił się „miażdżeniem ludzi”, „miał zwyczaj wylatywania znikąd” i żądał od pracowników wykonywania zadań niezwiązanych z ich pracą.

Produkty i technologie

Według strony internetowej firmy, celem DeepMind Technologies jest połączenie „najlepszych technik z uczenia maszynowego i neuronauki systemowej w celu zbudowania potężnych algorytmów uczenia ogólnego przeznaczenia ”.

Google Research opublikowało w 2016 r. artykuł dotyczący bezpieczeństwa AI i unikania niepożądanych zachowań podczas procesu uczenia się AI. Deepmind opublikował również kilka publikacji za pośrednictwem swojej strony internetowej. W 2017 roku DeepMind wypuścił GridWorld, platformę testową typu open source do oceny, czy algorytm uczy się wyłączać swój wyłącznik awaryjny lub w inny sposób wykazuje pewne niepożądane zachowania.

W lipcu 2018 roku badacze z DeepMind przeszkolili jeden ze swoich systemów do grania w grę komputerową Quake III Arena .

Do 2020 roku DeepMind opublikował ponad tysiąc artykułów, w tym trzynaście artykułów zaakceptowanych przez Nature lub Science . DeepMind zwrócił uwagę mediów w okresie AlphaGo; według wyszukiwania LexisNexis , 1842 opublikowanych wiadomości wspominało o DeepMind w 2016 r., a w 2019 r. spadło do 1363.

Głębokie uczenie wzmacniające

W przeciwieństwie do innych AI, takie jak IBM „s Deep Blue lub Watson , które zostały opracowane dla zdefiniowanym celu i działają wyłącznie w swoim zakresie, DeepMind twierdzi, że jego system nie jest wstępnie zaprogramowany: uczy się z doświadczenia, używając tylko surowe piksele jako dane wejściowe. Technicznie wykorzystuje głębokie uczenie w splotowej sieci neuronowej , z nowatorską formą Q-learningu , formą uczenia się ze wzmocnieniem bez modelu . Testują system na grach wideo, zwłaszcza wczesnych grach zręcznościowych , takich jak Space Invaders czy Breakout . Bez zmiany kodu sztuczna inteligencja zaczyna rozumieć, jak grać w tę grę i po pewnym czasie gra przez kilka gier (przede wszystkim Breakout ), grę wydajniejszą niż jakikolwiek człowiek.

W 2013 roku DeepMind opublikowało badania nad systemem sztucznej inteligencji, który mógłby przewyższyć ludzkie możliwości w grach takich jak Pong , Breakout i Enduro , jednocześnie przewyższając najnowocześniejszą wydajność w Seaquest , Beamrider i Q*bert . Ta praca podobno doprowadziła do przejęcia firmy przez Google. Sztuczna inteligencja DeepMind została zastosowana w grach wideo wyprodukowanych w latach 70. i 80 .; trwały prace nad bardziej złożonymi grami 3D, takimi jak Quake , które po raz pierwszy pojawiły się w latach 90. XX wieku.

W 2020 roku DeepMind opublikował Agent57, agenta AI, który przewyższa wydajność na poziomie ludzkim we wszystkich 57 grach pakietu Atari2600.

AlphaGo i następcy

W 2014 roku firma opublikowała badania dotyczące systemów komputerowych, które są w stanie grać w Go .

W październiku 2015 r. program komputerowy Go o nazwie AlphaGo, opracowany przez DeepMind, pokonał mistrza Europy w Go, Fan Hui , profesjonalistę w zakresie 2 dan (na możliwych 9 dan), pięć do zera. Po raz pierwszy sztuczna inteligencja (AI) pokonała profesjonalnego gracza Go. Wcześniej komputery grały w Go tylko na poziomie „amatorskim”. Go jest uważane za znacznie trudniejsze do wygrania przez komputery w porównaniu z innymi grami, takimi jak szachy , ze względu na znacznie większą liczbę możliwości, co utrudnia tradycyjne metody sztucznej inteligencji, takie jak brute-force .

W marcu 2016 roku pokonał Lee Sedolagracza 9 dan Go i jednego z najwyżej notowanych graczy na świecie — z wynikiem 4-1 w pięciomeczowym meczu .

W 2017 Future of Go Summit , AlphaGo wygrał trzymeczowy mecz z Ke Jie , który w tym czasie nieprzerwanie przez dwa lata utrzymywał światowy ranking nr 1 . Używał nadzorowanego protokołu uczenia się , badając dużą liczbę gier rozgrywanych przez ludzi przeciwko sobie.

W 2017 roku ulepszona wersja, AlphaGo Zero, pokonała AlphaGo 100 gier do 0. Strategie AlphaGo Zero były samoukami. AlphaGo Zero był w stanie pokonać swojego poprzednika już po trzech dniach przy mniejszej mocy obliczeniowej niż AlphaGo; dla porównania, oryginalny AlphaGo potrzebował miesięcy, aby nauczyć się grać.

Później w tym samym roku AlphaZero, zmodyfikowana wersja AlphaGo Zero, ale do obsługi każdej dwuosobowej gry zawierającej doskonałe informacje, zyskała nadludzkie umiejętności w szachach i shogi. Podobnie jak AlphaGo Zero, AlphaZero uczyło się wyłącznie poprzez samodzielną zabawę.

Technologia

Technologia AlphaGo została opracowana w oparciu o podejście uczenia głębokiego wzmacniania . To sprawia, że ​​AlphaGo różni się od pozostałych technologii AI dostępnych na rynku. Powiedziawszy to, „mózg” AlphaGo został wprowadzony do różnych ruchów opartych na historycznych danych turniejowych. Liczba ruchów była stopniowo zwiększana, aż w końcu przetworzyła ponad 30 milionów z nich. Celem było, aby system naśladował człowieka i ostatecznie stał się lepszy. Grał przeciwko sobie i uczył się nie tylko na własnych porażkach, ale także na zwycięstwach; w ten sposób nauczył się poprawiać się z czasem i w rezultacie zwiększył swój wskaźnik wygranych.

W AlphaGo wykorzystano dwie głębokie sieci neuronowe: sieć zasad do oceny prawdopodobieństwa przeniesienia oraz sieć wartości do oceny pozycji. Sieć polityczna szkoliła się poprzez nadzorowane uczenie się, a następnie została udoskonalona poprzez uczenie się poprzez wzmacnianie gradientu politycznego . Sieć wartości nauczyła się przewidywać zwycięzców gier rozgrywanych przez sieć polityczną przeciwko sobie. Po przeszkoleniu sieci te zastosowały wyszukiwanie w drzewie Monte Carlo (MCTS), wykorzystując sieć polityk do identyfikacji potencjalnych ruchów o wysokim prawdopodobieństwie, podczas gdy sieć wartości (w połączeniu z rolloutami Monte Carlo przy użyciu polityki szybkiego wdrażania) oceniała pozycje drzewa.

Zero wyszkolone przy użyciu uczenia ze wzmacnianiem, w którym system rozegrał miliony gier przeciwko sobie. Jedynym jej przewodnikiem było zwiększenie wskaźnika wygranych. Zrobiło to bez uczenia się z gier, w które grają ludzie. Jedynymi cechami wejściowymi są czarne i białe kamienie z planszy. Wykorzystuje pojedynczą sieć neuronową zamiast oddzielnych sieci zasad i wartości. Uproszczone wyszukiwanie w drzewie opiera się na tej sieci neuronowej do oceny pozycji i przykładowych ruchów, bez wdrożeń Monte Carlo. Nowy algorytm uczenia się ze wzmocnieniem obejmuje wyszukiwanie z wyprzedzeniem w pętli treningowej. AlphaGo Zero zatrudniało około 15 osób i miliony w zasobach obliczeniowych. Ostatecznie potrzebował znacznie mniej mocy obliczeniowej niż AlphaGo, działając na czterech wyspecjalizowanych procesorach AI (Google TPU ), zamiast 48 AlphaGo.

AlfaFold

W 2016 roku DeepMind przekształcił swoją sztuczną inteligencję w fałdowanie białek , jeden z najtrudniejszych problemów w nauce. W grudniu 2018 r. DeepMind AlphaFold wygrał 13. krytyczną ocenę technik przewidywania struktury białka (CASP), pomyślnie przewidując najdokładniejszą strukturę dla 25 z 43 białek. „To jest projekt latarni morskiej, nasza pierwsza poważna inwestycja pod względem ludzi i zasobów w fundamentalny, bardzo ważny, rzeczywisty problem naukowy” – powiedział Hassabis dla The Guardian . W 2020 r. w 14. CASP prognozy AlphaFold osiągnęły wynik dokładności uważany za porównywalny z technikami laboratoryjnymi. Dr Andriy Kryshtafovych, jeden z paneli arbitrów naukowych, określił osiągnięcie jako „naprawdę niezwykłe” i powiedział, że problem przewidywania, w jaki sposób białka fałdują się, został „w dużej mierze rozwiązany”.

WaveNet i WaveRNN

W 2016 roku DeepMind wprowadził WaveNet, system zamiany tekstu na mowę . Początkowo był zbyt intensywny obliczeniowo, aby można go było używać w produktach konsumenckich, ale pod koniec 2017 roku stał się gotowy do użycia w aplikacjach konsumenckich, takich jak Asystent Google . W 2018 r. Google uruchomił komercyjny produkt przetwarzania tekstu na mowę, Cloud Text-to-Speech, oparty na WaveNet.

W 2018 r. DeepMind wprowadził wydajniejszy model o nazwie WaveRNN opracowany wspólnie z Google AI . W 2019 roku Google zaczął udostępniać go użytkownikom Google Duo .

AlphaStar

W 2016 roku Hassabis omówił grę StarCraft jako wyzwanie na przyszłość, ponieważ wymaga ona strategicznego myślenia i obsługi niedoskonałych informacji.

W styczniu 2019 r. DeepMind wprowadził AlphaStar, program do gry strategicznej czasu rzeczywistego StarCraft II . AlphaStar wykorzystał uczenie się ze wzmocnieniem na podstawie powtórek od ludzkich graczy, a następnie grał przeciwko sobie, aby poprawić swoje umiejętności. W czasie prezentacji AlphaStar miał wiedzę równą 200 latom gry. Wygrał 10 meczów z rzędu przeciwko dwóm profesjonalnym graczom, chociaż miał nieuczciwą przewagę, ponieważ był w stanie zobaczyć całe boisko, w przeciwieństwie do człowieka, który musi ręcznie poruszać kamerą. Wstępna wersja, w której ta przewaga została ustalona, ​​przegrała kolejny mecz.

W lipcu 2019 r. AlphaStar zaczął grać przeciwko losowym ludziom w publicznej europejskiej drabince wieloosobowej 1 na 1. W przeciwieństwie do pierwszej iteracji AlphaStar, w której grał tylko Protoss v. Protoss, ta grała jako wszystkie rasy w grze i miała naprawione wcześniej nieuczciwe przewagi. Do października 2019 r. AlphaStar osiągnął poziom arcymistrza w drabince StarCraft II we wszystkich trzech wyścigach StarCraft , stając się pierwszą sztuczną inteligencją, która dotarła do najwyższej ligi bardzo popularnego e- sportu bez żadnych ograniczeń w grze.

Różne wkłady do Google

Google stwierdził, że algorytmy DeepMind znacznie zwiększyły wydajność chłodzenia jego centrów danych. Ponadto DeepMind (wraz z innymi badaczami Alphabet AI) wspomaga spersonalizowane rekomendacje aplikacji w Google Play . DeepMind współpracował również z zespołem Androida w Google przy tworzeniu dwóch nowych funkcji, które zostały udostępnione osobom z urządzeniami z Androidem Pie, dziewiątą wersją mobilnego systemu operacyjnego Google. Te funkcje, Adaptive Battery i Adaptive Brightness, wykorzystują uczenie maszynowe do oszczędzania energii i ułatwiają korzystanie z urządzeń z systemem operacyjnym. Po raz pierwszy DeepMind zastosował te techniki na tak małą skalę, z typowymi aplikacjami uczenia maszynowego, które wymagają o rząd wielkości większej mocy obliczeniowej.

Zdrowie DeepMind

W lipcu 2016 roku ogłoszono współpracę między DeepMind i Moorfields Eye Hospital w celu opracowania aplikacji AI dla opieki zdrowotnej . DeepMind miałby zostać zastosowany do analizy zanonimizowanych skanów oka w poszukiwaniu wczesnych oznak chorób prowadzących do ślepoty .

W sierpniu 2016 r. ogłoszono program badawczy z University College London Hospital, którego celem jest opracowanie algorytmu, który może automatycznie odróżnić zdrowe i nowotworowe tkanki w obszarach głowy i szyi.

Realizowane są również projekty z Royal Free London NHS Foundation Trust i Imperial College Healthcare NHS Trust mające na celu opracowanie nowych klinicznych aplikacji mobilnych powiązanych z elektroniczną kartoteką pacjentów . W grudniu 2017 r. pracownicy Royal Free Hospital powiedzieli, że dostęp do danych pacjentów za pośrednictwem aplikacji zaoszczędził „ogromną ilość czasu” i spowodował „fenomenalną” różnicę w leczeniu pacjentów z ostrym uszkodzeniem nerek. Dane o wynikach badań są wysyłane na telefony komórkowe personelu i informują ich o zmianie stanu pacjenta. Umożliwia również personelowi sprawdzenie, czy ktoś inny zareagował, i pokazanie pacjentom ich wyników w formie wizualnej.

W listopadzie 2017 r. DeepMind ogłosił partnerstwo badawcze z Cancer Research UK Centre w Imperial College London w celu poprawy wykrywania raka piersi poprzez zastosowanie uczenia maszynowego w mammografii. Dodatkowo, w lutym 2018 r. DeepMind ogłosiło, że współpracuje z Departamentem Spraw Weteranów USA nad próbą wykorzystania uczenia maszynowego do przewidywania początku ostrego uszkodzenia nerek u pacjentów, a także szerzej ogólnego pogorszenia stanu pacjentów podczas pobytu w szpitalu. że lekarze i pielęgniarki mogą szybciej leczyć potrzebujących pacjentów.

DeepMind opracował aplikację o nazwie Streams, która wysyła alerty do lekarzy o pacjentach zagrożonych ostrymi obrażeniami. 13 listopada 2018 r. DeepMind ogłosił, że jego dział zdrowia i aplikacja Streams zostaną wchłonięte przez Google Health . Obrońcy prywatności twierdzą, że ogłoszenie to zdradziło zaufanie pacjentów i wydaje się być sprzeczne z wcześniejszymi oświadczeniami DeepMind, że dane pacjentów nie będą połączone z kontami ani usługami Google. Rzecznik DeepMind powiedział, że dane pacjentów nadal będą przechowywane oddzielnie od usług lub projektów Google.

Kontrowersje dotyczące udostępniania danych NHS

W kwietniu 2016 r. New Scientist uzyskał kopię umowy o udostępnianiu danych między DeepMind a Royal Free London NHS Foundation Trust . Ta ostatnia prowadzi trzy londyńskie szpitale, w których rocznie leczy się około 1,6 miliona pacjentów. Umowa pokazuje, że DeepMind Health miało dostęp do przyjęć, wypisów i przesyłania danych, wypadków i nagłych wypadków, patologii i radiologii oraz intensywnej opieki w tych szpitalach. Obejmowały one dane osobowe, takie jak to, czy u pacjentów zdiagnozowano HIV , czy cierpieli na depresję lub kiedykolwiek przeszli aborcję w celu przeprowadzenia badań mających na celu uzyskanie lepszych wyników w różnych schorzeniach.

Złożono skargę do Biura Komisarza ds. Informacji (ICO), argumentując, że dane powinny być pseudonimizowane i szyfrowane. W maju 2016 r. New Scientist opublikował kolejny artykuł, w którym stwierdził, że projekt nie uzyskał zgody Grupy Doradczej ds. Poufności Agencji Regulacji Leków i Produktów Opieki Zdrowotnej .

W maju 2017 roku Sky News opublikowało wyciekający list od National Data Guardian, Dame Fiony Caldicott , ujawniający, że w jej „uważnej opinii” umowa o udostępnianiu danych między DeepMind a Royal Free miała „niewłaściwą podstawę prawną”. Biuro Komisarza ds. Informacji orzekło w lipcu 2017 r., że szpital Royal Free nie przestrzegał ustawy o ochronie danych, przekazując DeepMind dane osobowe 1,6 mln pacjentów.

Etyka i społeczeństwo DeepMind

W październiku 2017 r. DeepMind ogłosił powstanie nowej jednostki badawczej DeepMind Ethics & Society. Ich celem jest finansowanie zewnętrznych badań w następujących tematach: prywatność, przejrzystość i uczciwość; skutki ekonomiczne; zarządzanie i odpowiedzialność; zarządzanie ryzykiem AI; moralność i wartości AI; i jak sztuczna inteligencja może sprostać wyzwaniom świata. W rezultacie zespół ma nadzieję lepiej zrozumieć etyczne implikacje sztucznej inteligencji i pomóc społeczeństwu w dostrzeżeniu, że sztuczna inteligencja może być korzystna.

Ten nowy pododdział DeepMind jest jednostką całkowicie odrębną od partnerstwa wiodących firm wykorzystujących sztuczną inteligencję, środowiska akademickiego, organizacji społeczeństwa obywatelskiego i organizacji non-profit o nazwie Partnership on Artificial Intelligence to Benefit People and Society, którego DeepMind również jest częścią. Rada ds. Etyki i Społeczeństwa DeepMind różni się również od komentowanej Rady ds. Etyki AI, którą firma Google pierwotnie zgodziła się utworzyć przy przejęciu DeepMind.

DeepMind Profesorowie uczenia maszynowego

DeepMind sponsoruje trzy krzesła uczenia maszynowego:

  1. jeden na Uniwersytecie w Cambridge , prowadzony przez Neila Lawrence'a , na Wydziale Informatyki i Technologii
  2. inny na Uniwersytecie Oksfordzkim , prowadzony przez Phila Blunsoma . na Wydziale Informatyki
  3. inny w University College London , prowadzony przez Marca Deisenrotha . w Katedrze Informatyki na Wydziale Nauk Inżynierskich

Zobacz też

Bibliografia

Zewnętrzne linki