Paweł Pilarczyk | 3 października 2017, 12:30

Innovation@Amazon 2017 – relacja z konferencji poświęconej sztucznej inteligencji, rozpoznawaniu mowy i robotyce

Alexa, Alexa wszędzie!

W Gdańsku w miniony weekend odbyła się konferencja dla programistów Innovation@Amazon 2017. Była poświęcona głównie sztucznej inteligencji, uczeniu maszynowemu, robotyce i osobistym asystentom cyfrowym, z którymi komunikujemy się za pomocą głosu (takim jak Amazon Alexa). Przy okazji uczestnicy mogli zobaczyć zaprezentowane globalnie przed kilkoma dniami najnowsze urządzenia Amazon Echo Look i Echo Show.

Amazon przed trzema laty zaproponował swój własny system rozpoznawania głosu, Alexa. Podczas prezentacji, która odbyła się pod koniec 2014 roku, pokazano także głośniczek Amazon Echo, który ma wbudowanych siedem mikrofonów i jest połączony z internetem. Echo było pierwszym na rynku urządzeniem w tej postaci – wcześniejsze systemy „inteligentnych cyfrowych asystentów osobistych” (ang. intelligent personal digital assistant), takie jak Apple Siri i Microsoft Cortana, jako platformę wykorzystywały po prostu smartfony (Siri – iPhone'a, Cortana – Lumie z systemem Windows 10 Mobile). Cylindryczny głośnik Amazon Echo wzbudził duże zainteresowanie rynku ze względu na konstrukcję (nie ma na przykład w ogóle wyświetlacza), a zarazem zaskakiwał użytkowników łatwością obsługi, wysokim poziomem „rozumienia” mowy ludzkiej i trafnością odpowiedzi.

Amazon Echo

 

Popularne systemy osobistych asystentów:
Apple Siri, Google Assistant, Microsoft Cortana, Amazon Alexa 

System rozpoznawania głosu połączony ze sztuczną inteligencją Amazon Alexa został opracowany – o czym pewnie nie wszyscy wiedzą – w Polsce. Szefami projektu byli inżynierowie i programiści tworzący wcześniej syntezator mowy Ivona (przejęty kilka lat temu przez Amazona). Nawet anglojęzyczna lektorka, która użyczyła głosu Aleksie, na nagrania przyjeżdżała specjalnie do Polski. Co zaskakujące, Amazon Alexa do dziś nie rozpoznaje języka polskiego... Oczywiście, pytaliśmy przedstawicieli Amazona, kiedy w końcu Alexa będzie mogła się porozumiewać z Polakami, ale otrzymaliśmy jedynie zapewnienie, że „jest to w planach”.

Komunikacja głosowa jest najbardziej naturalnym sposobem interakcji dla człowieka

Podczas Innovation@Amazon pracownicy Amazona z Polski, Wielkiej Brytanii czy Stanów Zjednoczonych opowiadali zgromadzonym o wykorzystywaniu techniki Amazon Alexa w różnych zastosowaniach. System można za darmo zaimplementować w dowolnym sprzęcie – wystarczy, że ma mikrofon, głośnik i połączenie z internetem (przetwarzanie głosu odbywa się nie na poziomie samego urządzenia, lecz w chmurze). Dlatego coraz więcej produktów prócz samego Amazon Echo (i jego różnych wariacji, na przykład Echo Dot) otrzymuje system Alexa, w tym smartfony HTC U11, roboty Ubtech itp.

Amazon Echo Dot – malutka wersja Amazon Echo (też ma wbudowane mikrofony i głośnik)

Amazon Echo Look – kamera... z wbudowaną funkcją Amazon Alexa

Amazon Echo Show – urządzenie w postaci podobnej do małego telewizorka lub fotoramki, też oczywiście sterowane głosem dzięki systemowi Amazon Alexa

Przeróżne urządzenia innych firm wykorzystujące system Amazon Alexa

...i następny zestaw takich urządzeń

W trakcie konferencji opowiadano uczestnikom o problemach, z którymi mierzą się programiści przy doskonaleniu algorytmów Alexy. Systemy rozpoznawania mowy wykorzystują mechanizmy uczenia maszynowego (ang. machine learning) połączonego z systemami sztucznej inteligencji (ang. artificial intelligence, w skrócie AI), oparte na sieciach neuronowych (ang. neural networks). Wszystkie te systemy są stosowane także w wielu innych rozwiązaniach, w tym rozpoznających obrazy (na przykład znaki drogowe w samochodach czy tablice rejestracyjne na zautomatyzowanych parkingach).

Algorytmy systemów sztucznej inteligencji i uczenia maszynowego nie są niczym nowym, bo zostały opracowane przez matematyków już lata temu, ale dopiero teraz trafiają do powszechnego użycia. Dopiero teraz bowiem komputery osiągnęły wydajność wystarczającą do tego, by przetwarzać zapytania w dostatecznie krótkim czasie. Sieci neuronowe (oparte głównie na mnożeniu macierzy i operacjach na tensorach) są przetwarzane najszybciej z użyciem układów graficznych (GPU), które w tych zastosowaniach są nawet 10-krotnie szybsze od najszybszych CPU. Obecnie właśnie dlatego w serwerach przeznaczonych do obsługi sztucznej inteligencji stosuje się przede wszystkim rozwiązania opracowane przez Nvidię czy AMD.

Porównanie wydajności procesora Core i7 (nie wiadomo dokładnie, jaki to model) i karty graficznej GeForce Titan X – 500 mld operacji zmiennoprzecinkowych na sekundę w i7 kontra 5 bln w Titanie

Amazon pochwalił się także swoimi pracami nad robotyką. Już teraz ta amerykańska korporacja jest właścicielem największej floty robotów (80 tysięcy sztuk!), rozlokowanych głównie w centrach dystrybucyjnych, czyli potężnych magazynach, których Amazon ma 40 na całym świecie. Każde centrum dystrybucyjne to budynek o długości 800 m, wysoki na kilkanaście. Ponieważ wcześniej po magazynach poruszali się ludzie (pieszo lub na wózkach widłowych), pokonywali oni dziennie nawet kilkanaście kilometrów tylko po to, by z półek ściągać towary i przenosić je do ciężarówek. Dzisiaj czynność tę wykonują specjalne roboty, przypominające swoją budową nieco powiększone roboty odkurzające czy koszące. Urządzenia (zwane jednostkami jeżdżącymi wyłącznie dlatego, by nie odstraszać nazwą robot menedżerów) służą przede wszystkim do przewożenia po hali specjalnych „szafek” z towarami.

Tak wyglądają roboty, które przewożą półki z towarami po magazynach Amazona

Trochę liczb. Slajd już jest nieaktualny, bo Amazon niedawno otworzył cztery nowe centra dystrybucyjne, więc ma ich teraz łącznie 40, a nie 36

Transport produktów po halach to obecnie główne zastosowanie robotów w magazynach Amazona. Niestety, wciąż większość czynności (takich, jak wyciąganie produktów z szafek i umieszczanie ich w kartonach) wykonuje się ręcznie. Każdego produktu, który kupicie przez internet w Amazonie, nadal dotyka średnio dziewięć osób (!). To pokazuje, jak wiele jest jeszcze do zrobienia w dziedzinie automatyzacji magazynów dystrybucyjnych. Najważniejszym wyzwaniem jest teraz stworzenie robotów, które będą zdolne do rozpoznania towaru na półce, wyciągnięcia go z tej półki i umieszczenia w pudełku. Wydaje się proste, prawda? A jednak problemem jest sam chwytak robota, który musi być zdolny do łapania produktów o przeróżnych rozmiarach, kształtach i fakturze (jako przykłady pokazano nam śrubki i... pomarańcze), tak by ten towar z niego nie wypadł i nie został uszkodzony w trakcie przenoszenia. Czynność dla ludzi banalna na razie okazuje się nie do opanowania dla maszyny. Swoją drogą, jeśli ktoś z Was ma pomysł na to, jak skonstruować takiego robota, niech się natychmiast skontaktuje z Amazonem – jest możliwość zarobienia niezłych pieniędzy ;-)

Największym problemem dla robotów jest chwytanie produktów o różnych rozmiarach i kształtach

Dlatego na razie wciąż robią to ludzie...

A skoro już jesteśmy przy zatrudnianiu… Polskie biuro Amazona ma obecnie setki wolnych stanowisk, na które poszukuje pracowników – zwłaszcza inżynierów, programistów, wynalazców, specjalistów w dziedzinie robotyki czy sztucznej inteligencji. Tych, którzy czują się mocni na tych polach, Amazon przyjmie z otwartymi ramionami.

Dla nas konferencja Innovation@Amazon była niezwykle inspirująca, bo pokazała, jak wiele już zrobiono w dziedzinie sztucznej inteligencji, ale zarazem uświadomiła, jak wielkie możliwości wciąż przed nami stoją.