9 lat temu

O czym śni sztuczna inteligencja?

sny (2)

Na to pytanie odpowiedzi dostarczają najnowsze osiągnięcia Googla w pracy nad systemem rozpoznawania obrazów – hipnotyczne krajobrazy, egzotyczne budynki i fontanny z mostami.

Obrazy – niektóre przepiękne, inne przerażające zostały stworzone przez tzw. neuronową sieć rozpoznawania obrazów, która powinna radzić sobie z identyfikacją domów, zwierząt i obiektów na fotografiach.

Poniższe zdjęcia zostały wygenerowane przez sieć w następujący sposób – do systemu wprowadzono serię obrazów i poproszono o wykrycie podstawowych kształtów oraz podkreślenie ich. Następnie wygenerowane zdjęcie było ponownie wrzucane do systemu z podobnym zadaniem. W efekcie system zapętlając wielokrotnie nakładane warstwy wytworzył niesamowite wizje. Na niższym poziomie sieć podkreśliła wyłącznie kształty na obrazkach, powstały efekt wygląda nieco malarsko i jest bliski temu, co moglibyśmy osiągnąć podkręcając zdjęcie w photoshopie.

sny (1)

Jednak kiedy sieć była proszona o rozpoznanie bardziej skomplikowanych kształtów jak np. zwierzęta, efekt wyglądał jak senne halucynacje.

sny (6)

Ostatecznie sieć jest w stanie „rozpoznać” nawet obraz z przypadkowych zakłóceń, generując kształty wyłącznie na podstawie swojej „wyobraźni”. A oto co otrzymamy jeśli poprosimy system o rozpoznanie kształtów budynków i podkreślenie ich dostarczając obraz kompletnie pozbawianych wszelkich kształtów.

sny (5)

 

sny (3)

W  dalszym rozwijaniu sieci istotne jest wygenerowanie metody by system zamiast uczenia się po kolei każdego kształtu potrafił z czasem sam uczyć się ich rozpoznawania. Przykładowo kiedy do systemu wprowadzono polecenie rozpoznania w plątaninie przypadkowych zakłóceń kształtu hantli do ćwiczeń system wygenerował obraz hantli wraz z ręką, która ją trzyma. Aby system był w stanie rozpoznać obraz samej hantli powinien mieć najpierw dostarczonych więcej zdjęć samego obiektu, a więc hantli „zawieszonej” w powietrzu.

sny (1)

Jednym z wyzwań pracy nad systemem jest zrozumienie jak przebiega praca na każdym po kolei poziomie procesu rozpoznawania obiektu. Wiemy już ze po każdym treningu na poziomie każdej warstwy system jest w stanie rozpoznawać coraz więcej coraz bardziej skomplikowanych kształtów. Przykładowo na podstawowym poziomie system rozpoznaje krawędzie i brzegi. Na kolejnym interpretuje podstawowe krawędzie aby ocenić kształt całego obiektu. Na końcu system łączy wszystkie kształty w ostateczną całość tworząc skomplikowane obrazy np. drzew lub budynków” wyjaśnia jeden z inżynierów Googla pracujący przy projekcie systemów neuronowych.

sny (4)

Jak do tej pory oprogramowanie stosowane do rozpoznawania obrazów jest używane przez Google w usłudze Google Photo. Wpisując  w wyszukiwarkę np. słowo „pies” wyświetlone zostaną wszystkie zdjęcia i obrazki, na których system rozpozna kształt psa (jak również przypadkowo innych zwierząt o podobnych kształtach).