O czym śni sztuczna inteligencja?
Na to pytanie odpowiedzi dostarczają najnowsze osiągnięcia Googla w pracy nad systemem rozpoznawania obrazów – hipnotyczne krajobrazy, egzotyczne budynki i fontanny z mostami.
Obrazy – niektóre przepiękne, inne przerażające zostały stworzone przez tzw. neuronową sieć rozpoznawania obrazów, która powinna radzić sobie z identyfikacją domów, zwierząt i obiektów na fotografiach.
Poniższe zdjęcia zostały wygenerowane przez sieć w następujący sposób – do systemu wprowadzono serię obrazów i poproszono o wykrycie podstawowych kształtów oraz podkreślenie ich. Następnie wygenerowane zdjęcie było ponownie wrzucane do systemu z podobnym zadaniem. W efekcie system zapętlając wielokrotnie nakładane warstwy wytworzył niesamowite wizje. Na niższym poziomie sieć podkreśliła wyłącznie kształty na obrazkach, powstały efekt wygląda nieco malarsko i jest bliski temu, co moglibyśmy osiągnąć podkręcając zdjęcie w photoshopie.
Jednak kiedy sieć była proszona o rozpoznanie bardziej skomplikowanych kształtów jak np. zwierzęta, efekt wyglądał jak senne halucynacje.
Ostatecznie sieć jest w stanie „rozpoznać” nawet obraz z przypadkowych zakłóceń, generując kształty wyłącznie na podstawie swojej „wyobraźni”. A oto co otrzymamy jeśli poprosimy system o rozpoznanie kształtów budynków i podkreślenie ich dostarczając obraz kompletnie pozbawianych wszelkich kształtów.
W dalszym rozwijaniu sieci istotne jest wygenerowanie metody by system zamiast uczenia się po kolei każdego kształtu potrafił z czasem sam uczyć się ich rozpoznawania. Przykładowo kiedy do systemu wprowadzono polecenie rozpoznania w plątaninie przypadkowych zakłóceń kształtu hantli do ćwiczeń system wygenerował obraz hantli wraz z ręką, która ją trzyma. Aby system był w stanie rozpoznać obraz samej hantli powinien mieć najpierw dostarczonych więcej zdjęć samego obiektu, a więc hantli „zawieszonej” w powietrzu.
Jednym z wyzwań pracy nad systemem jest zrozumienie jak przebiega praca na każdym po kolei poziomie procesu rozpoznawania obiektu. Wiemy już ze po każdym treningu na poziomie każdej warstwy system jest w stanie rozpoznawać coraz więcej coraz bardziej skomplikowanych kształtów. Przykładowo na podstawowym poziomie system rozpoznaje krawędzie i brzegi. Na kolejnym interpretuje podstawowe krawędzie aby ocenić kształt całego obiektu. Na końcu system łączy wszystkie kształty w ostateczną całość tworząc skomplikowane obrazy np. drzew lub budynków” wyjaśnia jeden z inżynierów Googla pracujący przy projekcie systemów neuronowych.
Jak do tej pory oprogramowanie stosowane do rozpoznawania obrazów jest używane przez Google w usłudze Google Photo. Wpisując w wyszukiwarkę np. słowo „pies” wyświetlone zostaną wszystkie zdjęcia i obrazki, na których system rozpozna kształt psa (jak również przypadkowo innych zwierząt o podobnych kształtach).