Wykorzystaj uczenie maszynowe w Twojej firmie

Czy uczenie maszynowe ma już jakieś konkretne zastosowania, które warto rozważyć przy komponowaniu strategii biznesowej, czy nadal mówimy o przyszłości i czymś, co przyjdzie do nas za kilka lat?

Sztuczna inteligencja tu i tam – wszechobecny żargon. Uczenie maszynowe, roboty i automatyzacja pojawiają się na każdym kroku.

W tym poście chciałbym wykonać przelot nad algorytmami uczenia maszynowego, szybko je wyjaśnić, a następnie przedstawić kilka przykładów zastosowań uczenia maszynowego.

Przyjrzyjmy się najpierw modelom uczenia maszynowego

Zastosowania uczenia maszynowego i typy algorytmów

Modele ML można podzielić na cztery kategorie:

  • Nadzorowana nauka,
  • uczenie się bez nadzoru,
  • mix powyższych.

Na czym polega różnica pomiędzy powyższymi typami?

Biznesmeni uwielbiają proste rzeczy, ponieważ nie mają czasu na studiowanie szczegółów. Dla zapracowanych ludzi główna różnica polega na tym, kto szkoli algorytm. Nadzór wymaga przełożonego, co oznacza, że ​​inżynierowie i programiści muszą nauczyć algorytm procesować dane. W przeciwnym razie algorytm utknie i nie będzie żadnych wyników. Algorytm bez nadzoru, uczy się sam, ale jakie da efekty? Tego nie wie nikt. Mix, to taki trochę kundel, mieszanka dwóch powyższych.

Nadzorowane


Nadzorowane typy modeli nie przyniosą rezultatów bez wcześniejszego nazwania np. marki samochodu, lub wskazania algorytmowi, że ta dama ma długie włosy. Algorytm jest głupi bez przełożonego i nie może się sam uczyć. Aby wyszkolić tego drania, potrzebujesz grupy ludzi, którzy będą oznaczać dane.

Z punktu widzenia strategii i modelu biznesowego, musisz zatrudnić i współpracować z kimś, kto zapewnia takie klikające ręce. Twoje koszty zatrudnienia wzrosną, ponieważ będziesz musiał opłacić te ręce, aby opisały dla Ciebie dane.

Nagroda? Dostaniesz to, czego chcesz. Jeśli Twoi ludzie otagują wszystkie zdjęcia przedstawiające nagość, będziesz mógł powiedzieć: „Hej, ta sieć społecznościowa jest przyjazna dla wszystkich, ponieważ wiemy, jak usunąć wszystkie nieodpowiednie treści”.

Nagość wymazana przez algorytm uczenia maszynowego

Jedną z najczęstszych zastosowań tego rodzaju uczenia maszynowego jest filtr spamu Google. Inżynierowie nauczyli algorytmy rozpoznawać spam, dzięki czemu algorytm jest wstanie złapać 99.9% treści, których nie chcesz widzieć w swojej skrzynce pocztowej. Od teraz możesz cieszyć się mniejszą ilością spamu w Twojej skrzynce odbiorczej Gmaila. 

Apple Pencil również korzysta z algorytmów!

Innym przykładem jest Twój iPad i Apple Pencil. Tak! Gdy złapiesz cyfrowy ołówek i zaczniesz pisać odręcznie, algorytmy mogą szybko rozpoznać litery, następnie słowa i zdania. Ktoś lub coś oznacza całą grupę wyrazów i przenosi je do urządzenia. Aplikacje takie jak GoodNotes lub Notability używają nadzorowanych modeli uczenia maszynowego. Wykorzystanie uczenia maszynowego w takich przypadkach jest korzystne dla użytkowników końcowych, ponieważ wyniki można uzyskać szybko, a przez większość czasu są one zadowalające. W bazie danych Apple „siedzi” miliony a może i miliardy wzorców pisma odręcznego. Ty piszesz na iPad a sztuczna inteligencja trudzi się tym, aby rozpoznać w jakim języku piszesz i co napisałeś przed chwilą.

UBER i zamaskowany kierowca

Jakiś czas temu Uber ogłosił,  że aplikacja UberApp będzie miała komponent AI, który rozpoznaje, czy kierowca ma maskę (chodzi o ochronę przed COVID) na twarzy, czy też nie. Kierowca musi skierować twarz w stronę aparatu smartfona; aplikacja robi selfie i rozpoznaje, że maska ​​jest obecna lub nie ma jej na twarzy kierowcy. Wcześniej nakarmiona baza danych, zasila algorytmy we wzorce, które pozwalają z prędkością światła ocenić czy kierowca jest zamaskowany.

Zastosowania uczenia maszynowego w Waymo

Waymo to firma technologiczna należąca do firmy macierzystej Google, Alphabet. Autonomiczne pojazdy od Waymo zgromadziły ogromną ilość danych w Phoenix w Kalifornii i Waszyngtonie. 

Co zebrały te auta? Cóż, zestaw robi wrażenie:

  • Zsynchronizowane dane z pięciu lidarów i pięciu kamer przednich i bocznych umieszczonych na autach
  • Kalibracja i pozy czujnika w różnych sytuacjach drogowych
  • Etykiety obiektów (pojazdy, piesi, rowerzyści i oznakowanie) z trójwymiarowymi polami
  • Etykiety obiektów z obwiedniami 2D dla danych kamery w 100 segmentach (źródło: InfoQ)

Dane są tak dobrze przygotowane, że można je wykorzystać do nadzorowanego uczenia maszynowego modeli. 

Samojezdne samochody Waymo spędziły dwa lata na ulicach Arizony w USA, zawsze mając kierowcę w samochodzie. Tylko w Arizonie wykonano 10 000 podróży w dwa miesiące. W ten sposób zbudowano bazy danych z obiektami doskonale opisanymi do dalszego trenowania algorytmów. Ponieważ ten sam obiekt np. sarna na drodze, został sfotografowany z wielu różnych kamer i obmierzony z wielu różnych czujników, dane są wysokiej wartości i jakości.

Bez nadzoru


Możesz wraz ze swoim zespołem stwierdzić, że chcecie skorzystać z nienadzorowanych modeli uczenia maszynowego. W porządku, ale przygotuj się na zderzenie się z nieznanym. Algorytmy nadzorowane dadzą pożądane rezultaty, a bez nadzoru zabiorą Cię w przyszłość, nie mówiąc Ci, co osiągniesz.

Szaleństwo? Już widzę miny inwestorów, którzy słyszą od twórcy firmy: „Cześć, mój startup pracuje nad zastosowaniami uczenia maszynowego w monitorowaniu warunków zdrowotnych, ale nie wiemy, jakie będą rezultaty”

Zakładam, że inwestorzy mają pokerowe twarze i nie parskną śmiechem!

W każdym razie algorytmy uczące się bez nadzoru zjadają nieoznaczone dane i przetrawiają je, mając nadzieję na uzyskanie ekscytujących wyników.

Wyobraź sobie, że masz zestaw rzadkich kart piłkarskich z wizerunkami zawodników, które chcesz sprzedać w serwisie eBay. Nie wiesz jaką cenę zaproponować. Mógłbyś skorzystać z algorytmów nadzorowanych, ale nie chcesz gdyż nie masz danych, albo nie chcesz mieć oczywistych wyników. Interesuje Cię odkrycie nowego wzorca, czegoś nieznanego.

Model bez nadzoru spróbuje znaleźć dla Ciebie wartość parametru cenowego. Model przetworzy dane, spróbuje znaleźć najbliższą cenę i zarekomenduje. Skąd możesz mieć pewność, że cena jest rozsądna i dostaniesz to, czego chcesz? Musisz nakarmić bestię dużą ilością danych. Miliardami rekordów.

Jakie są konsekwencje?

Potrzebujesz dużo pamięci do przetwarzania danych, dużej mocy obliczeniowej i czasu – 6 miesięcy lub dwa lata. To zależy od tego, jaki jest twój cel.

Pomyśl teraz o Tesli, ile danych potrzebuje firma o zachowaniach konsumenta za kółkiem, aby zoptymalizować wydajność baterii.

Setki tysięcy Tesli wysyłają dane do chmury, a dane zasilają modele uczenia maszynowego. Algorytmy pokazują wzorce a faceci z zespołów Elona Muska sugerują konfigurację baterii, którą ustawia komputer pokładowy Tesli. Ty po prostu prowadzisz samochód i odbierasz kawę ze Starbucksa. W tym czasie Twoja Tesla ciągle wysyła dane do modeli nienadzorowanych, które pracują nad poprawą wydajności baterii.

Amazon i uczenie maszynowe

Weźmy Amazon i jego zdolność przewidywania, co ci się spodoba w przyszłości. Firma Bezosa wysyła próbki produktów (kosmetyki, ubrania, produkty zdrowotne) do klientów, ponieważ modele uczenia maszynowego mogą przewidzieć, co prawdopodobnie uznasz za ekscytujące. Algorytmy uczenia maszynowego Amazon połykają, przetrawiają i dostarczają dużo danych.  Im więcej „jedzą”, tym bardziej sprawne się stają. Amazonowi opłaca się więc wysyłać Tobie darmowe próbki produktów gdyż a) istnieje wysokie prawdopodobieństwo, że zakupisz pełną wersję produkty b) nawet jak nie zakupisz to obdarujesz algorytmy Amazona ciekawym pakietem danych. Ten z pewnością przyda się firmie do zwiększenia wartości zakupów, których w firmie dokonasz.

Siły sprzedaży

Salesforce (pochodzący z Krzemowej Doliny dostawca narzędzi dla sprzedawców) jest właścicielem miliardów rekordów danychi o pracy przedstawicieli handlowych, więc firma stworzyła asystenta dla handlowców o dumnym imieniu Einstein.Zbierając mnóstwo danych, Einstein sugeruje sprzedawcom jak lepiej rozwijać kontakty (o której godzinie najlepiej zadzwonić, co warto poruszyć w rozmowie, kiedy ponowić kontakt z klientem) i szkoli chaty, aby lepiej obsługiwały klientów w sposób automatyczny. 

Algorytmy stają się inteligentniejsze i dzięki temu lepiej sugerują klientowi, który futerał na smartfona wybrać, który model okularów przeciwsłonecznych lepiej pasuje do jego twarzy czy które wino będzie dobre do średnio wysmażonego stęka.

Spójrz na to zdjęcie:

Algorytm sugeruje jak lepiej napisać zdanie. Po lewej stronie wersja autora, po prawej stronie sugestia algorytmu. Wszystko w czasie rzeczywistym, podczas pisania.

Częściowo nadzorowany

Powiedziałbym, że trochę tego i tamtego, trochę nadzoru i trochę jego braku. Jeśli masz jakieś dane, ale nie masz ich dużo (miliardy rekordów), a jednocześnie możesz całkiem dobrze oznaczyć dane (wskazać, ze kot to kot a pies to pies). Na przykład jestem wynajmującym nieruchomości i posiadam kilka tysięcy rejestrów osób mieszkających w powiecie. Wiem, kto mieszka w promieniu 20 kilometrów, aby móc dokładniej reklamować, ale brakuje mi np. wieku lokatorów. Mogę więc poprosić algorytm, aby napisał mi tekst reklamowy. Tekst będzie niedoskonały, ale i tak zyskam, gdyż a) algorytm zrobi to automatycznie (niskie koszty) b) wyprodukuje mi kilkanaście wariantów. W efekcie i tak podniosę konwersję w stosunku do tego gdybym zatrudnił tradycyjną agencję reklamową.

Oto jak to działa:

a) Modele uczenia maszynowego używają ograniczonego zestawu oznaczonych przykładowych danych do przeprowadzenia operacji.

b) Częściowo wytrenowany model nie może dać pełnych wyników, ale może częściowo odgadywać wzorce. Na przykład mogę zrozumieć trend wieku badanych w moich danych, ale nie mogę określić płci ani pochodzenia etnicznego badanych.

c) Na koniec łączę oznaczone i nieoznakowane zestawy danych i startuję algorytmy. Mój model jest modelem mieszanym, a więc częściowo nadzorowanym.

Zdjęcia Google

Popularna usługa codziennie otrzymuje prezent od miliardy ludzi. Zbiór danych. Przesyłamy zdjęcia bez opisania co na nich jest. Google początkowo nie wie, czy to but czy banan. Google oznaczył już banany i buty, więc może łatwo przeszukać naszą bazę danych i znaleźć banany w naszym stosie zdjęć. Za każdym razem, gdy Google prosi Cię o oznaczenie twarzy swojego teścia, uczy się Twoich prywatnych etykiet. Co więcej, wszystkie częściowo sfotografowane banany lub części butów, które trudno znaleźć, ostatecznie zostaną oznaczone przez algorytmy Google. W efekcie Google oznaczy wszystko dzięki nam i sobie. Łącząc algorytmy nadzorowane i nienadzorowane.

W tym przypadku aplikacje uczenia maszynowego pozwalają firmom na wykorzystanie niedoskonałych zestawów danych i ulepszanie zestawu danych i algorytmu w dłuższej perspektywie. 

Modele ML firmy Behavox mogą słuchać rozmów pracowników

Behavox to fascynująca firma. Początkowo technologia mogła słuchać rozmów pracowników dużych instytucji finansowych, aby wytropić kolejne oszustwo. Pracownicy dogadywali się z klientami, którzy za „małe wynagrodzenie” płacili za wskazanie akcji w które warto zainwestować. Delikatnie przekraczano granicę porady i wkraczano w obszar pośrednictwa.

Pomyśl, jak trudno jest zrozumieć e-maile, rozmowy telefoniczne, jeśli jesteś algorytmem. Żadnej struktury. To „szukanie wzorców” jest wybitnie trudne. Nie możesz oznaczyć wszystkich danych, a niektóre, które możesz oznaczyć są trudne do „złowienia”. Założę się, że firma wykorzystuje nienadzorowane algorytmy uczenia maszynowego. Algorytm wykonuje etykietowanie, aby zapewnić realny model analityczny tekstu lub mowy ze spójną transkrypcją opartą na małej próbce.

Podsumowanie

Mam nadzieję, że udało mi się pomóc Tobie zrozumieć jakie są różnice pomiędzy nadzorowanymi, nienadzorowanymi i częściowo nadzorowanymi modelami uczenia maszynowego. Co możesz zrobić dalej, aby pójść w stronę zastosowania sztucznej inteligencji:

A) Zadaj sobie pytanie czy posiadane przez Twoją firmę dane są dobrze oznaczone. Wówczas możesz spróbować jakie osiągniesz efekty z wykorzystania algorytmów nadzorowanych

B) Jaką masz strategię biznesową? Jeśli działasz na rynku konsumenta, z pewnością posiadasz miliardy rekordów danych. Nienadzorowane algorytmu mogą w nich znaleźć nowe, atrakcyjne wzorce z których możesz wyjść do zaprojektowania nowej usługi lub produktu.

C) Czy jesteś zainteresowany eksperymentowaniem i inwestujesz w R&D? Warto zobaczyć jaką część budżetu przeznaczasz na badania i rozwój, może się okazać, że Twoi klienci chętnie wezmą udział w eksperymencie. Podobnie jak Google możesz ich poprosić o ich dane z którymi zbudujesz inteligentne algorytmy.

Zapisz się do newslettera jeśli masz ochotę i otrzymuj teksty na maila.

.