BigQuery. Droga do nowoczesnej analizy danych
Ocado: Duże rezultaty dzięki dużym danym
Ocado, największy na świecie internetowy sprzedawca artykułów spożywczych, podnosi wydajność operacyjną i jakość obsługi klienta dzięki uczeniu maszynowemu wspieranemu przez Google Cloud Platform.
Efekty wdrożenia rozwiązań Google Cloud i ML
- 4-krotnie krótszy czas reakcji na priorytetowe e-maile od klientów
- Wzrost wydajności centrum kontaktu o 7%, co pozwala konsultantom skupić się na najważniejszych zadaniach
- Dostarczanie analiz 80 razy szybciej i o 33% taniej w porównaniu z poprzednią hurtownią danych Ocado
- Redukcja kosztów IT przy jednoczesnym zapewnieniu skalowalności i elastyczności
Według firmy badawczej Mintel popularność internetowej sprzedaży żywności w Wielkiej Brytanii wzrośnie z obecnych 6% do 9% w 2021 roku. Jednym z pionierów handlu spożywczego działającego wyłącznie online jest firma Ocado z siedzibą w Hatfield. Od rozpoczęcia dostaw komercyjnych w 2002 roku firma urosła do 600 000 aktywnych klientów, realizując 260 000 zamówień tygodniowo i generując 1,39 miliarda funtów rocznego przychodu.
Ocado redefiniuje model zakupów, umożliwiając klientom korzystanie z intuicyjnych aplikacji webowych i mobilnych zamiast wizyt w supermarketach. Towary są kompletowane i pakowane w zautomatyzowanych magazynach, a następnie wysyłane bezpośrednio do klienta w ciągu godziny od wybrania produktów. Punktualność dostaw Ocado wynosi 95%, a zasięg usług obejmuje ponad 70% populacji Wielkiej Brytanii.
„Google Cloud Platform zapewnia nam elastyczność i możliwość radzenia sobie z dużymi, złożonymi wyzwaniami w obszarze danych, które są specyficzne dla naszej branży”.
Paul Clark, Chief Technology Officer, Ocado
Sukces firmy opiera się na budowaniu niemal całej technologii we własnym zakresie i wdrażaniu automatyzacji, która usprawnia e-commerce, przepływ pracy i logistykę. Ocado stworzyło również nową platformę — Ocado Smart Platform (OSP) — która oferuje dużym detalistom na całym świecie dostęp do najwyższej klasy rozwiązań w zakresie internetowej sprzedaży żywności.
Demokratyzacja uczenia maszynowego
Logistyka zakupów spożywczych online znacznie różni się od innych form e-handlu. Klienci często kupują dziesiątki produktów naraz, jedno gospodarstwo domowe może korzystać z wielu urządzeń, a zapasy żywności muszą wystarczyć na kilka dni.
„Często mówimy, że budując kompleksową platformę zdolną obsłużyć masową i zyskowną sprzedaż żywności online, możemy zająć się każdą inną formą handlu detalicznego — ale w drugą stronę to nie działa” — mówi Paul Clark, CTO w Ocado. „Google Cloud Platform daje nam narzędzia do rozwiązywania problemów z danymi, których nie pokonałyby standardowe systemy”.

Model biznesowy Ocado wykorzystuje preferencje konsumentów i łączy technologię cyfrową z codziennym doświadczeniem zakupowym.
„Google Cloud Machine Learning Engine zapewnia nam niezbędną elastyczność. Nasi programiści mogą korzystać z TensorFlow i bezpośrednio odczuwać korzyści płynące z uczenia maszynowego w chmurze”.
Paul Clark, Chief Technology Officer, Ocado
Firma integruje uczenie maszynowe (ML) ze swoimi systemami od ponad pięciu lat. Do niedawna aplikacje ML w Ocado wymagały zaangażowania ekspertów (często z tytułem doktora), którzy budowali rozwiązania od zera. Niezbędna była również kosztowna infrastruktura lokalna do ich trenowania.
Współpraca z Google w ramach testów Machine Learning Engine przyspieszyła adopcję AI w firmie.
„Zastanawialiśmy się, jak chmura może zdemokratyzować sztuczną inteligencję” — mówi Paul. „Google Cloud Machine Learning Engine daje nam swobodę. Programiści używają TensorFlow i widzą realne efekty pracy modeli w środowisku chmurowym”.
TensorFlow to biblioteka ML open-source stworzona przez zespół Google Brain. Specjaliści Ocado wykorzystują ją obecnie w wielu projektach, wdrażając modele budowane w Google Cloud Machine Learning Engine. Pozwala to na szybsze trenowanie systemów na serwerach i urządzeniach mobilnych za pośrednictwem jednego interfejsu API. Co więcej, usługa ta łatwo integruje się z innymi produktami GCP używanymi w Ocado.
Czego naprawdę chcą kupujący?
Pierwszym modelem ML zbudowanym w Ocado na bazie TensorFlow był system do analizy i kategoryzacji wiadomości e-mail oraz ustalania priorytetów odpowiedzi. Biuro obsługi otrzymuje tysiące zapytań dziennie. Ocado chciało zautomatyzować proces rozpoznawania, które z nich wymagają natychmiastowej reakcji (np. zmiana godziny dostawy), a które mogą poczekać (np. ogólne zapytanie ofertowe).
„Wykorzystanie agentów automatycznych do segregacji poczty poprawia unikalność obsługi Ocado i satysfakcję użytkowników”.
James Donkin, CEO Ocado
„Dostajemy mnóstwo e-maili z pochwałami, ale gdy pogoda lub korki wpływają na dostawy, liczba pilnych spraw gwałtownie rośnie” — wyjaśnia James Donkin, CEO Ocado. „Automatyzacja obsługi mniej priorytetowej poczty pozwala nam reagować tam, gdzie czas jest krytyczny”.
Wykorzystując dane gromadzone latami, Ocado wytrenowało sieci neuronowe, które najlepiej priorytetyzują wiadomości. Po wdrożeniu najskuteczniejszego modelu czas reakcji na pilne zgłoszenia skrócił się czterokrotnie. Okazało się też, że 7% e-maili w ogóle nie wymaga odpowiedzi, co odciążyło pracowników biura.
„Bez Machine Learning Engine od Google Cloud odniesienie sukcesu w takim projekcie byłoby znacznie trudniejsze” — mówi Roland Plazowski, który kierował inicjatywami Big Data w Ocado. „Nawet przy dużych inwestycjach w sprzęt, zarządzanie tak intensywnymi obliczeniami byłoby kosztowne i trudne bez łatwo skalowalnej infrastruktury”.

Dzięki analizie danych Ocado maksymalnie ułatwia zakupy. Systemy mogą sugerować produkty do koszyka, przypominać o zapomnianych artykułach czy oferować spersonalizowane pakiety promocyjne.
„Klienci widzą produkty dopasowane do nich, a nie ogólne oferty” — mówi James. „Jako wegetarianin otrzymuję zniżki na produkty roślinne, które kupuję, oraz propozycje nowości w tej kategorii. Najmniej chciałbym widzieć oferty, które zupełnie mnie nie interesują”.
Maszyny i uczenie maszynowe
W obszarze Internetu Rzeczy (IoT) Ocado ulepsza swoje roboty magazynowe za pomocą ML. Integralną częścią platformy OSP są tysiące robotów stale przesyłających dane do Google Cloud Storage i Google BigQuery.
Analitycy Ocado pracują nad „inteligencją roju”, która pozwoli robotom na jeszcze lepszą współpracę. Projekty obejmują modele analizujące dane telemetryczne — od stanu baterii po poprawność aktualizacji oprogramowania — w celu optymalizacji harmonogramów i wykrywania zużycia części.

„Pracujemy nad wbudowaniem ML bezpośrednio w roboty, aby stały się inteligentniejsze w autotestowaniu i obsłudze błędów” — mówi Paul. „To złożone połączenie IoT i analityki, w którym Google BigQuery i ML Engine sprawdzają się najlepiej”.
„Stare bazy danych nie były wystarczająco szybkie. Potrzebowaliśmy rozwiązania, które rośnie wraz z ilością danych. Google Cloud Storage i Google BigQuery to dziś fundament danych dla Ocado Smart Platform”.
Paul Clark, Chief Technology Officer, Ocado
Skala dla nowego biznesu
Skalowalność była kluczowym powodem migracji danych do chmury. Ocado chciało poprawić doświadczenia użytkowników, dać zespołom biznesowym lepszy wgląd w dane i zredukować koszty IT, dlatego postawiło na Google Cloud Platform.
Ocado szacuje swoje zasoby danych na około dwa petabajty. Połączenie informacji z łańcucha zakupowego i dostaw pomaga zespołom operacyjnym i wspiera ambicje firmy w komercjalizacji OSP.
„Sprzedaż OSP jako usługi zarządzanej pozwala nam zyskać przewagę na rynkach międzynarodowych” — dodaje Paul. „Chcemy oferować naszą platformę szerokiemu gronu odbiorców B2B”.
Każdy nowy klient korzystający z OSP otrzymuje dedykowaną instancję dostosowaną do jego potrzeb. Wydajność tych systemów musi być gotowa na szybkie skalowanie, obsługując uznanych sprzedawców z ogromną bazą produktów i transakcji.

Pierwszy klient Ocado, firma Morrisons (jedna z największych sieci supermarketów w UK), już czerpie korzyści z tej decyzji. Dzięki GCP Ocado przechowuje i analizuje terabajty danych Morrisons, wykorzystując dedykowane zbiory danych i Google BigQuery.
Ocado wykorzystuje również frameworki open-source, takie jak Apache Spark i Apache Hadoop na Google Compute Engine. Przejście na BigQuery uwolniło analityków od złożonych zapytań i pozwoliło na łatwiejszą współpracę z partnerami.
Google BigQuery świetnie współpracuje z TensorFlow, Google Cloud Dataproc i innymi usługami, co pozwala Ocado na swobodne przetwarzanie potokowe i strumieniowe. Dzięki Google Cloud Dataflow programiści poświęcają mniej czasu na administrację, a więcej na dostarczanie wartości biznesowej.
„Po prostu uruchamiamy zapytania i płacimy za zużyte zasoby” — podsumowuje Roland. „Największym zwycięstwem jest to, że BigQuery nie wymagało żadnej konfiguracji, a na największych zbiorach danych działa 80 razy szybciej niż nasz klaster Hadoop, kosztując przy tym o jedną trzecią mniej”.












