search
Przypadki klientów Case studies Google Cloud – Przypadek klienta: MacPaw

O firmie

MacPaw to produktowa firma IT, która tworzy innowacyjne oprogramowanie zwiększające wydajność użytkowników komputerów Mac. Miliony osób na całym świecie korzystają z produktów MacPaw, w tym CleanMyMac, CleanMy®Phone, Setapp i ClearVPN. Firma została założona przez Ołeksandra Kosowana w 2008 roku.

Obecnie MacPaw koncentruje się na rozszerzaniu możliwości użytkowników, zespołów i deweloperów dzięki sztucznej inteligencji. Eney od MacPaw — inteligentny asystent AI dla Maca, który zmienia sposób interakcji z komputerem i przyspiesza przejście do ery Software 3.0.
Osobnym, kluczowym obszarem działalności MacPaw jest cyberbezpieczeństwo. Firma bada nowe rodzaje złośliwego oprogramowania i zapewnia niezawodną ochronę dzięki Moonlock — nowej aplikacji cyberbezpieczeństwa dla użytkowników Maca.

Data rozpoczęcia projektu: 30 maja 2020
Data zakończenia projektu: Współpraca nadal trwa

Kraj

Ukraina

Branża

IT

Oprogramowanie

Technologie

Stos technologiczny

Google Cloud Platform

BigQuery

Google Cloud Storage

Google Kubernetes Engine

Cloud Composer

Apache Spark

Pub/Sub

Looker Studio

Vertex AI

Statystyki

10× szybsze zapytania dzięki architekturze serverless BigQuery

3× niższe koszty analityki dzięki modelowi rozliczeń BigQuery (on-demand pricing)

Dziesiątki datasetów z kontrolą dostępu poprzez IAM i Authorized Views

BigQuery w praktyce: jak MacPaw przyspieszył analitykę 10× i stworzył jednolity DataHub

 

Wyzwanie: potrzeba szybkiej analityki

MacPaw każdego dnia przetwarza duże wolumeny danych: zachowania użytkowników, skuteczność działań marketingowych oraz analizy wydań nowych produktów. To codzienne zadania analityków biznesowych, które często wymagają znacznych nakładów czasu i zasobów.

Początkowo firma korzystała z Google Analytics oraz niewielkich, wewnętrznych rozwiązań. Jednak szybko stało się jasne, że to nie wystarczy. Google Analytics ograniczało dostęp do surowych danych z powodu samplingu, a połączenie tych danych z innymi źródłami — platformami reklamowymi, systemami płatności, produktami wewnętrznymi i backendem — było niemożliwe.

Aby uzyskać pełny i kontrolowany zestaw danych, zespół zbudował platformę analityczną opartą na Redshift. Z czasem Redshift przestał spełniać wymagania dotyczące szybkości i elastyczności, co wymusiło poszukiwanie nowego fundamentu technologicznego. W efekcie zespół wybrał Google BigQuery — rozwiązanie, które stało się podstawą nowego DataHubu.

BigQuery jako fundament DataHubu

Gdy tylko zespół przeszedł na BigQuery, stało się jasne: to nie jest tylko kolejna baza danych. To zupełnie inne podejście do analityki.

Obecnie zespół wykorzystuje BigQuery jako centralną platformę do przechowywania i przetwarzania danych oraz stworzył własny produkt wewnętrzny — DataHub. Gromadzi on dane ze stron MacPaw oraz z dodatkowych systemów i jest intensywnie wykorzystywany do analityki i raportowania. To miejsce, w którym odpowiedzi znajdują wszyscy — od analityków po marketerów.

Dlaczego BigQuery?

Zespół MacPaw wskazał kilka kluczowych zalet, które przesądziły o wyborze BigQuery:

  • Szybkie przetwarzanie danych umożliwiające wykonywanie złożonych obliczeń i uzyskiwanie wyników w sekundach zamiast godzin.
  • Wysoki poziom bezpieczeństwa, niezbędny do przechowywania danych krytycznych dla biznesu.
  • Model rozliczeń oparty na rzeczywistym zużyciu danych — wygodny zarówno dla dużych, jak i mniejszych firm.
  • Przejrzysty i intuicyjny interfejs, który ułatwia pracę analitykom i nie wymaga znajomości języków programowania.
  • Wbudowane możliwości ML pozwalające wykorzystywać usługi uczenia maszynowego i AI w Google Cloud.
  • Wizualizacja danych w Looker Studio (wcześniej Google Data Studio).

Od tego czasu firma znacznie rozszerzyła architekturę w Google Cloud, zwiększyła ilość danych i uruchomiła pierwsze potoki AI. Poniżej przedstawiono, jak ewoluował ekosystem danych MacPaw.

„Do pracy z Google BigQuery wystarczą nawet minimalne zasoby komputera, aby przetwarzać dowolny wolumen danych. Wszystkie obliczenia odbywają się na serwerach Google, a urządzenie jedynie wysyła zapytania i odbiera wyniki. To szybsze, prostsze i bardziej efektywne.”
Dmytro Osijuk Główny analityk, MacPaw

Jak to działa dziś: aktualna architektura i skala

Od 2020 roku wykorzystanie Google Cloud do pracy z danymi w MacPaw wzrosło ponad trzykrotnie. Było to efektem przejścia na własne rozwiązania analityczne oraz rozbudowy ekosystemu.

Obecnie MacPaw korzysta z elastycznej architektury opartej na Google Cloud, obejmującej wszystkie kluczowe etapy pracy z danymi i zbudowanej wokół BigQuery jako centralnego elementu. Przetwarzanie i automatyzacja realizowane są w Google Kubernetes Engine (GKE) z wykorzystaniem Airflow i Spark.

Do przesyłania zdarzeń wykorzystywany jest Pub/Sub, a wszystkie dane — od surowych po przetworzone — przechowywane są w Google Cloud Storage (GCS) w formacie Delta Lake. Główną hurtownią danych jest BigQuery, łączący tabele zarządzane oraz BigLake do analizy danych bezpośrednio z GCS.

Wizualizacja wyników odbywa się w Looker Studio, a zespół Data Science trenuje i wdraża modele w Vertex AI.

Jednolity ekosystem dla biznesu

Taka architektura pozwala zespołowi szybko uruchamiać nowe produkty i testować pomysły bez obaw o dostępność zasobów. Wszystkie dane znajdują się w jednym repozytorium, z precyzyjnym zarządzaniem dostępem poprzez IAM. Dziesiątki zestawów danych nie stanowią już wyzwania — to codzienność.

W efekcie MacPaw zyskał jedną platformę, która zapewnia:

  • stabilną infrastrukturę dla działania produktów;
  • szybki i bezpieczny dostęp do analityki;
  • możliwość skalowania inicjatyw AI bez inwestycji we własne serwery.

 

MacPaw team

Ewolucja BigQuery: od pierwszych datasetów do dziesiątek

MacPaw za kluczową korzyść biznesową uznaje wzrost produktywności i efektywności zespołów pracujących z dużymi zbiorami danych. BigQuery skraca czas oczekiwania na obliczenia i wyniki, co bezpośrednio przyspiesza analitykę i ogólne tempo działania firmy.

Rozwiązanie jest łatwe do skalowania i elastyczne w zarządzaniu, co upraszcza integrację danych dla data engineerów i pozwala przechowywać coraz większe wolumeny bez konieczności zakupu dodatkowej infrastruktury.

  • Na początku DataHub działał na 1–2 datasetach.
  • Obecnie — dziesiątki datasetów z kontrolą dostępu poprzez IAM i Authorized Views.
  • Wykorzystywany jest BigQuery streaming ingestion do analityki bliskiej czasu rzeczywistego.
  • Dodano BigLake do wykonywania zapytań SQL bezpośrednio na danych w GCS.
„Dzięki praktycznie nieograniczonym zasobom BigQuery zawsze mamy pewność, że możemy przeanalizować potrzebną ilość danych. Jest to kluczowe w okresach wydań i aktualizacji, gdy wiele osób analizuje dane i trzeba szybko wyciągać wnioski. BigQuery — pierwszy punkt, na który zwracają uwagę analitycy i na podstawie którego tworzone są pulpity nawigacyjne dla menedżerów wszystkich szczebli.”
Oleksii Sopov Lead Data Engineer, MacPaw

Vertex AI: gdy analityka przechodzi w prognozy

Kolejnym krokiem było przejście od samej analizy danych do budowania prognoz. W tym celu MacPaw zintegrował Vertex AI.

Vertex AI stanowi fundament działań z zakresu uczenia maszynowego w MacPaw. Jest zintegrowany z całym ekosystemem Google Cloud, umożliwiając szybkie eksperymenty oraz tworzenie wielokrotnego użytku pipeline’ów treningowych, w tym pracę z dużymi modelami językowymi i deep learningiem — bez dodatkowej infrastruktury.

Efekt: krótsze cykle rozwoju modeli, skalowalne projekty AI oraz przejrzyste zarządzanie kosztami.

Wpływ na biznes

MacPaw zbudował jednolity ekosystem danych, w którym każda decyzja oparta na danych zaczyna się w BigQuery i kończy na dashboardach Looker Studio. Firma zoptymalizowała koszty, jednocześnie zyskując skalowalność, bezpieczeństwo i szybkość niezbędne do dalszego wzrostu.
Kluczowe rezultaty:

10× szybsze zapytania dzięki architekturze serverless BigQuery, która błyskawicznie dostarcza zasoby niezbędne do obliczeń o dowolnym stopniu złożoności.
3× niższe koszty analityki dzięki modelowi rozliczeń BigQuery (on-demand pricing).
Efektywne przetwarzanie terabajtów danych dziennie przez zespół analityków i inżynierów danych, ponieważ BigQuery w pełni przejmuje administrację infrastrukturą.
Centralizacja ponad 90% danych w BigQuery i GCS, co zapewnia jedno źródło prawdy dla całej firmy oraz wysoką niezawodność.
Looker Studio dostarczające realne insighty dla marketingu, produktu i kadry zarządzającej, pracując bezpośrednio na danych w BigQuery.
Vertex AI pozwolił na przejście od prostej analityki do tworzenia modeli predykcyjnych, co położyło solidny fundament pod przyszłe rozwiązania AI w produktach MacPaw.
Skaluj analitykę, obniżaj koszty i rozwijaj rozwiązania AI razem z Cloudfresh Połączmy się

Co dalej: AI jako kolejny priorytet

MacPaw nie zatrzymuje się: w planach jest jeszcze więcej przypadków zastosowania sztucznej inteligencji. Uwaga skupia się na Vertex AI i wszystkim, co pozwala szybko uruchamiać modele prognostyczne, eksperymentować i nie przepłacać za infrastrukturę, wykorzystując możliwości Google Cloud.

„Uważam, że AI to kierunek, który warto wzmacniać poprzez technologie chmurowe. Sztuczna inteligencja i chmura są obecnie niemal nierozerwalnie związane i chcę widzieć więcej narzędzi i technologii.”
Oleksii Sopov Lead Data Engineer, MacPaw

MacPaw Cloudfresh Office

Cloudfresh jako zaufany partner MacPaw

Aby wszystko działało stabilnie, MacPaw potrzebował nie tylko odpowiednich narzędzi, ale także zespołu, który doradzi, pomoże i wesprze w krytycznych momentach. Takim partnerem został Cloudfresh. Jako Google Cloud Premier Partner, Cloudfresh zapewnił kompleksowe doradztwo w zakresie BigQuery i pomógł zintegrować rozwiązanie z ekosystemem MacPaw. Eksperci Google Cloud z Cloudfresh nadal wspierają firmę w kwestiach technicznych.

Na czym polegała rola Cloudfresh?

  1. Konsultacje architektury danych: optymalizacja struktur datasetów w BigQuery, konfiguracja IAM, bezpieczeństwo i skalowanie.
  2. Szybkie wsparcie w sytuacjach krytycznych: pomoc w przywracaniu usług i minimalizacji ryzyka przestojów.
  3. Bezpośrednia komunikacja z Google: rola zaufanego pośrednika w usuwaniu blokad dzięki bezpośredniemu dialogowi z dostawcą.
  4. Ekspertyza w obszarze AI i ML: rekomendacje dotyczące wykorzystania Vertex AI do szybszego wdrażania i skalowania modeli.

Współpraca z Cloudfresh trwa nadal — nadal wspieramy zespół MacPaw, dzieląc się naszą wiedzą, zapewniając wsparcie i oferując nowe możliwości Google Cloud.

Skontaktuj się z Сloudfresh