- enjoyGrowth!
- Posts
- 🧠 Korelacja i regresja liniowa
🧠 Korelacja i regresja liniowa
Metody statystyczne jako wsparcie akwizycji i retencji - na przykładzie MyFitnessPal, Rainforestqa, czy firmy udzielającej kredytów
Pełny dostęp do tego wydania mają tylko członkowie EnjoyGrowth! PRO 🔒️ 😎 Jeżeli widzisz fragment materiału, to tu znajdziesz szczegóły, jak odblokować pozostałą część wartościowych treści 🧠
Korelacja i regresja liniowa mogą pomóc w znalezieniu zależności, dzięki którym będzie możliwy wpływ na akwizycję i retencję, a także revenue 📈 Na wstępie możliwie prosto znajdziesz wyjaśnienie dwóch metod statystycznych - do każdej z nich są dodane biznesowe case studies m.in. aplikacji fitnessowej, footfallu i sprzedaży. Enjoy!
Korelacja sprawdza, czy istnieje związek między dwiema zmiennymi, ale nie bada związku przyczynowo - skutkowego. Najczęściej stosowany współczynniki korelacji to r Pearsona. Korelacja może być dodatnia lub ujemna. Wartości korelacji od 0 do 0,3 oznaczają słaby związek, od 0,3 do 0,5 związek umiarkowanie silny natomiast wartości od 0,5 do 1 mówi o związku silnym lub bardzo silnym. Przykładowo za pomocą korelacji możemy sprawdzić, czy częstsze zakupy w sklepie online są związane z wyższą częstotliwością reklam, z którymi użytkownik ma kontakt.
Korelacja pozytywna oznacza, że wzrost jednego czynnika ma wpływ na wzrost drugiego np. więcej odsłon reklam, to częstsze zakupy.
Korelacja negatywna z kolei oznacza, że wzrost jednego czynnika obniża poziom drugiego np. większa liczba rabatów obniża częstotliwość zakupów (bo potencjalnie użytkownicy robią zapasy produktów);
Na YouTube jest dostępny krótki i prosty materiał o tym jak obliczyć współczynnik korelacji Pearsona, totalnie zachęcam do obejrzenia kilkuminutowego materiału dostępnego pod linkiem.
Korelację zastosowano w MyFitnessPal.com (jest to aplikacja do monitorowania postępów w odżywianiu) do sprawdzenia, czy istnieje związek między rejestrowaniem posiłków a retencją tzn. czy użytkownicy, którzy zarejestrowali posiłki częściej wracali do aplikacji w ciągu 14 dni. Wynik wyniósł 0,564, więc potwierdził, że taki związek zachodzi. Olga Berezovsky, liderka zespołu Product Analytics w MyFitnessPal w materiale “How to do linear regression and correlation analysis” wskazała, że:
Amplitude says it’s “highly predictive,” meaning there is a high likelihood of food logging predicting high retention. That said, it doesn’t mean that new users registering tomorrow and logging more foods will have better retention. There is still work to do to prove that. This just indicates that based on our historical data:
A big percentage of users who logged food in their first 7 days after signup returned to the app on the 14th day.
Among users who returned to the app on the 14th day, a big percentage of them had logged food in their first 7 days.
There is no proof yet that every new user who will log in twice as often will show improved retention.
Podobne ćwiczenie wykonano dla innych aktywności, które można zarejestrować w aplikacji np. wskazanie ilości wypitej wody, rejestracja ćwiczeń etc. —> wyniki były niższe niż wspomniany przykład z posiłkami.
Źródło: Olga Berezovsky, https://www.lennysnewsletter.com/p/linear-regression-and-correlation-analysis z dnia 22.07.2023
Korelacji używa także Rainforestqa.com (jest to no-code platforma do zautomatyzowanych testów strony zanim trafi ona na produkcję), dzięki której oszczędzają średnio 10 godzin tygodniowo, jeszcze lepiej identyfikują klientów i prognozują wzrost wskaźnika ARR (annul reccuring revenue - roczny powtarzalny przychód). W jaki sposób wykorzystują korelację?
The CX team primarily uses Correlated to capture when leads in their ICP are showing strong intent toward their key products (for example, use of their CI Pipeline or reaching feature limits on their lower plans), and taking the right next steps to qualify for conversion.
Additionally, they target customers who are failing to complete important actions and are showing early indicators of churn (for example, an increase in failed “runs” or a significant decrease in total “runs” in the Rainforest QA app).
Billy Goudy jasno wskazał, że wcześniejsze wyłapywanie trendu spadkowego pozwala im lepiej zarządzić ryzykiem, bo widzą to w czasie rzeczywistym - przykładowo wychwytując wzrost wskaźnika churn. We don’t have to wait until the next month to see what happened, we already know their usage is trending down and can now dive into those accounts before it's too late.

Z kolei Unacast.com przeprowadziło analizę korelacji pomiędzy footfallem w sklepach a przychodami poszczególnych marek. Według ich wyników taka korelacja zachodzi, ale nie dla wszystkich branż. Elena Solodov wskazała, że Foot traffic is a predictor of financial performance for industries where in-person transactions inform a majority of a company’s total revenue. We found significantly high correlations between traffic and revenue in the following industries: hotels, self storage, movie theaters, car and truck rental, and casual restaurants. Correlations between foot traffic and revenue aren’t always limited to industries centered around in-person transactions. We found significant predictive relationships for industries like Computers and Consumer Electronics where e-commerce sales are dominant but brick-and-mortar stores are still in play.
Zaskoczyła mnie obecność elektroniki w tym zestawieniu, aczkolwiek rozumiem to tak, że w przypadku większych zakupów (np. telewizor, komputer) konsumenci chętniej zaglądają do sklepów, aby obejrzeć produkt albo po prostu porozmawiać z doradcą.
Źródło: Elena Solodov, https://www.unacast.com/post/can-foot-traffic-predict-quarterly-revenue z dnia 22.07.2023
Korelację także znaleziono pomiędzy wskaźnikiem NPS (net promoter score) i revenue:
NPS improvement drives revenue growth. Research by CustomerGauge has found that a 10+ increase in NPS score correlates with a 3.2% increase in upsale revenue.
NPS best practices impact revenue. Our research found that following best practices, like surveying multiple times per year increase customer retention. Furthermore, closing the loop on NPS feedback increased retention by 8.5%.

Źródło: Ian Luck, https://customergauge.com/blog/nps-impact-on-revenue z dnia 22.07.2023
Regresja liniowa jest rozszerzeniem korelacji i w tej analizie jest możliwe wzięcie pod uwagę większej liczby zmiennych niż dwóch. Przykładowo czy zwiększając budżet o 20% zwiększymy o tyle samo liczbę transakcji? Albo o ile potrzebujemy zwiększyć ruch na stronie, aby wzrosła sprzedaż? Czy zwiększając liczbę powiadomień z notyfikacji zwiększymy retencję?
Olga Berezovsky we wspomnianym wcześniej materiale wskazała także, że w MyFitnessPal.com we use linear regression to estimate how many meals users have to log to become “sticky” or how many days users have to use the app to upgrade their subscription plan. Czyli nie tylko próbują znaleźć zależności pomiędzy aktywnościami userów a retencją w aplikacji (korelacja), ale też próbują przewidzieć ile czasu upłynie zanim użytkownik zdecyduje się na płatną subskrypcję (regresja liniowa).
Jedna z firm udzielających kredytów w Sztokholmie sprawdziła, czy rentowność klientów na rynku kredytów konsumenckich można przewidzieć za pomocą wielokrotnej regresji liniowej. W badaniu uwzględniono dane, które zebrano przed udzieleniem kredytu oraz te, które są związane z aktywnością na koncie klientów w trakcie pierwszych 9 miesięcy. Wyniki nie są idealne, wręcz są obarczone błędem, ale i tak na ich podstawie wyciągnięto kilka interesujących wniosków:
Some other insights were found. The status of the customer after nine month is a powerful signal regarding the probability of profitability during the coming months. Further, the account activity during the first nine months yields some good indications. The Credit limit after nine months and Last bill are the two variables of this type that have the strongest positive correlation with the customer profitability. Last payment and Largest payment have the strongest negative correlation with the customer profitability.
Further, some variables collected before the initial credit is accepted seem to indicate a profitable customer. A higher spending on groceries and more owned properties may decrease the risk of becoming unprofitable.
Źródło: Andrea Almgren, Using Multiple Linear Regression to Estimate Customer Profitability in Consumer Credits, 2021, https://www.diva-portal.org/smash/get/diva2:1652415/FULLTEXT01.pdf - dostęp z dnia 22.07.2023
🤓 NAJWAŻNIEJSZA RZECZ DO ZAPAMIĘTANIA: Na pytanie CZY istnieje związek pomiędzy dwoma czynnikami - odpowie korelacja, ale już na pytanie JAK jeden czynnik wpływa na drugi - regresja liniowa.
Daj znać jak oceniasz powyższą treść 🙂 |
Reply