Ucz się wizualizacji i… pomagaj Fundacji

Czy można jednocześnie robić fajny projekt analityczny, budować portfolio, uczyć się nowych rzeczy i pomagać innym? Okazuje się, że tak. O tym jak to zrobić przeczytasz w tym artykule.

Akcja #BI_NGO

Klaudia Stano znana z bloga Język Danych, swojego kursu o wizualizacji danych oraz wpisów na Linkedin ogłosiła niedawno pierwszą edycję projektu #BI_NGO.

Na czym polega projekt #BI_NGO?

Uczestnicy mają za zadanie stworzyć wizualizację danych dla Fundacji Gajusz, skupiając się na dwóch problemach społecznych: opuszczaniu noworodków w szpitalach oraz wychowywaniu dzieci w pieczy zastępczej. Wizualizacje mogą być wykonane w dowolnej formie (wykresy, dashboardy, infografiki, itp.) i dowolnym narzędziu.

Od kiedy do kiedy trwa projekt #BI_NGO?

Zgłoszenie wysyłasz w dowolnym terminie od 13 listopada do 11 grudnia 2024 roku.

Dlaczego warto wziąć udział?

W tej edycji  Każdy uczestnik otrzyma feedback od Fundacji, a najlepsza praca zostanie wyróżniona. Projekt ma podwójny cel: pomoc organizacji społecznej w prezentacji ważnych danych oraz umożliwienie uczestnikom rozwoju umiejętności wizualizacji danych i budowania portfolio.

Gdzie znajdziesz więcej informacji (w tym dane do projektu)?

Strona projektu #BI_NGO

Rozmowa Klaudii z przedstawicielką Fundacji Gajusz


Moje zgłoszenie

Uważam, że akcja #BI_NGO to świetny pomysł. Warto przed Świętami zrobić dobry uczynek pomagając innym (a dobrze zrobione wizualizacje mogą pomóc w promocji Fundacji). To kwestia podstawowa. Ale niejako “efektem ubocznym” takiego wolontariatu jest możliwość pracy na realnych danych i stworzenie od zera wizualizacji. Nikt nie ogranicza Cię co do formy i użytych narzędzi. Możesz zrobić projekt i umieścić go w swoim portfolio jeśli efekt będzie fajny. Również ciekawą zachętą może być feedback jaki dostajesz od Klaudii na temat swojej pracy.

Moim zdaniem ten pomysł nie ma minusów. Wszyscy mogą na nim zyskać – takie “win-win”. Wystarczy poświęcić na to trochę czasu (podpowiadam – wystarczy zrezygnować z wieczorku z Netflixem 😎).

Może dodatkowo zachęci Cię fakt, że… sam też postanowiłem wziąć udział w akcji i przygotować swoje zgłoszenie. W dalszej części artykułu pokażę Ci co zrobiłem i jak to zrobiłem – tak, żeby każdy mógł dodatkowo dowiedzieć się czegoś nowego.


Startujemy…

Na początek radzę – zarezerwuj sobie jakiś wolniejszy wieczorek (mi akurat wieczorem się lepiej nad takimi tematami pracuje…). Planowałem opracować i zrobić projekt w godzinkę – góra dwie. A z tego co pamiętam zamknąłem się w około 4-5 godzinach. I najlepsze jest to, że potrwało to dłużej niż zakładałem, bo nie mogłem się oderwać od przygotowywania projektu 😉

Od czego zacząłem?

Po pierwsze odwiedziłem stronę projektu i pobrałem dane. Nie jest tego dużo – to tylko cztery pliki Excelowe:

https://jezykdanych.pl/bi-ngo-1/

Możemy zająć się dwoma tematami: dziećmi w pieczy zastępczej oraz noworodkami pozostawionymi w szpitalach. Dwa ciężkie zagadnienia, ale mój wybór padł na noworodki – jako tata dwójki wspaniałych maluchów lepiej czułem ten temat. 👨‍👩‍👧‍👦

W pierwszym kroku postanowiłem wykonać cały projekt w Excelu i pobrałem pliki na temat liczby dzieci urodzonych i noworodków pozostawionych w szpitalach. Wrzuciłem do jednego pliku, żeby lepiej mi się na to patrzyło i łączyło. Tabela z danymi dotyczącymi dzieci urodzonych wygląda mniej więcej tak:

Mamy więc dane w sztukach w poszczególnych latach oraz województwach. Podobną strukturę mają dane na temat noworodków opuszczonych. Zerknij:

Po krótkich oględzinach danych wpadła mi do głowy pewna koncepcja…


Koncepcja pokazania danych

Po podsumowaniu danych z każdego roku w skali całej Polski okazało się, że:

  • Liczba noworodków opuszczonych czasem rośnie, czasem maleje, na przykład w 2023 roku nie była najwyższa w historii, ale…
  • Liczba dzieci urodzonych ogółem systematycznie spada od 2018 roku, więc…
  • Dobrze byłoby powiązać te dwie wartości np. poprzez udział noworodków opuszczonych w ogólnej liczbie urodzeń, co okazało się słusznym ruchem, ponieważ…
  • Odsetek noworodków opuszczonych w ogólnej liczbie noworodków rośnie od 2018 roku i w ostatnim roku jest na historycznym poziomie 0,23%, co…
  • Nie znaczy zupełnie nic dla odbiorcy, bo trudno wyobrazić sobie taką liczbę, dlatego też…
  • Postanowiłem zabawić się w storytelling 😉

No dobrze to na początku spójrzmy jeszcze raz jak wygląda udział noworodków opuszczonych do urodzonych ogółem w poszczególnych latach:

Widać wyraźnie, że problem robi się z roku na rok coraz poważniejszy i te liczby to właśnie pokazują. Mała dygresja – nie zawsze warto patrzeć na ilości w oderwaniu od całego zjawiska – tutaj patrząc na same liczby dzieci opuszczonych nie zobaczylibyśmy wyraźnego trendu. Dopiero zestawienie takich liczb z wyraźnie spadającą liczbą nowych narodzin pozwala osadzić dane w rzeczywistości – czyli podobna liczba opuszczonych dzieci ale przy dużo niższej liczbie porodów.

Potrzebowałem przedstawić te 0,23% w jakiejś przystępnej formie i wpadłem na pomysł, że wyliczyć “co które dziecko urodzone zostanie opuszczone”. Innymi słowy “1 na x” noworodków jest opuszczane tuż po przyjściu na świat.

Taką proporcję możemy dość prosto policzyć dzieląc 1 przez uzyskany udział czyli 1/0,23% = 434,5 dziecka (około). Żeby liczba była łatwiejsza do zapamiętania zaokrągliłem ją w górę do pełnych dziesiątek i powstało hasło przewodnie “1 na 440… To dużo czy mało?


Raport – części opisowe

Postanowiłem stworzyć mini raport – z częściami opisowymi oraz wizualizacjami pozwalającymi na lepsze zobaczenie danych.

Wszystko w Excelu – wystarczy scalanie komórek, praca z wielkością czcionki i ukrycie linii siatki. Część opisów pochodzi wprost od Fundacji, część ode mnie (szczególnie te, gdzie pojawiają się liczby):

Jedna rada – nie tylko w tym projekcie, ale ogólnie gdy przygotowujemy raport/wykresy/cokolwiek dla konkretnej firmy/podmiotu – trzymajmy jej założenia co kolorystyki i czcionek. W tym wypadku okazuje się, że Fundacja w swoich materiałach używa określonego kroju czcionki i ma swój standard graficzny. Wykorzystałem ten fakt zmieniając odpowiednio czcionkę i kolory w Excelu (swoją drogą bardzo ładny font – nie znałem Raleway).


Wizualizacje

Kombinowałem trochę z różnymi wizualizacjami, które pozwoliłyby najlepiej pokazać co kryje się w danych. I postanowiłem w raporcie umieścić 4 wykresy.

Wykres liniowy – pokazujący zmieniające się w czasie wartości udziału noworodków opuszczonych w ogólnej liczbie urodzeń.


Na co warto zwrócić uwagę?

  • tytuł wykresu daje nam opis tego co widzimy na wykresie
  • czerwona linia przez zastosowanie czerwonego koloru jest dość… sugestywna i łatwo odczytać z niej trend (dodatkowo cień dał ciekawy efekt)
  • warto zadbać o data explainabilty od razu na wykresie – wyjaśnienia nietypowych sytuacji widocznych na wykresie (lata 2016-2017 oraz rok 2023)
  • daj informację o tym skąd pochodzą dane.

 

Wykresy słupkowe – pokazujące trendy w liczbie urodzeń oraz liczbie opuszczonych noworodków:

Tutaj ciekawie wyszło:

  • zestawienie dwóch wykresów jeden pod drugim, tak, żeby łatwo można było zobaczyć jak wygląda sytuacja na jednym i drugim w konkretnym roku,
  • strzałki pokazujące procentową zmianę liczb w ciągu ostatnich 5 lat,
  • tytuły wykresów przekazujące historię “liczba opuszczonych noworodków rośnie o 1/3 podczas gdy w tym samym czasie liczba narodzin spada o prawie 1/3” – celowo w nagłówkach nie używałem procentów i streściłem to co widać poniżej na wykresach.

Na sam koniec niedługiego raporciku postanowiłem wykorzystać jeszcze dane pochodzące z różnych województw. Chciałem sprawdzić czy pod względem opuszczania noworodków jedne województwa wypadają lepiej a inne gorzej. Jeśli tak to czy dysproporcja jest duża.

A oto wyniki. Postanowiłem przedstawić je w postaci wykresu lizakowego (sprawdza się lepiej niż słupki, gdy niektóre kategorie są bardzo długie a inne niekoniecznie).

Tym razem wyszło także całkiem zgrabnie:

  • udało się pokazać, że dysproporcja jest ogromna w skali Polski
  • zwróciłem uwagę na TOP3 “najlepszych” i “najgorszych” województw (zaznaczenie)
  • do tego garść ciekawostek podsumowujących temat jeszcze na wykresie.

Finalny kształt

Całość zapisałem w postaci PDF, żeby lepiej się to oglądało. Posprawdzałem czy nie ma błędów, czy wszystko się ładnie pokazuje po konwersji do nowego formatu i… wysłałem 😉

Gotowy plik raportu możesz zobaczyć BI_NGO_K_Stencel_v2.

A roboczy plik, w którym zobaczysz różne eksperymenty oraz moje próby znalezienia optymalnej formy projektu umieściłem BI_NGO_roboczy_K_Stencel_v2. PS. Niektóre arkusze są ukryte, więc przywróć im widoczność jeśli chcesz 😎


Zakończenie

W tym krótkim poście opisuje swój udział w projekcie #BI_NGO, inicjatywie stworzonej przez Klaudię Stano. Polega ona na stworzeniu wizualizacji danych dla Fundacji Gajusz na temat opuszczonych noworodków i dzieci w pieczy zastępczej. W swoim projekcie skupiłem się na analizie danych dotyczących opuszczonych noworodków, tworząc w Excelu przejrzysty raport z wizualizacjami, który pokazuje niepokojący trend wzrostowy – w 2023 roku jedno na 440 urodzonych dzieci zostało opuszczone w szpitalu.

Inicjatywa ta jest przykładem jak można połączyć rozwój umiejętności analitycznych i budowanie portfolio z pomocą organizacji społecznej, poświęcając na to kilka godzin wolnego czasu.

Zachęcam Cię do udziału w akcji!!!

PS. Grafika wykorzystana na początku postu pochodzi z materiałów akcji i można ją znaleźć na stronie https://jezykdanych.pl/bi-ngo-1/

Może Ci się spodobać...

1 Comment

  1. Krzysztof, wielkie dzięki za udział w projekcie oraz podzielenie się Twoim procesem! To bardzo cenne zajrzeć za Twoje kulisy! 🙂

Leave a Reply

Your email address will not be published. Required fields are marked *