O tym, że wykres kołowy nie jest idealnym typem wykresu wie już chyba każdy adept sztuki wizualizacji danych. Mam jednak wrażenie, że ta wiedza nie wpływa zupełnie na obniżenie popularności tego rodzaju wykresu. W tym wpisie pokażę przykład wykresu kołowego i 5 propozycji innych wykresów, które będą pasować lepiej w tej sytuacji. Dodatkowo na końcu znajdziesz arkusz Excelowy, w którym wykonałem wszystkie alternatywne wykresy.
Dlaczego wykres kołowy nie jest ok?
Cały hejt związany z używaniem wykresów kołowych to nie tylko akcja wymierzona w nie przez nieżyczliwych specjalistów od wizualizacji danych. Jak zaraz się okaże – argumenty używane przez przeciwników pie chartów mają sens i są logiczne. A jakie zarzuty pojawiają się najczęściej?
- Ludzkie oko ma trudności z dokładnym porównywaniem kątów i powierzchni, co sprawia, że ocena proporcji na wykresie kołowym jest często niedokładna,
- Wykresy kołowe stają się nieczytelne przy większej liczbie kategorii, zwłaszcza gdy niektóre z nich reprezentują małe wartości procentowe lub gdy każda ma inny kolor, który nic nie znaczy,
- Trudno jest pokazać zmiany w czasie lub trendy za pomocą wykresów kołowych, co ogranicza ich użyteczność w analizie danych,
- Wykresy kołowe nie pozwalają na łatwe porównanie wielu zestawów danych, co jest często kluczowe przy wykonywaniu skomplikowanych analiz,
- Interpretacja wykresu kołowego wymaga od czytelnika przeliczania kątów na wartości procentowe w locie – a to sprawia, że nierzadko trzeba się mocno skupić chcąc szybko zdobyć informację ukrytą na wykresie kołowym.
Generalnie jeśli wykres kołowy nie jest wykonany poprawnie i nie jest dobrze opisany np. etykietami danych to strasznie ciężko jest zorientować się, które kategorie mają największe udziały w całości.
Pora na przykład
Tyle teorii. A teraz skupię się już na konkretnym przykładzie i na praktyce. Spójrz na ten wykres: Wykres wraz z artykułem “Data Drop: 5 Charts You Need in 2024” znajdziesz TUTAJ. Przed przygotowaniem wizualizacji warto znać przynajmniej ogólne przesłanie jakie stoi za danymi. W tym przypadku artykuł powstał dla osób zainteresowanych marketingiem. Wykres ma pokazywać, że Gen Z stanowi znaczącą część społeczeństwa – a z pewnością tak znaczną, że trzeba się z nim liczyć np. przygotowując kampanie reklamowe.
Co nie do końca zagrało na tej wizualizacji? Kilka tematów.
Po pierwsze kategorie czyli w tym przypadku pokolenia mają bardzo podobny udział procentowy w całości (Millenialsi – 22%, Gen Z – 21%, Boomersi – 20%…). Przedstawienie danych na wykresie kołowym zupełnie zaciera te i tak małe różnice.
Po drugie – kolory. Bardzo dobrze, że Gen Z, o którym jest ten artykuł został wyróżniony czerwonym kolorem – od razu widać na co należy patrzeć. Ale co z innymi pokoleniami? Może wystarczyłoby wyróżnić sam Gen Z – 21% i resztę potraktować jako nie-Gen Z – 79%. Dodatkowo drugi, mniejszy wykres kołowy (ponownie) zupełnie nie wprowadza rozróżnienia kolorystycznego. Młodsi Gen Z są w tym samym kolorze co starsi Gen Z. Można przecież pomyśleć chociażby o odcieniach.
Po trzecie – w przypadku gdy już decydujemy się na wykres kołowy to trzeba pokazywać dane po kolei ze względu na malejący udział. Co to oznacza w tym wypadku? Pokolenia powinny pojawiać się na kole w kolejności: Millenialsi – 22%, Gen Z – 21%, Boomersi – 20%, Gen X – 19%, Dzieci – 14% i Seniorzy – 5%. Pozwala to na szybkie zorientowanie się, udziały których pokoleń są największe. Oczywiście należy pochwalić wykres za wspomniane już wyróżnienie na czerwono Gen Z, czy chociażby za szczegółowe notes pod wykresem gdzie znalazło się miejsce np. na źródło danych.
Dosyć marudzenia, czas na porządki
Na wstępie do tej części wspomnę, że wszystkie wykresy, które za chwilę zobaczysz wykonałem w… Excelu. Moim zdaniem to w dalszym ciągu świetne narzędzie do wizualizacji danych. Łatwo załadować do niego dane do pokazania, ma wiele predefiniowanych typów wykresów (w tym oczywiście… kołowy) oraz bardzo duże możliwości personalizacji wykresów.
Lepszy… wykres kołowy
W pierwszym kroku “przerysowałem” nasz wyjściowy wykres do Excela, ale zachowując kolejność kategorii – kolejne pokolenia pojawiają się na kole zgodnie z malejącym procentowym udziałem w społeczeństwie. Spójrzmy:
Darowałem sobie przepisywanie wszystkich informacji umieszczonych w “Note“. Wykres kołowy jest już bardziej poprawny, ale…. nie wygląda i tak zbyt dobrze. No to idziemy do kolejnego klasycznego wykresu…
Wykres słupkowy… dobry na wszystko
Wszędzie tam, gdzie możesz użyć wykresu kołowego… lepiej już użyj starych, dobrych słupków. Ludzkie oko i mózg zdecydowanie lepiej orientują się w odległości wyrażonej linią lub prostokątem niż na kole. Dlatego też dużo łatwiej jest nam “zobaczyć” co jest największe na wykresie słupkowym niż kołowym. Więc tak wygląda nasz wyjściowy wykres w wersji słupkowej:
W tym przypadku od razu widać różnice między udziałami poszczególnych populacji – nawet gdy różnice między nimi nie są duże (patrz Millenialsi vs Gen Z). Utrzymałem kolorystykę z wyjściowego wykresu – nadal “gwiazdą” jest tutaj Gen Z. Możesz zapytać – dlaczego słupki a nie kolumny? Kolumny też byłyby jak najbardziej ok. Chociaż… na moje oko, małe różnice lepiej widać w poziomie niż w pionie. Tutaj przykład:
Pomyślisz teraz…. “łeeee…. wykres słupkowy czy kolumnowy to każdy głupi może zrobić”. To właśnie dlatego najczęściej warto zacząć od niego przygotowywanie wizualizacji. Zawsze można zdecydować się na większą ekstrawagancję, ale często sam wykres słupkowy jest już wystarczająco dobry i poprawny. A jeśli nie wykres słupkowy, ani kolumnowy – to co jeszcze mam w zanadrzu?
Wykres pierścieniowy
Czyli coś z kategorii “głupie, ale działa“. A co gdyby z koła usunąć…. środek? Powstanie pierścień. Okazuje się, że dane na wykresie pierścieniowym wyglądają lepiej niż na kołowym. Podejrzewam, że ma to związek z tym, że:
- patrząc na wykres kołowy skupiamy się na środku koła i “wielkość” danej kategorii mierzymy rozwartością kąta odczytaną bliżej środka koła
- a w przypadku wykresu pierścieniowego nie mamy środka więc “wielkość” kategorii to dla nas długość przypisanego do niej wycinka pierścienia, który przypomina jednak mimo wszystko “zaokrąglony prostokąt”.
Spójrzmy więc na alternatywny wykres typu pierścieniowego:
Nie jest to może alternatywa idealna i na pewno jest gorsza niż wykres słupkowy, ale w dalszym ciągu cieszy oko i jest nieco poprawniejsza niż wykres kołowy. No dobrze a skoro powiedzieliśmy już nieco o wykresie skumulowanym to może podrążmy ten temat dalej… Nie uciekaj jeszcze, bo nie zobaczysz najlepszego!!! A żeby nie przeoczyć ciekawych informacji o narzędziach analizy i wizualizacji danych zapisz się już teraz na mój darmowy cotygodniowy newsletter. Możesz to zrobić tutaj:
Wykres słupkowy skumulowany
Wcześniejsza wersja wykresu słupkowego przedstawiała każdą kategorię (pokolenie) na osobnym słupku, którego długość odpowiadała udziałowi w całości populacji. A co by się stało, gdybyśmy zamiast rysować słupki jeden pod drugim… zaczynali drugi słupek, w miejscu gdzie kończy się pierwszy? Powstałby wykres słupkowy skumulowany. To także fajna alternatywa dla wykresu kołowego i ma bardzo podobny charakter dla niego – tutaj również “dzielimy” całość na kawałki. Jak taki wykres skumulowany może prezentować się na naszych danych?
W tym przypadku postanowiłem pokazać Gen Z na pierwszym miejscu – inaczej niż w poprzednich wykresach. Dodatkowo podziałałem trochę z kolorami. W pierwszej wersji, gdzie wszystkie pozostałe pokolenia miały przypisany kolor czarny – wykres był nieczytelny, bo kolejne kategorie zlewały się w całość. Przy zabawie w kolory warto wybrać opcję jak najbardziej “stonowaną”. Oczywiście mógłbym oznaczyć kolejne kategorie przypadkowymi kolorami: zielonym, niebieskim, żółtym, itd…. Ale czy dobrze wpłynęłoby to na wykres? Nie….. Zamiast tego wybieram jeden kolor przewodni – np. szary i kolejne kategorie dostają kolor szary z odpowiednim nasyceniem. Jak zrobić to najprościej?
Wybieram jeden kolor i w palecie przesuwam się do góry o jedno okienko w każdej kolejnej kategorii. Dzięki temu nie muszę ręcznie ustawiać jasności. Wykres słupkowy skumulowany ma jednak podobną bolączkę jak w przypadku wykresu kołowego – nierozróżnialne kategorie o podobnym udziale procentowym (Millenialsi vs Gen Z). Kolejny typ wykresu rozwiąże ten problem.
Wykres lejkowy
Bardzo dobra alternatywa dla zwykłego wykresu słupkowego, gdy chcemy jeszcze mocniej podkreślić różnice między poszczególnymi wartościami kategorii. W gruncie rzeczy to jest wykres słupkowy, ale słupki nie zaczynają się od lewej strony wykresu, ale są rozłożone symetrycznie względem jego środka. Łatwiej to chyba zobaczyć niż wytłumaczyć pisemnie 😉
Teraz już nikt chyba nie ma wątpliwości, że udział Gen X różni się od udziału Boomersów, co nie było takie oczywiste np. przy wykresie słupkowym skumulowanym. Wykres lejkowy jest rzadko stosowany, ale czasem może być lepsza alternatywą dla wykresu kołowego. Jego wspomniany plus to zarazem jednak minus – prawdę mówiąc to różnica 1% jest bardzo mała, ale na wykresie lejkowym urasta do bardzo znaczącej… To może zapomnijmy już o słupkach i lejkach….
Wykres waflowy
Bardzo apetyczna nazwa, ale dużo przy nim roboty w Excelu. Niestety ten typ wykresu nie należy do standardowych wizualizacji Excela, więc większość pracy przy nim należy wykonać… ręcznie. Po pierwsze poszczególne kwadraciki to tak naprawdę pojedyncze zakolorowane komórki Excela ułożone 10×10. Żeby wyglądały jak kwadraciki trzeba odpowiednio zmienić szerokość i wysokość dla kolumn i wierszy. Dodatkowo trzeba policzyć ile kwadracików i na jaki kolor zaplanować. Do tego dochodzi ręczne zrobienie legendy, ale to już mały pikuś przy poprzednich krokach. Jednak jak się człowiek tak narobi, to stwierdza, że…. warto…. Spójrz tylko na to “dzieło sztuki”:
No i nie ukrywajmy – ten wykres ma wyglądać, a niekoniecznie być mega dokładny. Tutaj również bez legendy nie doszukamy się różnic pomiędzy populacjami. Ba, jest to nawet trudniejsze, bo kolejne kwadraty zawijają się przy przejściu do kolejnego wiersza.
Zakończenie
Podsumowując, chociaż wykres kołowy jest popularny i łatwy do stworzenia, często nie jest najlepszym wyborem do prezentacji danych. Jak widzisz, istnieje wiele alternatyw, które mogą skuteczniej przekazać te same informacje:
- Zwykły wykres słupkowy lub kolumnowy
- Wykres pierścieniowy
- Wykres słupkowy skumulowany
- Wykres lejkowy
- Wykres waflowy
Każdy z tych typów wykresów ma swoje zalety i może być bardziej odpowiedni w zależności od charakteru danych i przekazu, jaki chcemy osiągnąć. Wykres słupkowy pozwala na łatwe porównanie wartości, wykres lejkowy podkreśla różnice między kategoriami, a wykres waflowy oferuje ciekawą wizualnie alternatywę.
Pamiętaj, że kluczem do dobrej wizualizacji danych jest nie tylko wybór odpowiedniego typu wykresu, ale także jego staranne wykonanie – z przemyślanym doborem kolorów, kolejnością danych i czytelnymi opisami.
Zachęcam do eksperymentowania z różnymi typami wykresów przy Twoich kolejnych projektach związanych z analizą i prezentacją danych. Jak wspomniałem na początku, przygotowałem dla Ciebie arkusz Excela zawierający wszystkie omówione w tym artykule alternatywne wykresy. Możesz go pobrać TUTAJ i wykorzystać jako punkt wyjścia do własnych eksploracji w świecie wizualizacji danych.
Pamiętaj – dobra wizualizacja to taka, która pozwala odbiorcy szybko i dokładnie zrozumieć prezentowane informacje. Wybieraj więc mądrze i nie bój się wyjść poza strefę komfortu wykresów kołowych!
Jeśli jeszcze nie jesteś na liście odbiorców mojego newslettera to tutaj masz szansę na zapis:
Tyle na dzisiaj 🖐️