W ostatnich tygodniach w mediach szerokim echem odbiło się ogłoszenie wyników drugiej edycji rankingu najlepszych miast do życia według Business Insidera. Wygrał Olsztyn, przed Lublinem, a wyniki są zupełnie inne niż w ubiegłorocznej edycji tegoż rankingu, co powinno wzbudzić pewne podejrzenia. Czy ranking, w którym Lublin mógł w ciągu jednego roku w tych samych kategoriach skoczyć z miejsca 10 na 2 brzmi wiarygodnie?
Jeśli spojrzymy w metodologię tego rankingu, przeczytamy mocne słowa, że “nie ma tu miejsca na uznaniowość”. Być może, ale znalazło się miejsce na kiepską metodologię. Czemu tak sądzę?
W tym rankingu w każdej kategorii miastom przypisuje się rangę (i tyle samo punktów) na podstawie wartości danej zmiennej. Przykładowo, w kategorii bezrobocie Poznań dostał 1 punkt, bo ma je na poziomie 1% i to najlepszy wynik, Katowice 2 punkty (mimo, że jest tam takie same bezrobocie), Warszawa 3 punkty, bo ma 1,4% i tak dalej.
Problem z takim podejściem jest taki, że niektóre zmienne mają brdzo nierównomierny rozkład. Weźmy przestępczość. Dane GUS (na których rzekomo raport się opiera) pokazują inny ranking miast niż dane podane w raporcie: najgorsze są Katowice, a nie Łódź, potem Wrocław, a potem Gorzów. Tyle tylko, że o ile różnica w liczbie przestępstw na 1000 mieszkańców między Gorzowem a Wrocławiem to 2,5 (32,39 wobec 34,89), o tyle ta między Wrocławiem a Katowicami to aż 34,1, czyli blisko 13 razy więcej. Mimo to, różnica w punktach między Gorzowem a Wrocławiem i Wrocławiem a Katowicami jest taka sama (1 punkt). Nie będzie chyba kontrowersyjnym stwierdzenie, że z bezpieczeństwem w Katowicach jest o wiele, wiele gorzej niż w Gorzowie i Wrocławiu — kiedy między Wrocławiem a Gorzowem różnica jest nieznaczna — więc Katowice powinny zostać ocenione znacznie niżej.
Ta metodologia jest na tyle zła, że pokusiłem się o stworzenie własnego rankingu. Poniżej opiszę jego metodologię oraz wyniki.
Metodologia
Wybór zmiennych
Podobnie jak w rankingu Business Insidera, zbudujemy syntetyczną miarę poziomu życia ze zmiennych składowych. Wybrałem szereg zmiennych z różnych kategorii, a następnie sprawdziłem, czy te zmienne charakteryzują się dostatecznym współczynnikiem zmienności. W literaturze przyjmuje się bowiem, że zmienne o współczynniku zmienności niższym niż 10% są quasi-stałe, a więc nie wnoszą wiele do analizy. Sprawdziłem też, czy amplituda wartości zmiennych jest wystarczająca — w literaturze przyjmuje się, że powinna wynosić minimum 1,2 i tak jest.
Po kilku iteracjach, wyłoniła się następująca lista zmiennych:
Jak widać, nadałem też tym zmiennym wagi (jak bardzo są według mnie ważne) i czy są stymulantami (im wyższy wskaźnik, tym lepiej) czy destymulantami (na odwrót).
Oczywiście, to nie są wszystkie zmienne, które chciałbym zawrzeć w takim syntetycznym wskaźniku. Przykładowo, bardzo chciałem dodać zmienną pokazującą jaki procent mieszkańców miasta mieszka maksymalnie 5 minut spaceru od parku, skweru albo lasu. Ale to bardzo ciężkie zadanie komputacyjne. Musiałem się więc zadowolić zmiennymi, które są publicznie dostępne i stosunkowo przystępne do obrobienia.
Normalizacja i agregacja zmiennych
Następnym krokiem było znormalizowanie zmiennych, żebyśmy mogli je porównać między sobą. Wykorzystałem do tego metodę unitaryzacji zerowanej, którą można zapisać wzorem:
Co ten wzór robi? W skrócie, daje miastom wartości od 0 do 1, gdzie 0 otrzymuje najgorsze miasto, zaś 1 — miasto najlepsze.
Po znormalizowaniu zmiennych, przemnożyłem je przez wagi i dodałem do siebie, uzyskując syntetyczny wskaźnik jakości życia. Ten syntetyczny wskaźnik można interpretować tak, że wynik 100% uzyskałoby miasto, które jest najlepsze w każdej dziedzinie, zaś wynik 0% miasto, które jest w każdej dziedzinie najgorsze.
To gdzie żyje się najlepiej?
1. Warszawa
Okazuje się, że najlepszym dużym miastem do życia w Polsce jest — bez chyba wielkich zaskoczeń — Warszawa. Stolica uzyskała 66% wyniku “idealnego” miasta. Jej mocne strony to oczywiście gospodarka: najwyższe dochody, niskie bezrobocie i dynamiczny rozwój. Warszawa jest też miastem bezpiecznym, z dobrą edukacją podstawową i z największą różnorodnością restauracji i destynacji z lotnisk.
Wynik stolicy w dół ciągną wysokie ceny mieszkań, stosunkowo mało zabytków i chaos urbanistyczny.
2. Kraków
Drugie miejsce na podium, z wynikiem 60%, zajmuje z kolei dawna stolica i drugie miasto Polski — Kraków. W przypadku Krakowa mamy do czynienia z receptą na sukces prawie identyczną do tej warszawskiej: silna, szybko (najszybciej w kraju) rosnąca gospodarka i najlepsza edukacja to najmocniejsze cechy Krakowa. Dodatkowo, bez zaskoczeń, Kraków wypada świetnie jeśli chodzi o zabytki.
Słabe strony miasta to zanieczyszczenie powietrza (tu należy dodać, że operowałem na danych z 2022 — dzisiaj już jest pewnie znacznie lepiej pod tym kątem) i wysokie ceny mieszkań.
3. Chorzów i Katowice
Podium zamykają niemal ex-aequo Chorzów i Katowice. Wprawdzie Chorzów osiągnął minimalnie wyższy wynik (57,6% v. 57,3%), to zdecydowałem się połączyć te dwa miasta, bo leżą tuż obok siebie, a dodatkowo w niektórych zmiennych (zanieczyszczenie powietrza, PKB) musiałem przyjąć dla nich takie same wartości z braku dokładniejszych danych.
Te dwa miasta różnią się nieco od Krakowa i Warszawy jeśli chodzi o to, dlaczego są dobre do życia. O ile Kraków i Warszawa były w absolutnej czołówce w kilku kategoriach i na absolutnym dnie w innych, o tyle Chorzów i Katowice są w prawie każdej kategorii powyżej średniej, ale bez specjalnego wyróżniania się w żadnej (z wyjątkiem stosunkowo niskich cen mieszkań).
Pozostałe miasta
Poniżej zamieszczam tabelę z wynikami wszystkich analizowanych miast. Brałem pod uwagę tylko miasta z ponad 100 tys. mieszkańców. Początkowo chciałem zrobić ten ranking dla wszystkich miast na prawach powiatu, ale mniejsze miasta (szczególnie Sopot) “psuły” wiele zmiennych swoimi skrajnymi wartościami.
Zachęcam do dyskusji tutaj pod postem oraz na Facebooku. Ciekaw jestem, jakie inne zmienne wzięlibyście pod uwagę tworząc ranking najlepszych miast do życia.
Mi trochę brakuje liczby restauracji tajskich na 1000 mieszkańców. Wtedy byłby lepszy ten ranking :D
Nie wydaje mi się, że kryterium liczby zabytków albo 1h od lotniska wnosi cokolwiek. Czy naprawdę z każdego miejsca i w każdych warunkach w Wa-wie dojedzie się do Chopina w godzinę?