Nie wydaje się by ta mapa była skonstruowana poprawnie i nie nadaje się do wyciągania ani ogólnych ani tym bardziej szczegółowych wniosków. Użyta metodologia jest wątpliwa i nie mierzy ona powiązań między regionami. Bo przykładowo dlaczego mieszkańcy Koszalina mieliby być silniej związani z regionem na wschód niż z regionem, w którym znajdują się w obecnych granicach? Mieszkańcy Koszalina mają mieć więcej znajomych w Gdańsku czy w Słupsku niż we własnym mieście Koszalinie i miejscowościach sąsiednich (region NUTS-3 zbiorczo nazwany jako koszaliński), Świnoujściu czy w Szczecinie? No skoro do kosza wyrzucane jest podobieństwo z własnym regionem, to nie wyjdą z tego prawidłowe wyniki. Nie została opisana dokładnie metodologia jak to jest liczone i jakie uzyskano szczegółowe wartości liczbowe między wszystkimi regionami a nie tylko tymi najbardziej podobnymi. Zresztą w ogóle błędem jest zero-jedynkowe określanie podobieństwa, gdy przecież liczbowe wartości dla sąsiadujących regionów mogą być sobie bardzo bliskie i żaden z nich może nie być dominującym. W rzeczywistości to wszystko jest bardziej rozmyte i nie można arbitralnie stwierdzać, że skoro region x ma 28% powiązań z regionem y, to automatycznie 72% powiązań jest do śmieci, zwłaszcza że np. z kolejnym regionem tych powiązań może być np. 26%, czyli niewiele mniej. A często sama różnica w liczbie mieszkańców regionu siłą rzeczy decyduje o liczbie powiązań, bo przecież oczywistym jest że region 2x mniej liczny nie jest w stanie mieć tylu powiązań od regionu bardziej zaludnionego. A z drugiej strony im bardziej rozległy region (np. region szczecinecko-pyrzycki) tym trudniej jest obliczyć względne podobieństwo, skoro jego mieszkańcy rozrzuceni są na obszarze 150km-200km i oczywistym jest, że ci przy granicy regionu będą silniej związani z sąsiednim regionem, niż ci 150km-200km dalej. Inny region może wykazać wyższe podobieństwo tylko dlatego, że jest bardziej zwarty w granicach. Więc tak liczone podobieństwo jest de facto bezwartościowe. Wątpliwe też jest wyznaczanie samych granic nowych regionów (klastrów), w oparciu o ww. ułomne podobieństwa oraz o hierarchię podobieństw gdy decydujące jest nie podobieństwo regionu do województwa tylko podobieństwo małego regionu do innego małego regionu, podobieństwo 2 tych regionów do innych 2 regionów itd. wzwyż. generalnie ta mapa w dużej części przedstawia artefakty, wynikające z dużych wad przyjętej metodologii, granic regionów, ich ludności, rozciągłości niż rzeczywiście mierzy powiązania między regionami. Dużo lepiej byłoby po prostu narysować jakąś rozmytą formę mapy niż opierać to na zero-jedynkowych klastrach i nienaturalnych hierarchiach z błędami metodologicznymi i interpretacyjnymi jak opisałem powyżej. Edit. Teraz zwróciłem uwagę na to, że region Radomski powiązany jest z Olsztynem!... To jest właśnie najdobitniejszy dowód że nie są to rzeczywiste powiązania między regionami, tylko efekt istnienia tych artefaktów, które zostały tu powiązane i błędnie są interpretowane jako powiązania między regionami (co wynika ze źle przyjętego modelu i z błędnych założeń).
Do badania, z którymi podregionami dany podregion ma najsilniejsze więzi, nie potrzeba mierzyć więzi wewnątrz podregionu, chociaż to byłoby przydatne do ważności, przez określenie kontekstu.
Oczywiście klasyfikacja w kategorie ma swoje liczne ograniczenia, i z resztą wymienionych powyżej zgadzam się, nie mniej czasami jest przydatna, jak w przypadku klasyfikacji do zaborów, czy województw. Gdyby wyłączyć powiat sławieński z koszalińskiego, to pozostałość koszalińskiego byłaby silniej związana z resztą zachodniopomorskiego, co pewnie przechyliłoby szalę. Ze Sławna jest znacznie bliżej do Trójmiasta niż do Szczecina. Hierarchiczne aglomeracyjne grupowanie połączeniowe ma kilka metod łączenia i rzeczywiście widać, że wybrano błędną metodę.
Ta moja uwaga co do badania więzi wewnątrz regionu ma znaczenie tym większe im większe są same regiony. W przypadku gdy regiony są wielkości województw doszłoby do absurdu, że więzi wewnątrz województwa byłyby ignorowane i decydowałyby wyłącznie więzi z innymi województwami. A przecież analiza ma wykazać czy obecne województwa same opierają się na wewnętrznych więziach. W przypadku regionów NUTS-3 są one wciąż za duże, np. w przypadku opolskiego, czy lubuskiego jeden taki region zajmuje ponad połowę województwa, w innych województwach stanowią 40% czy 30% a to wciąż dużo. To tak, jakby wykluczyć z analizy więzi z lubuskiego czy opolskiego 60% mieszkańców, albo 40% w przypadku nieco większych województw. Stąd była wskazana przeze mnie wątpliwość wykluczania z analizy tak znacznego zakresu danych, co rażąco wypacza wyniki.
Oczywiście nawet gdyby te regiony były mniejsze, to nawet wykluczenie niewielkiego 5% mieszkańców z analizy wewnątrz regionu może rażąco wypaczać wynik, jeśli wewnętrznie ten region jest związany w 90%, a więzi zewnętrzne to nikłe 10% czy mniej. Trudno w takim przypadku mówić, że taki region ciąży ku jakiemuś innemu województwu i jednocześnie, że niby nie jest związany z tym, w którym się obecnie znajduje. To już lepiej wtedy powiedzieć, że region jest izolowany, a nie na siłę go gdzieś przypisywać.
Zwłaszcza że dalsza analiza hierarchiczna wzwyż wypacza te wyniki w ten sposób, że analizuje nie ten jeden region, ale analizuje ten region w większej grupie razem z innymi np. z 2 (czy 4 itd.) regionami. Trudno wówczas mówić, że skoro 4 regiony w grupie są silniej związane z np. z kilkoma wziętymi z woj. pomorskiego, to że jeden z tych regionów z grupy odrębnie też jest z tym woj. w takim stopniu związany. Bo tak nie jest. Siła tego powiązania się uśrednia na te 2 (czy 4) regiony i ten jeden region, który miał niskie związki w grupie nagle ma te związki bezpodstawnie zawyżane.
Myślę więc, że ta metoda klasteryzacji nie sprawdziłaby się też w przypadku mniejszych regionów niż zastosowane tu NUTS-3.
Bardzo interesujące, ale mam kłopot ze zrozumieniem, w tekście i we wzorze jest o prawdopodobieństwie, na mapach są tysiące. Znaczy się, że to na 1 milion potencjalnych znajomości?
Jaką metodę łączenia klastrów zastosowano? Przykład z radomskim na końcu pokazuje, że nie najlepszą. Niemniej poproszę o podpisany dendrogram.
"Wspomniane podregiony inowrocławski i włocławski koniec końców okazują się być jednak zorientowane bardziej na “wnętrze” swoich zaborów niż na siebie samych. Granica zaborcza trzyma się też dobrze na południu kraju, z wyjątkiem podregionu sosnowieckiego"
W przypadku włocławskiego dodając strzałki rejony pruskie mają takie same jeśli nie większą szerokość. Inowrocławski ma stosunkowo krótką granicę z Kongresówką, jest głębiej w Prusach, więc naturalnie, że ma większe więzi z ludźmi mieszkającymi bliżej, podobnie w większości przypadków.
Jeśli strzałki są dwukierunkowe, to nie ma potrzeby rysowania grotów. Powinny być też bardziej przezroczyste, bo słabo wyróżniają się przypadki pokrywania się strzałek.
Ciekawe do jakiego dokładnie stopnia połączenia na "ziemiach odzyskanych" sa odbiciem tego, jak ludzie przenosili sie z Kresow. Zadanie dla jakiegos historyka zeby przestudiować informacje z PURu i porownac z tymi wspolczesnymi mapkami powiazan :)
To jest ujęcie alternatywne wobec teorii Christallera, który budował regiony według powiązań logistycznych. W danym badaniu widzimy regionalizację Polski, która (regionalizację) sugeruje albo reformę podziału administracyjnego, albo podziału elektoralnego.
Nie wydaje się by ta mapa była skonstruowana poprawnie i nie nadaje się do wyciągania ani ogólnych ani tym bardziej szczegółowych wniosków. Użyta metodologia jest wątpliwa i nie mierzy ona powiązań między regionami. Bo przykładowo dlaczego mieszkańcy Koszalina mieliby być silniej związani z regionem na wschód niż z regionem, w którym znajdują się w obecnych granicach? Mieszkańcy Koszalina mają mieć więcej znajomych w Gdańsku czy w Słupsku niż we własnym mieście Koszalinie i miejscowościach sąsiednich (region NUTS-3 zbiorczo nazwany jako koszaliński), Świnoujściu czy w Szczecinie? No skoro do kosza wyrzucane jest podobieństwo z własnym regionem, to nie wyjdą z tego prawidłowe wyniki. Nie została opisana dokładnie metodologia jak to jest liczone i jakie uzyskano szczegółowe wartości liczbowe między wszystkimi regionami a nie tylko tymi najbardziej podobnymi. Zresztą w ogóle błędem jest zero-jedynkowe określanie podobieństwa, gdy przecież liczbowe wartości dla sąsiadujących regionów mogą być sobie bardzo bliskie i żaden z nich może nie być dominującym. W rzeczywistości to wszystko jest bardziej rozmyte i nie można arbitralnie stwierdzać, że skoro region x ma 28% powiązań z regionem y, to automatycznie 72% powiązań jest do śmieci, zwłaszcza że np. z kolejnym regionem tych powiązań może być np. 26%, czyli niewiele mniej. A często sama różnica w liczbie mieszkańców regionu siłą rzeczy decyduje o liczbie powiązań, bo przecież oczywistym jest że region 2x mniej liczny nie jest w stanie mieć tylu powiązań od regionu bardziej zaludnionego. A z drugiej strony im bardziej rozległy region (np. region szczecinecko-pyrzycki) tym trudniej jest obliczyć względne podobieństwo, skoro jego mieszkańcy rozrzuceni są na obszarze 150km-200km i oczywistym jest, że ci przy granicy regionu będą silniej związani z sąsiednim regionem, niż ci 150km-200km dalej. Inny region może wykazać wyższe podobieństwo tylko dlatego, że jest bardziej zwarty w granicach. Więc tak liczone podobieństwo jest de facto bezwartościowe. Wątpliwe też jest wyznaczanie samych granic nowych regionów (klastrów), w oparciu o ww. ułomne podobieństwa oraz o hierarchię podobieństw gdy decydujące jest nie podobieństwo regionu do województwa tylko podobieństwo małego regionu do innego małego regionu, podobieństwo 2 tych regionów do innych 2 regionów itd. wzwyż. generalnie ta mapa w dużej części przedstawia artefakty, wynikające z dużych wad przyjętej metodologii, granic regionów, ich ludności, rozciągłości niż rzeczywiście mierzy powiązania między regionami. Dużo lepiej byłoby po prostu narysować jakąś rozmytą formę mapy niż opierać to na zero-jedynkowych klastrach i nienaturalnych hierarchiach z błędami metodologicznymi i interpretacyjnymi jak opisałem powyżej. Edit. Teraz zwróciłem uwagę na to, że region Radomski powiązany jest z Olsztynem!... To jest właśnie najdobitniejszy dowód że nie są to rzeczywiste powiązania między regionami, tylko efekt istnienia tych artefaktów, które zostały tu powiązane i błędnie są interpretowane jako powiązania między regionami (co wynika ze źle przyjętego modelu i z błędnych założeń).
Do badania, z którymi podregionami dany podregion ma najsilniejsze więzi, nie potrzeba mierzyć więzi wewnątrz podregionu, chociaż to byłoby przydatne do ważności, przez określenie kontekstu.
Oczywiście klasyfikacja w kategorie ma swoje liczne ograniczenia, i z resztą wymienionych powyżej zgadzam się, nie mniej czasami jest przydatna, jak w przypadku klasyfikacji do zaborów, czy województw. Gdyby wyłączyć powiat sławieński z koszalińskiego, to pozostałość koszalińskiego byłaby silniej związana z resztą zachodniopomorskiego, co pewnie przechyliłoby szalę. Ze Sławna jest znacznie bliżej do Trójmiasta niż do Szczecina. Hierarchiczne aglomeracyjne grupowanie połączeniowe ma kilka metod łączenia i rzeczywiście widać, że wybrano błędną metodę.
Ta moja uwaga co do badania więzi wewnątrz regionu ma znaczenie tym większe im większe są same regiony. W przypadku gdy regiony są wielkości województw doszłoby do absurdu, że więzi wewnątrz województwa byłyby ignorowane i decydowałyby wyłącznie więzi z innymi województwami. A przecież analiza ma wykazać czy obecne województwa same opierają się na wewnętrznych więziach. W przypadku regionów NUTS-3 są one wciąż za duże, np. w przypadku opolskiego, czy lubuskiego jeden taki region zajmuje ponad połowę województwa, w innych województwach stanowią 40% czy 30% a to wciąż dużo. To tak, jakby wykluczyć z analizy więzi z lubuskiego czy opolskiego 60% mieszkańców, albo 40% w przypadku nieco większych województw. Stąd była wskazana przeze mnie wątpliwość wykluczania z analizy tak znacznego zakresu danych, co rażąco wypacza wyniki.
Oczywiście nawet gdyby te regiony były mniejsze, to nawet wykluczenie niewielkiego 5% mieszkańców z analizy wewnątrz regionu może rażąco wypaczać wynik, jeśli wewnętrznie ten region jest związany w 90%, a więzi zewnętrzne to nikłe 10% czy mniej. Trudno w takim przypadku mówić, że taki region ciąży ku jakiemuś innemu województwu i jednocześnie, że niby nie jest związany z tym, w którym się obecnie znajduje. To już lepiej wtedy powiedzieć, że region jest izolowany, a nie na siłę go gdzieś przypisywać.
Zwłaszcza że dalsza analiza hierarchiczna wzwyż wypacza te wyniki w ten sposób, że analizuje nie ten jeden region, ale analizuje ten region w większej grupie razem z innymi np. z 2 (czy 4 itd.) regionami. Trudno wówczas mówić, że skoro 4 regiony w grupie są silniej związane z np. z kilkoma wziętymi z woj. pomorskiego, to że jeden z tych regionów z grupy odrębnie też jest z tym woj. w takim stopniu związany. Bo tak nie jest. Siła tego powiązania się uśrednia na te 2 (czy 4) regiony i ten jeden region, który miał niskie związki w grupie nagle ma te związki bezpodstawnie zawyżane.
Myślę więc, że ta metoda klasteryzacji nie sprawdziłaby się też w przypadku mniejszych regionów niż zastosowane tu NUTS-3.
Bardzo interesujące, ale mam kłopot ze zrozumieniem, w tekście i we wzorze jest o prawdopodobieństwie, na mapach są tysiące. Znaczy się, że to na 1 milion potencjalnych znajomości?
Jaką metodę łączenia klastrów zastosowano? Przykład z radomskim na końcu pokazuje, że nie najlepszą. Niemniej poproszę o podpisany dendrogram.
"Wspomniane podregiony inowrocławski i włocławski koniec końców okazują się być jednak zorientowane bardziej na “wnętrze” swoich zaborów niż na siebie samych. Granica zaborcza trzyma się też dobrze na południu kraju, z wyjątkiem podregionu sosnowieckiego"
W przypadku włocławskiego dodając strzałki rejony pruskie mają takie same jeśli nie większą szerokość. Inowrocławski ma stosunkowo krótką granicę z Kongresówką, jest głębiej w Prusach, więc naturalnie, że ma większe więzi z ludźmi mieszkającymi bliżej, podobnie w większości przypadków.
Jeśli strzałki są dwukierunkowe, to nie ma potrzeby rysowania grotów. Powinny być też bardziej przezroczyste, bo słabo wyróżniają się przypadki pokrywania się strzałek.
Czym jest podobieństwo między regionami? Jak jest liczone? Jaka jest reprezentacja regionu jako wektora liczb?
Ciekawe do jakiego dokładnie stopnia połączenia na "ziemiach odzyskanych" sa odbiciem tego, jak ludzie przenosili sie z Kresow. Zadanie dla jakiegos historyka zeby przestudiować informacje z PURu i porownac z tymi wspolczesnymi mapkami powiazan :)
To jest ujęcie alternatywne wobec teorii Christallera, który budował regiony według powiązań logistycznych. W danym badaniu widzimy regionalizację Polski, która (regionalizację) sugeruje albo reformę podziału administracyjnego, albo podziału elektoralnego.