Aantal inwoners van "villages" / kleine plaatsen

Heeft CBS misschien een inwonerdatabase die gebruikt kan worden?

Edit: is dit iets?

https://www.cbs.nl/nl-nl/dossier/nederland-regionaal/gemeente/ruimtelijke-statistieken
http://statline.cbs.nl/StatWeb/selection/?DM=SLNL&PA=82271NED&VW=T
https://data.overheid.nl/data/dataset/bevolkingskernen-2011

Als ik hier kijk https://www.cbs.nl/nl-nl/onze-diensten/open-data/website-open-data zou dat kunnen, mits men de bron vermeld?

Zie ook https://data.overheid.nl/data/dataset/bevolkingskernen-2011
De licentie is CC-BY-4.0:
Met deze licentie is een hergebruiker vrij om de dataset te delen, te kopiëren, te verspreiden en door te geven via elk medium of bestandsformaat. De dataset mag bewerkt worden en mag voor commerciele doeleinde gebruikt worden. Een verwijzing naar de maker van de data is vereist.

Die data is al vrij oud, van 2011. Maar beter dan niets…
Vaak staat op de site van de gemeente recentere data.

De pdokviewer geeft in de rubriek CBS Wijken en Buurten gedetailleerde gegevens over bewonersaantallen per gemeente, wijk en buurt voor 2017 (en terug tot 2010).

Ik begrijp van Marco:

dat hij graag die aantallen inwoners correct wil hebben.

Nu zal het niet zo zijn dat die cijfers van jaar tot jaar enorm zullen fluctueren, maar het wijst ons (mede door de volstrekt onnauwkeurige import uit het verleden) wel op een ander probleem (dat hier ook heus wel vaker aan de orde is geweest): wie gaat die gegevens bijhouden?
Of je doet alle gemeenten, of je doet ze niet, maar zo als het dus nu is, is het volstrekt onbruikbaar.
In eerdere discussies is ook al vaker ter sprake gekomen dat het linken van data (zoals deze inwonersaantallen) veel beter kan plaatsvinden dan het importeren van die data.
Op de PDOK site kan ik van de wijk waarin ik woon, de volgende gegevens achterhalen als het gaat over de inwoners:

Willen we dat allemaal gaan importeren? Waarom? Ik kan er nu al bij zonder al teveel moeite en met een interface die perfect werkt en met alle gegevens up-to-date. (Kijk overigens maar eens goed naar alle gegevens die over ons worden bijgehouden en verbaas je over wat er allemaal in staat! De PVV zal er blij mee zijn…)

En voor iedereen die alle plaatsen met hun inwonersaantal snel wil zien in een handzaam overzicht, plak de volgende code in overpass en run om een mooi CSV bestand te krijgen om verder mee te spelen.

[out:csv(::"id",name,place,population,wikidata;true;",")];
{{geocodeArea:nederland}}->.searchArea;
(
  node["population"](area.searchArea);
);
out meta;
>;
out skel qt;

Of gebruik deze overpasslink.

Met deze overpass zie je alle 1441 plaatsen met 1000 inwoners, en die zijn gelijkmatig over het hele land verdeeld.
OSM zit vol met “fake” data! :open_mouth:

Ik ben er zeker geen voorstander van om de OSM database een vervanger te laten worden van het CBS, dus alsjeblieft, nee, ga niet alles importeren.

Waarom dan wel de “population”?

Omdat deze direct noodzakelijk is bij de rendering. Alleen met gebruik van population kun je een enigszins zinvolle hiërarchie maken van de belangrijkheid van plaatsen binnen 1 categorie van de classificatie als city/town/village/hamlet, dus onderscheid in b.v. de steden op basis van populatiegrootte. Natuurlijk is ook nog de status als bestuurlijk centrum (denk onze provinciale hoofdsteden) van belang, maar zonder die informatie is dan nog de enige indicator voor de status van een woonkern zijn inwoneraantal.

Een dergelijke hiërarchie kan vervolgens gebruikt worden om een meer intuïtieve rendering met verschillende lettergroottes voor steden- / plaatsnamen op te zetten. Dit is op sommige plekken op de aardbol echt een absolute noodzaak. Een aardig voorbeeld is de Los Angeles metropolitan area. Daar liggen iets van twee dozijn nodes die allemaal met place=city zijn getagd, en die ook daadwerkelijk een eigen bestuur met een burgemeester lijken te hebben als ik de Wikipedia zo goed lees. Het zijn dus niet simpele “suburbs” van LA.

Om in zo’n situatie nog een zinvol beeld te geven, is de population een zeer gewenst hulpmiddel. De grootte van de verschillende place=city nodes is namelijk behoorlijk verschillend, van ruim onder de 50k tot >0.5M. Met een selectie op populatie grootte kun je dan de labelgrootte variëren, en hiermee uitdrukking aan de belangrijkheid van de stadskern geven.

In dit bestand staan de inwonersgegevens (vrij beschikbaar) van alle Nederlandse gemeenten (388) per 2017.

Het nadeel is dat de gegevens per gemeente zijn ingedeeld waarbij wat wij een “village” noemen (of “hamlet”), dit in genoemd bestand weer als een wijk (of zelfs buurt) is terug te vinden.

Ik heb er zojuist even naar gekeken en ik kom met wat databasegeknutsel een heel eind.

Maar ik ga nu slapen…

Hergebruik:

Licentie:
CC-BY 3.0

maar met:

https://forum.openstreetmap.org/viewtopic.php?id=59099

voor ons wel.

Per gemeente hebben we inderdaad niet zoveel aan, zeker niet met de eindeloze gemeentelijke herindelingen van de afgelopen 100 jaar, waarbij steeds meer bebouwingskernen binnen 1 gemeente vallen. Het gaat nu eenmaal echt om de bebouwingskernen met eigen naam.

Als die als buurt of wijk wel terug te vinden zijn, dan is dat natuurlijk wel bruikbaar.

Het mooiste zou natuurlijk zijn om hier een MapRoulette taak van te maken! (tenzij iemand het met import-magie weet op te lossen)

Elke keer een plaatsnaam in de zoekfunctie moeten inkloppen om er naar toe te zoomen, en vervolgens een edit-sessie te starten, kost veel tijd. Met MapRoulette hebben we een efficiëntere manier. Ik heb hier zelf echter geen ervaring mee, hoe je dat opzet.

Er zijn ook plaatsen met 10000 inwoners gevonden door deze overpass zoals Landgraaf (38000 inwoners) :slight_smile:

Inwoners van een plaats is wat anders als de inwoners van het dorp.
Er zijn mogelijk plaatsen waar meer mensen buiten het dorp wonen als er in. Bebouwde kom volgens de wegenwet.

Bij rendering hoe groot een plaats is neem ik aan dat dan de bebouwde kom wordt bedoeld.

Voor de kaartenmakers is het idd prettig dat die gegevens die in OSM zitten enigszins betrouwbaar zijn, ik maak daar ook gebruik van in mijn OFM scripts. En dan niet alleen landelijk maar wereldwijd. En ik heb niet alle tabellen van alle statistische instanties wereldwijd paraat dus het zou fijn zijn als dat een beetje klopt in OSM. Wb de actualiteit en het bijhouden ervan maakt het niet veel uit dat een plaats x het inwonertal een paar duizend inwoners is toegenomen in de loop van een aantal jaar. Wat wèl onacceptabel is, is dat bij zo’n import een willekeurig getal van 10.000 of 1.000 op de data is geplakt. Dus als we die data op een of andere manier kunnen corrigeren middels een import van de meest actuele CBS gegevens zou ik dat zeer op prijs stellen als data consumer.

Dat is een punt van discussie ja. Neem bijv. een hele grote uitgestrekte gemeente als Emmen met 108.000 inwoners terwijl de woonplaats amper de helft van het aantal inwoners telt. Hier zou je dus kunnen kijken naar het aantal inwoners binnen de woonplaatsgrens en/of de gemeente? Het verzorgingsgebied van Emmen is echter veel groter, het centrum heeft een regionale functie.

De gemeente gegevens gebruiken is nog steeds geen optie, omdat de place nodes altijd de echte woonplaats / bebouwingskern betreffen.

Met kennelijk rond de 50k inwoners volgens jouw gegevens, denk ik dat de “regionale” functie van Emmen ook zo wel duidelijk is, zeker ook omdat de place node al als “town” is gedefinieerd (https://www.openstreetmap.org/node/868430925), en de OSM Wiki duidelijk schrijft over “town”:

Use place=town to identify an* important urban centre** that is larger than a place=village, smaller than a place=city, and not a place=suburb. Towns normally have a good range of shops and facilities which are used by people from nearby villages. *

Het laatste vet gedrukte geeft duidelijk de regionale functie van een als “town” geclassificeerde node aan. Dus Emmen lijkt mij afdoende getagged zo.

Niet direct handig in dit verband, maar een leuke site voor plaatsnamen is https://www.plaatsengids.nl/
Alle plaatsen staan erin met allerlei weetjes, ook zeer kleine buurtschappen.

Inwoneraantallen hebben ik altijd al interessant gevonden en ik maakte wel eens lijstjes op basis van verzamelde informatie. Het meeste is helaas niet bewaard gebleven.

Diverse complicerende factoren zijn al genoemd. Internationaal is er het probleem dat niet voor alle landen betrouwbare statistieken zijn te geven als gevolg van gebrekkige registratie. Soms is er in de praktijk een behoorlijk aandeel aan niet-geregistreerde bewoning bovenop het officiële bevolkingsgetal. Het andere grote probleem is het verschil in bestuurlijke indeling. Je kunt moeilijk tot een eenduidige definitie van een woonplaats komen die tot een bevredigende lijst leidt. Een stad als agglomeratie kan tientallen miljoenen inwoners hebben terwijl het volgens bestuurlijke indeling soms maar honderdduizenden of tienduizenden heeft.
O.a. voor Parijs, Tokio en Brussel ontkom je niet aan een nadere onderbouwing van de gebruikte rekenmethode / definitie.

Voor Nederland wordt wat betreft de steden vaak uitgegaan van de gehele gemeente. Dat geeft een aardig beeld en soms is de stad gelijk aan de gemeente maar in veel gevallen ook niet. En de losse cijfers zijn niet altijd gemakkelijk te vinden. De CBS-indeling is vaak verwarrend en niet gelijk voor elke gemeente. Soms is een dorp niet als geheel terug te vinden en met andere woonkernen samengevoegd onder één noemer of juist opgesplist. De afsplitsing ‘verspreide huizen’ kan vraagtekens oproepen.

Het al genoemde Emmen is een goed voorbeeld van een groot verschil tussen het inwonertal van de gemeente en de woonplaats Emmen. Dan is er Almere waar de oorspronkelijk opzet van verschillende woonkernen als Almere-Stad, Almere-Buiten, Almere-Haven, enz. is verwaterd maar die nog wel als stadsdelen bestaan.
Van de grootste steden bevat alleen gemeente Den Haag officieel geen andere woonplaatsen maar wie is opgegroeid in Scheveningen zal daar anders over denken. De gemeente Groningen bevat een aantal wel of niet-oficiele woonplaatsen die wel of niet volledig zijn opgeslokt door de stad (zoals Hoogkerk).

De losse cijfers zijn dus niet altijd duidelijk en de status van een kern is niet altijd duidelijk. Wanneer is iets wel of niet een dorp? Voor Fryslân is daarover voor mij geen verwarring. Daarover wordt meestal geen tegenstrijdige informatie gegeven. Er stond ooit ook eens een volledige lijst op de website van de provincie. Op veel gemeentelijke websites zijn wel actuele cijfers per dorp te vinden.
Je zou wel kunnen betwisten of Breezanddijk, bestaande uit een deel van de Afsluitdijk en bevattende één adres (een tankstation) en vier inwoners, wel echt een dorp is maar het heeft wel die status.
Voor bijv. Groningen en Drenthe is er voor meerdere woonplaatsen onduidelijkheid of het dorpsstatus heeft of dat het een gehucht is waarvan de inwoners onder een ander dorp vallen.
Die dorpsstatus hangt zeker niet zomaar af van aantal inwoners of voorzieningen. Er zijn in Fryslân wel meer dan tien plaatsen met dorpsstatus die minder dan honderd inwoners hebben en soms aan een doodlopende weg liggen terwijl er in het noordoosten plaatsen zijn met honderden inwoners en actieve dorpsgemeenschap die als gehucht gelden.

Dan de vraag: moet OSM iets doen met inwoneraantallen of niet?
Gegeven het feit dat de database is gevuld met getallen die veelal totaal niet kloppen is het zeker gewenst om dat aan te pakken.
Als ik uitga van werkgebied Nederland dan is het ene uiterste om die tags gewoon te verwijderen en het andere uiterste is het corrigeren met exacte en actuele informatie voor alle officiële woonplaatsen in Nederland.

Dat laatste gaat me wat ver en zou ik alleen implementeren als het kan door het linken van data.
Het is wel waar dat de meeste inwoneraantallen niet gauw verouderen dus als er eenmaal goede invoer is geweest kun je jaren vooruit met eventueel alleen bijhouden van de gevallen van grote verandering (zoals aangewezen groeikernen en mogelijk plaatsen die net een bepaalde grens overschrijden).
Je zou ook kunnen werken met afgeronde getallen (het CBS werkt vaak ook met afronding op tientallen), maar afronding kan een extra arbitraire factor opleveren.

Jaren geleden is er al eens een voorstel gedaan dat niets heeft opgeleverd. Daar werd ondermeer opgemerkt dat kaartenmakers niet snel de getallen zullen gaan gebruiken.
Ik denk dat we ons hier zeker niet moeten gaan druk maken om de situatie in het buitenland zoals Los Angeles.
En voor Nederland zou ik zeggen: een indeling van vier categorieën is aan de krappe kant maar voldoende hanteerbaar.

Mijn voorstel is om toe te werken naar consensus over het gebruik van de tags place=city/town/village/hamlet binnen Nederland. Dus het vaststellen van criteria waarbij inwonertal de leidende maar niet enige factor hoeft te zijn en waarbij eventueel per provincie of regio kan worden gedifferentieerd.
Hele kleine maar officiële woonplaatsen zou ik altijd wel village i.p.v. hamlet geven omdat een dorpsstatus automatisch het belang van de woonplaats verhoogd.

Met deze overpass niet meer!

Ik heb een overpass gedaan op alle place=city/town/village en de uitkomst daarvan (bijna 2800 plaatsen) in een spreadsheet gezet, met de volgende gegevens:
@id, name, postal_code, population, source.
Het (read-only) spreadsheet staat hier.

/offtopic/
Wat is overigens het nut van een enkelvoudige postcode bij de tags, terwijl voor zeer veel plaatsen geldt dat ze minstens 2 verschillende postcodegetallen hebben?
/offtopic/