On Sat, Apr 3, 2021 at 1:55 PM Just van den Broecke <
ju...@justobjects.nl> wrote:
> Bedankt voor de inzichten. Ik zie 3 aspecten in je betoog:
>
> - gemeentelijke-indeling.xml als ik goed begrijp zijn er 2 onderdelen:
> 1) het Shell/Python script om de .xml te onderhouden. 2) het inlezen van
> de volledige xml in een genormaliseerde tabel structuur. Beiden kunnen
> in BAG v2 worden meegenomen. Denk wel beter om 1) op gemeenschappelijke
> (voor BAG v1 en v2) plek te onderhouden.
> Ad 2) de .xml kan zo door Stetl ingelezen worden.
> Ik ging ervan uit dat voor een specifieke BAG verwerking met standdatum
> een enkel jaar nodig was. Maar uiteraard bevat elke BAG volledige
> historie inclusief voor gem-wpl koppeling, dus zinvol om de
> gemeentelijke-indeling.xml aan te houden. PR welkom.
Het gemeentelijke-indeling.xml bestand wordt onderhouden met het
gemeentelijke-indeling.py script.
Met de --add-cbs-data optie wordt de CBS spreadsheet geparsed en een
nieuwe indeling aan de XML toegevoegd.
Wanneer het formaat van de CBS spreadsheet wijzigd wordt de parser
bijgewerkt om ook dat formaat te ondersteunen.
Met processGemeentelijkeIndeling() in bag/src/processor.py wordt de
XML geparsed t.b.v. de database tabel. Dit moet op een of andere
manier voor BAG v2.0 ook gedaan gaan worden.
Met Stetl heb ik nog weinig tot geen ervaring, dus het is mij niet
direct duidelijk hoe dat te implementeren.
> - ik begrijp niet goed wat OpenStreetMap met BAG historie moet. Om
> zelfde reden als BAG? Ook hier denk ik dat 99% van de afnemers de
> "huidige BAG" wil. Dat is al een lastig begrip. Voor onderhoud aan BAG
> data in OSM is historie wel van belang, maar m.i. minder om "terug in de
> tijd" te gaan. Eerlijk gezegd ontbreekt mijn kennis hoe BAG in OSM
> precies werkt.
OpenStreetMap doet in principe niets met de BAG historie. Mijn tooling
heeft queries voor de actuele data ala de actueelbestaand views, voor
die queries is de historie relevant.
In theorie zou daarmee ook historische data opgehaald worden (e.g. de
woonplaatsen in 1991 ipv dit jaar), maar dat wordt in de praktijk niet
gedaan.
Mijn tooling werkt voornamelijk met de woonplaatsen, met ogr2osm wordt
de data geconverteerd om OSM mee bij te werken.
Daarnaast is er ook de JOSM plugin, ontwikkeld door Gert-Jan Idema,
welke gebruik maakt van de BAG WFS en waarmee de gebouwen en adressen
worden onderhouden.
> - ik wilde sowieso in NLExtract BAG v1 en v2 compleet gescheiden houden.
> En v2 met Stetl, zodat heel NLExtract straks uniform werkt. Met bijv
> enkele Docker file. Zodat ook BAG v1 normaal blijft werken. Behoudens
> evt gedeelde gemeentelijke-indeling.xml.
De bag subdirectory is NLExtract legacy wat mogelijk met de tijd
verwijderd kan worden wanneer het niet meer relevant is omdat iedereen
over is naar BAG v2.0.
Tot die tijd is de gemeentelijke-indeling.xml te gebruiken voor beide.
> - de LVBAG GDAL afhankelijkheid: dat punt heb ik verschillende malen
> opgebracht. Niet echt reacties. Dan neem ik zelf beslissingen. Ik mag
> toch hopen dat het grootste deel van de gebruikers met Docker of andere
> containers gaat werken. Het handmatig installeren en vooral onderhouden
> van GDAL, GEOS, Proj en Python bindings op alle platformen is sowieso
> "(DLL/.a/.so-)hell". Denk aan alle vragen op de fora. Maar in mijn
> eerdere mail gaf ik al aan hoe met Stetl toch BAG v2 (zonder recente
> GDAL) kan worden ingelezen. Als iemand dat wil bijdragen...Snelheid is
> nu ook wel goed: op snelle machine duurt inlezen heel NL 10 minuten. 1
> uur op 5,- Hetzner VM.
Gezien ik de packages voor GDAL, GEOS, PROJ, etc. ondehoud voor Debian
ligt het gebruik daarvan voor mij voor de hand.
Docker is niet gepackaged in Debian, en zodoende voor mij persoonlijk
geen optie. Voor de gemiddelde gebruiker is het een prima optie.
Op mijn machine duurt het laden van de BAG v1.0 zo'n 8 uur, ben
benieuwd of BAG v2.0 meer of minder tijd zal kosten.
Heb je een link naar de betreffende mail over hoe met Stetl geen
recente GDAL vereist is voor BAG v2.0?
Dat is iets waar ik naar wil kijken gezien dat een betere oplossing
lijkt voor mijn infrastructuur.
> Het was ook een kwestie van deadlines: per 1 April (geen grap) verdwijnt
> in principe de BAG v1 levering. Dus de beroemde "inspireadressen" Atom.
> Per 1 oktober 2021 stopt BAG v1 definitief. In periode 1 april-1okt is
> er alleen "niet-gecontroleerde" BAG v1, whatever that means. De Atom
> wordt door Kadaster als "achterdeur" gezien (hun woorden) en komt er
> voorlopig niet voor v2. Is natuurlijk laatste woord niet over gezegd...
Het verdwijnen van de inspireadressen dataset is zorgelijk. Dat is
prima open data.
Betalen voor BAG v2.0 is voor OpenStreetMap doeleinden geen optie.
Was het levereren van de inspireadressen dataset geen wettelijke verplichting?
Mvg,
Bas