Je z hlediska historie statistiky nejdůležitější rok 1052, kdy sečetli majetek litoměřického kostela, nebo rok 1870, v němž proběhlo sčítání lidu na území Rakouska-Uherska?

Rok 1870 je určitě významný mezník. Tímto datem se odstartovalo moderní sčítání obyvatelstva, a to včetně zavedení desetileté periody. Ta se opakovala za Rakouska-Uherska a přenesla se i do existence Československa a České republiky.

Co se tehdy zjišťovalo?

Především počet a struktura obyvatel, profese a sociální příslušnost. My dnes máme průběžnou statistiku, ale tehdy nic takového neexistovalo, k dispozici byly jen populační knihy se soupisem obyvatelstva na jednotlivých panstvích. Zaznamenáno bylo ovšem pouze přítomné obyvatelstvo. Sečten byl tedy ten, kdo byl zachycen v daném místě v rozhodný okamžik. Dnes je koncept jiný, zajímá nás obvyklý pobyt, tedy místo, kde skutečně žijete.

K čemu monarchie data využívala?

Sčítání se datují už od starověku. Známe biblický příběh Josefa a Marie, kteří se vraceli v průběhu sčítání lidu do místa svého bydliště, tedy do Betléma. Za Marie Terezie a později bylo nejdůležitější zjistit počet dospělých mužů, kteří mohli být odvedeni do armády, zavedlo se také zjišťování domů a hospodářské charakteristiky jejich majitelů. Výsledky soupisu z roku 1754 byly dlouho považovány za státní tajemství a data byla více než sto let utajována. Panovníky pochopitelně zajímalo i to, kolik mají daňových poplatníků. V průběhu času se účel sčítání měnil s tím, jak nabývala na významu sociální politika státu. V sedmdesátých a osmdesátých letech minulého století se do popředí dostávaly otázky, které se týkaly vybavení domácností, sociální struktury, bydlení.

V socialistickém Československu se národní hospodářství řídilo pětiletými plány. Vycházela jejich příprava ze statistik ze sčítání lidu?

Pětiletky byly vztaženy hlavně k výrobě, ale existovaly i plány týkající se spotřeby a životní úrovně. Základem pro jejich zpracování populační cenzy určitě byly. První integrované sčítání lidí, domů a bytů bylo v roce 1961, kde se zjišťovaly například údaje o dojíždění do zaměstnání. O deset let později se poprvé použilo rodné číslo a byl také připojen mikrocenzus, v němž se zapisovaly příjmy obyvatelstva. Sčítání je skutečně matka všech zjišťování v domácnostech, takže získané údaje se pro plánování hojně využívaly.

Po listopadu 1989 se uskutečnila tři sčítání. Změnila se během třiceti let práce s daty?

Po technologické stránce pochopitelně zásadně. Připomínám však, že první počítače byly používány už před sto lety, dokonce i v roce 1870 existovaly jednoduché sčítací stroje. A v osmdesátých letech minulého století se výsledky zpracovávaly na poměrně moderních výpočetních systémech. Proměnil se obsah dotazníků. V roce 1991 ještě obsahovaly otázky na vybavení domácností, které byly odbourány až při posledním sčítání v roce 2011.

Proč už to nebylo pokládáno za přínosné?

Protože míra uspokojení potřeb v tomto směru byla obrovská. Pračku, mrazničku nebo barevný televizor měl prakticky každý. Dříve to byly často nedostupné předměty, neboť televize vyšla na několik měsíčních platů. V prvním desetiletí nového milénia už šlo o běžně dostupné věci, takže pro stát nebylo zajímavé mít o nich přehled.

Tehdy se ještě sledovalo, kdo vlastní počítač a je připojen k internetu, konkrétně šlo o 65, respektive 61 procent domácností. Dnes má počítač nebo tablet 79 procent z nich a připojeno k síti je 90 procent. I proto bude sčítání, které začíná zítra, převážně elektronické. Jak se to promítne do počtu lidí, kteří se na tomto projektu podílejí?

Projekt se připravuje několik let, vlastně hned po zpracování a publikaci výsledků se začíná pracovat na konceptu dalšího sčítání. Zpočátku se tím zabývá malý tým zaměstnanců Českého statistického úřadu (ČSÚ), s narůstajícími agendami se zapojují další lidé. V posledních dvou letech se na tom podílí několik set lidí. Jde o naše zaměstnance i externí spolupracovníky na krajských správách ČSÚ a na okresech, kde mají na starost územní přípravu, kontakt s obecními úřady a kontrolu registrů domů.

Zásadní navýšení asi přijde se zapojením sčítacích komisařů.

Na sběr dat jsou najímání lidé na dohodu o provedení práce. Jde o zhruba 10 tisíc sčítacích komisařů pod hlavičkou České pošty a dva tisíce z ČSÚ.

Komplikuje vám situaci covid?

Do určité míry ano. Velkou výhodou ovšem je, že primárně je sběr dat založen na elektronické bázi. Předpokládáme, že dvě třetiny domácností sečteme on-line. V terénním došetření jsme museli učinit určité úpravy v sytému distribuce, sběru formulářů i osobní asistenci. Lidé se budou muset více obracet na naše webové stránky nebo telefonní informační linky. Spoléháme i na to, že mladší lidé formuláře vyplní elektronicky za své starší příbuzné či blízké, kteří zrovna s vyplněním dotazníku budou potřebovat pomoci. Práce v terénu se tedy omezí na rozvoz sčítacích archů s obálkami. Pro jejich sběr by se měly využít poštovní schránky nebo pobočky České pošty.

Jen připomínám, že účast na sčítání není dobrovolná, ale jde o povinnost vyplývající ze zákona. Budete kontrolovat, zda k tomu tak lidé přistupují?

Sčítání je povinné, protože jde o plošné zjišťování údajů, při němž je důležité, aby bylo sebráno maximum údajů ze všech domácností. Jen tak mohou být data vypovídající. Každá povinnost má pochopitelně sankci, ale my ji nechceme používat jako bič nebo strašák. Pouze tím chceme podtrhnout důležitost projektu. Pokud lidé ovšem svoji zákonnou povinnost nesplní a budou ji bojkotovat, jejich chování může být penalizováno na základě podnětu pro spáchání přestupku.

Jde však také o věrohodnost dat. Nevymýšlejí si lidé některé údaje, například o metrech čtverečních obytné plochy, kterou nenosí každý v hlavě?

Většinu dat, která lidé vyplňují, mají v hlavě. Jde třeba o dopravní prostředek při cestě do zaměstnání, vytápění domácnosti, dosažené vzdělání a tak podobně. Metry čtvereční k nim možná nepatří, takže by bylo dobré si předem tento údaj ověřit, buď v nájemní smlouvě, nebo v dokladu o vyúčtování energií. Věříme, že lidé při vyplňování dotazníku nepodvádějí, protože k tomu není důvod. Formuláře neobsahují citlivé otázky, přihlášení k národnosti či církevnímu vyznání je dobrovolné. Nás navíc nezajímá situace konkrétního občana, ale hromadné údaje. Bez identifikace člověka a jeho odpovědí se k nim však nedostaneme. Musíme také vyloučit dublování a spárovat data s registry.

Co jste schopni z veřejně dostupných registrů vyčíst?

Spoléháme zejména na registr osob, kde jsou údaje o státním občanství, pohlaví, trvalém bydlišti či rodinném stavu. Z registru nemovitostí máme údaje o domech, z čeho jsou postaveny, zda mají výtah a podobně. Využíváme i databáze sociálního zabezpečení. Ptáme se sice na ekonomickou aktivitu obyvatel, ale pokud se to v ojedinělých případech nepodaří získat, jsme schopni to dohledat jinak. V žádném registru ale nenajdeme fakta o dojezdové vzdálenosti do zaměstnání a využívaných dopravních prostředcích nebo o dosaženém vzdělání či profesi, kterou člověk vykonává.

Kolik lidí bude tu obrovskou sumu dat zpracovávat?

Desítky našich zaměstnanců. Kódování dat je automatizované, takže více práce bude se skenováním dotazníků a jejich převáděním do elektronické podoby, ale to nám zajišťuje Česká pošta. Budeme muset identifikovat některé údaje, jež nebudou čitelné nebo správně zapsané, takže půjde o kombinaci automatického a ručního zpracování. Dříve se počítací stroje používaly k prostým součtům, dnes běžně využíváme sofistikované algoritmy a propojování dat.

Zajímá mě především další fáze, tedy využitelnost dat, jejich analýza jako podklad pro rozhodovací procesy. Například z posledního sčítání vyplynulo, že obyvatelstvo Česka stárne. Průměrný věk, medián i index stáří dosáhl historického maxima, podíl lidí starších 65 let vzrostl mezi sčítáními 2001 a 2011 o dva procentní body. Jak se za uplynulých deset let s touto informací naložilo?

Věková struktura obyvatelstva je důležitý údaj, byť tady nejsme odkázáni na desetiletou periodu, neboť máme k dispozici průběžná data o počtu narozených a zemřelých. Sčítání ale umožňuje údaje zkalibrovat a zpřesnit. Díky němu můžeme podchytit i zahraniční migraci, protože nejde jen o občany trvale žijící v České republice, ale také o ty, kteří se přistěhovali či odstěhovali. Připomínám, že v rámci Evropské unie mohou lidé setrvávat v jakékoliv členské zemi, aniž by byli registrováni, tento fakt můžeme zaznamenat jen při sčítání. Skutečnost, že obyvatelstvo stárne, je nutné zohlednit při projekci důchodového systému nebo zařízení pro seniory.

V tom případě se mi zdá nepochopitelné, že se ještě dnes bavíme o důchodové reformě, kterou ani tato vláda nebyla schopna provést. Z predikce vyplývá, že v roce 2100 bude v zemi třetina obyvatelstva starší 65 let.

To je vzdálená projekce a nikdo ji není schopen potvrdit. V horizontu deseti let ale máme poměrně přesné modely věkové struktury obyvatelstva i populačních vln. Bohužel v České republice máme obecně slabinu ve využívání dat pro rozhodování. My se snažíme je propagovat, jsme v nabídce velmi aktivní vůči všem institucím a poskytujeme je v komfortní podobě. Avšak platí, že můžete přivést koně k vodě, ale pít je nedonutíte. Je tedy na uživatelích, aby s daty více pracovali. Je pravda, že pandemie přinesla vyšší zájem o statistiku. Všichni hltají informace z Ústavu zdravotních informací a statistiky a každý ví, co znamená reprodukční číslo R. Kraje také daleko více využívají demografickou faktografii, je pro ně třeba důležité vědět, kolik starších osamělých lidí u nich žije. Stejně tak starostové potřebují data o mladých rodinách kvůli kapacitám mateřských a základních škol. A to nikoliv o fiktivně trvale hlášených obyvatelích, ale o těch, kteří v jejich obci skutečně žijí.

Pozoruhodnou informací je také zjištění, že neustále roste počet jednočlenných domácností, ať už mladých svobodných mužů a žen, či ovdovělých seniorů. V březnu 2011 bylo sečteno tři sta tisíc samostatně bydlících jednotlivců ve věku 20 až 39 let a jejich zastoupení mezi single domácnostmi přesáhlo jednu pětinu. Ve věku do 27 let tímto způsobem žilo 13 procent žen. Považujete to za významný trend?

Určitě to souvisí s politikou bydlení, je to klíčový ukazatel pro developery, protože roste poptávka po menších bytech. Je to ale důležité i pro zajištění dalších služeb pro občany, ať už jde o mladé matky, které potřebují školky či jesle, nebo seniory odkázané na sociální pomoc. Sčítání je důležité pro podchycení trendů a jejich extrapolaci, a to na celostátní i regionální úrovni.

A právě zde mě zaujal údaj z Ústeckého kraje, kde před deseti lety žilo 809 000 obyvatel, z toho více než polovina žen, přičemž čtvrtina z nich byla buď rozvedená, nebo ovdovělá. Analytici z toho vyvodili, že v regionu by se výborně uživili řemeslníci nabízející služby takzvaného hodinového manžela. Dají se tedy závěry sčítání využít i v podnikatelské sféře?

Určitě ano. Struktura obyvatelstva podle rodinného stavu a vzdělání ve velmi podrobném regionálním členění je veřejně k dispozici. Z toho se dají vyvodit různé závěry. Kouzlo sčítání je v tom, že se získané údaje dají libovolně kombinovat. Mimochodem zajímavý pohled nabízí vývoj rodinného stavu u mužů. Před sto lety bylo v populaci nad patnáct let více svobodných mužů než v roce 2011, tehdy to ovšem bylo hlavně proto, že sňatek si z finančních důvodů nemohli dovolit. Po druhé světové válce nastal svatební boom a počet svobodných lidí výrazně klesl. V roce 1980 bylo jen 23 procent nesezdaných mužů, ale v roce 2011 už 35 procent.

Uvidíme, zda se po letošním sčítání šance vdavekchtivých dívek ještě zvýší. Architekti zase ze statistických dat vyčetli, že Česká republika je velmocí v pořizování bazénů a saun, takže vedle hodinových manželů jde o další profesi, která má zřejmě perspektivu.

Ve sčítání počty bazénů nezjišťujeme, takže zdroj dat v tomto případě bude asi jinde. Pravda ale je, že když se projedete českou a moravskou krajinou, bazénů v ní je opravdu hodně. Možná by se to dalo přesně zjistit pomocí satelitního snímkování, mohl by to být námět pro rozvíjející se obor geostatistiky.

Ono to může souviset s podstatným fenoménem, jímž je vodohospodářství. Podle zákona například obce nad dva tisíce obyvatel musejí mít vlastní čističku odpadních vod. Každé z nich proto bude velmi záležet na výkazu reálně žijících lidí na jejím území.

Právě proto klademe takový důraz na to, kde lidé skutečně žijí, nikoliv kde mají zapsáno trvalé bydliště, v němž se nezdržují. Konkrétně zásobování vodou je dnes strategická záležitost, a proto zjišťujeme i způsob připojení k vodě. Pro obce je tato pasáž extrémně důležitá. Odvíjejí se od toho také různé dotační programy.

Bez statistických podkladů se neobejde ani integrovaný záchranný systém. Je to skutečně tak, že když hasiči vyjíždějí k požáru, vědí předem, o jaký objekt jde, kolik má pater, kde jsou nosné zdi, z čeho byl postaven a kdo v něm žije?

Tak dokonale a online to zatím nefunguje, ale určitě by to byl ideální stav. Naše data jsou potřebná hlavně při plánování a přípravě záchranných akcí a eliminaci rizik. Záchranáři vědí, o jaké sídliště jde, jaká zástavba tam převládá, zda tam jsou výtahy, kde je přívod vody a plynu a jaká je věková struktura obyvatel v daném území.

Uvidíme, zda se v předvolební kampani objeví sliby, že „koně budou u statistické řeky dat nejen stát, ale i z ní pít“. Než k tomu dojde, musí se hlasovat. Loni na podzim jsme zažili netradiční covidové volby. Možná nás něco podobného čeká i letos. Je na to Český statistický úřad připraven?

Nás se to příliš nedotkne, je to spíše otázka na ministerstvo vnitra, které zajišťuje průběh voleb včetně hlasovacích místností. Z krajských voleb si pamatujeme třeba na drive in hlasování z aut. Možná to bude ve hře i na podzim, ale zatím to specifikováno není. My samozřejmě s ministerstvem průběžně komunikujeme a jsme schopni se přizpůsobit jakýmkoli modelům hlasování.