Ulrich Rendtel, Willi Seidel, Christine Müller, Florian Meinfelder, Joachim Wagner, Jürgen Chlumsky, Markus Zwick
{"title":"Statistik zwischen Data Science, Artificial Intelligence und Big Data: Beiträge aus dem Kolloquium „Make Statistics great again“","authors":"Ulrich Rendtel, Willi Seidel, Christine Müller, Florian Meinfelder, Joachim Wagner, Jürgen Chlumsky, Markus Zwick","doi":"10.1007/s11943-022-00305-7","DOIUrl":"10.1007/s11943-022-00305-7","url":null,"abstract":"<div><h2>Zusammenfassung</h2><div><p>Die Statistik als fachliche Disziplin muss sich in einem rasch wandelnden Umfeld behaupten, das durch den Aufstieg der Data Science, den Bedeutungszuwachs der künstlichen Intelligenz sowie neue Datenstrukturen charakterisiert wird. Wie kann sich die Statistik hier behaupten oder verlorenes Terrain wiedergewinnen? Unter dem provokanten Motto „Make Statistics great again“ wurden aus verschiedenen Blickwinkeln Entwicklungen, Strategien und positive Beispiele skizziert, wie sich das Fach Statistik an der Universität, im Wissenschaftsbetrieb und auf dem Arbeitsmarkt positionieren sollte. Willi Seidel schaut aus dem Blickwinkel eines Hochschulpräsidenten auf den Ressourcenkampf der Fächer. Christine Müller berichtet über die Initiativen der Dachorganisation DAGStat die vielen Teildisziplinen der Statistik wirkungsvoll im Wissenschaftsbetrieb und in der Öffentlichkeit zu positionieren. Florian Meinfelder dokumentiert den Aufstieg des Masterstudiengangs in Survey Statistik zu einem der nachgefragtesten Studiengänge der Uni Bamberg. Jürgen Chlumsky und Markus Zwick beleuchten die historische Wahrnehmung der Amtsstatistik bei Pflichterhebungen und die Entwicklung der Forschungsdatenzentren sowie moderner Zugänge zu neuen Datenquellen. Joachim Wagner schildert das Verhältnis von Datenproduzenten und Datennutzern aus der Sicht eines unzufriedenen Datennutzers. Schließlich geht es um die Position der Statistik in der Datenwissenschaft. Ist „Data Science“ nur ein neumodisches Wort für Statistik? Ein Konzeptionspapier der Gesellschaft für Informatik (GI) hat zu Positionspapieren der DStatG und der DAGStat geführt, die von Ulrich Rendtel vorgestellt werden.</p><p>Das Kolloquium fand anlässlich der Abschiedsvorlesung von Ulrich Rendtel im Juni 2019 am Fachbereich Wirtschaftswissenschaft der Freien Universität statt.</p></div></div>","PeriodicalId":100134,"journal":{"name":"AStA Wirtschafts- und Sozialstatistisches Archiv","volume":"16 2","pages":"97 - 147"},"PeriodicalIF":0.0,"publicationDate":"2022-05-19","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"https://link.springer.com/content/pdf/10.1007/s11943-022-00305-7.pdf","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"50497119","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"OA","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
{"title":"An update on excess mortality in the second year of the COVID-19 pandemic in Germany","authors":"Giacomo De Nicola, Göran Kauermann","doi":"10.1007/s11943-022-00303-9","DOIUrl":"10.1007/s11943-022-00303-9","url":null,"abstract":"<div><p>In this short note, we apply the method of De Nicola et al. (2022) to the most recent available data, thereby providing up-to-date estimates of all-cause excess mortality in Germany for 2021. The analysis reveals a preliminary excess mortality of approximately 2.3% for the calendar year considered. The excess is mainly driven by significantly higher excess mortality in the 60-79 age group.</p></div>","PeriodicalId":100134,"journal":{"name":"AStA Wirtschafts- und Sozialstatistisches Archiv","volume":"16 1","pages":"21 - 24"},"PeriodicalIF":0.0,"publicationDate":"2022-03-15","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"https://link.springer.com/content/pdf/10.1007/s11943-022-00303-9.pdf","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"50484767","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"OA","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Sebastian Dräger, Johannes Kopp, Ralf Münnich, Simon Schmaus
{"title":"Die zukünftige Entwicklung der Grundschulversorgung im Kontext ausgewählter Wanderungsszenarien","authors":"Sebastian Dräger, Johannes Kopp, Ralf Münnich, Simon Schmaus","doi":"10.1007/s11943-022-00301-x","DOIUrl":"10.1007/s11943-022-00301-x","url":null,"abstract":"<div><h2>Zusammenfassung</h2><div><p>Um die Potentiale der Mikrosimulation als ein Instrument zur Analyse zukünftiger Versorgungslagen in verschiedenen (sozialpolitischen) Bereichen aufzuzeigen, wurde am Beispiel der Stadt Trier eine Mikrosimulationsstudie durchgeführt, bei der der Einfluss unterschiedlicher Wanderungsszenarien auf die Situation der Grundschülerinnen und Grundschüler im Stadtgebiet untersucht wurde. Die Datenbasis stellt eine synthetische Grundgesamtheit der Bevölkerung auf Basis der Zensusergebnisse 2011 dar, welche mit Hilfe von Zensusgitterzellen geografisch im Stadtgebiet verortet und modellbasiert in die Zukunft fortgeschrieben wurde. Außerdem liegen für Trier für die Jahre 2011 bis 2018 präzise Zahlen zu Schülerinnen und Schülern der Elementarstufe vor, an denen nicht nur die Simulationsgesamtheit konfiguriert werden kann, sondern die auch als zentrale Benchmarks für die Validität der Fortschreibungsmodule und –Parameter dienen können.</p></div></div>","PeriodicalId":100134,"journal":{"name":"AStA Wirtschafts- und Sozialstatistisches Archiv","volume":"16 1","pages":"51 - 77"},"PeriodicalIF":0.0,"publicationDate":"2022-02-17","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"https://link.springer.com/content/pdf/10.1007/s11943-022-00301-x.pdf","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"50489541","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"OA","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
{"title":"On assessing excess mortality in Germany during the COVID-19 pandemic","authors":"Giacomo De Nicola, Göran Kauermann, Michael Höhle","doi":"10.1007/s11943-021-00297-w","DOIUrl":"10.1007/s11943-021-00297-w","url":null,"abstract":"<div><p>Coronavirus disease 2019 (COVID-19) is associated with a very high number of casualties in the general population. Assessing the exact magnitude of this number is a non-trivial problem, as relying only on officially reported COVID-19 associated fatalities runs the risk of incurring in several kinds of biases. One of the ways to approach the issue is to compare overall mortality during the pandemic with expected mortality computed using the observed mortality figures of previous years. In this paper, we build on existing methodology and propose two ways to compute expected as well as excess mortality, namely at the weekly and at the yearly level. Particular focus is put on the role of age, which plays a central part in both COVID-19-associated and overall mortality. We illustrate our methods by making use of age-stratified mortality data from the years 2016 to 2020 in Germany to compute age group-specific excess mortality during the COVID-19 pandemic in 2020.</p></div>","PeriodicalId":100134,"journal":{"name":"AStA Wirtschafts- und Sozialstatistisches Archiv","volume":"16 1","pages":"5 - 20"},"PeriodicalIF":0.0,"publicationDate":"2022-01-10","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"https://link.springer.com/content/pdf/10.1007/s11943-021-00297-w.pdf","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"50468099","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"OA","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Kerstin Erfurth, Marcus Groß, Ulrich Rendtel, Timo Schmid
{"title":"Kernel density smoothing of composite spatial data on administrative area level","authors":"Kerstin Erfurth, Marcus Groß, Ulrich Rendtel, Timo Schmid","doi":"10.1007/s11943-021-00298-9","DOIUrl":"10.1007/s11943-021-00298-9","url":null,"abstract":"<div><p>Composite spatial data on administrative area level are often presented by maps. The aim is to detect regional differences in the concentration of subpopulations, like elderly persons, ethnic minorities, low-educated persons, voters of a political party or persons with a certain disease. Thematic collections of such maps are presented in different atlases. The standard presentation is by Choropleth maps where each administrative unit is represented by a single value. These maps can be criticized under three aspects: the implicit assumption of a uniform distribution within the area, the instability of the resulting map with respect to a change of the reference area and the discontinuities of the maps at the borderlines of the reference areas which inhibit the detection of regional clusters.</p><p>In order to address these problems we use a density approach in the construction of maps. This approach does not enforce a local uniform distribution. It does not depend on a specific choice of area reference system and there are no discontinuities in the displayed maps. A standard estimation procedure of densities are Kernel density estimates. However, these estimates need the geo-coordinates of the single units which are not at disposal as we have only access to the aggregates of some area system. To overcome this hurdle, we use a statistical simulation concept. This can be interpreted as a Simulated Expectation Maximisation (SEM) algorithm of Celeux et al (1996). We simulate observations from the current density estimates which are consistent with the aggregation information (S-step). Then we apply the Kernel density estimator to the simulated sample which gives the next density estimate (E-Step).</p><p>This concept has been first applied for grid data with rectangular areas, see Groß et al (2017), for the display of ethnic minorities. In a second application we demonstrated the use of this approach for the so-called “change of support” (Bradley et al 2016) problem. Here Groß et al (2020) used the SEM algorithm to recalculate case numbers between non-hierarchical administrative area systems. Recently Rendtel et al (2021) applied the SEM algorithm to display spatial-temporal clusters of Corona infections in Germany.</p><p>Here we present three modifications of the basic SEM algorithm: 1) We introduce a boundary correction which removes the underestimation of kernel density estimates at the borders of the population area. 2) We recognize unsettled areas, like lakes, parks and industrial areas, in the computation of the kernel density. 3) We adapt the SEM algorithm for the computation of local percentages which are important especially in voting analysis.</p><p>We evaluate our approach against several standard maps by means of the local voting register with known addresses. In the empirical part we apply our approach for the display of voting results for the 2016 election of the Berlin parliament. We contrast our results against Choropleth maps an","PeriodicalId":100134,"journal":{"name":"AStA Wirtschafts- und Sozialstatistisches Archiv","volume":"16 1","pages":"25 - 49"},"PeriodicalIF":0.0,"publicationDate":"2021-12-23","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"https://link.springer.com/content/pdf/10.1007/s11943-021-00298-9.pdf","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"50506177","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"OA","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Ulrich Rendtel, Stefan Liebig, Reinhard Meister, Gert G. Wagner, Sabine Zinn
{"title":"Die Erforschung der Dynamik der Corona-Pandemie in Deutschland: Survey-Konzepte und eine exemplarische Umsetzung mit dem Sozio-oekonomischen Panel (SOEP)","authors":"Ulrich Rendtel, Stefan Liebig, Reinhard Meister, Gert G. Wagner, Sabine Zinn","doi":"10.1007/s11943-021-00296-x","DOIUrl":"10.1007/s11943-021-00296-x","url":null,"abstract":"<div><h2>Zusammenfassung</h2><div><p>Die Weltgesundheitsorganisation (WHO) hat im Frühjahr 2020 Richtlinien für Bevölkerungsstichproben veröffentlicht, die Basisdaten für gesundheitspolitische Entscheidungen im Pandemiefall liefern können. Diese Richtlinien umzusetzen ist keineswegs trivial. In diesem Beitrag schildern wir die Herausforderungen einer entsprechenden statistischen Erfassung der Corona Pandemie. Hierbei gehen wir im ersten Teil auf die Erfassung der Dunkelziffer bei der Meldung von Corona Infektionen, die Messung von Krankheitsverläufen im außerklinischen Bereich, die Messung von Risikomerkmalen sowie die Erfassung von zeitlichen und regionalen Veränderungen der Pandemie-Intensität ein. Wir diskutieren verschiedene Möglichkeiten, aber auch praktische Grenzen der Survey-Statistik, den vielfältigen Herausforderungen durch eine geeignete Anlage der Stichprobe und des Survey-Designs zu begegnen. Ein zentraler Punkt ist die schwierige Koppelung medizinischer Tests mit bevölkerungsrepräsentativen Umfragen, wobei bei einer personalisierten Rückmeldung der Testergebnisse das Statistik-Geheimnis eine besondere Herausforderung darstellt.</p><p>Im zweiten Teil berichten wir wie eine der großen Wiederholungsbefragungen in Deutschland, das Sozio-oekonomische Panel (SOEP), für eine WHO-konforme Covid-19-Erhebung genutzt wird, die im Rahmen einer Kooperation des Robert-Koch-Instituts (RKI) mit dem SOEP als „RKI-SOEP Stichprobe“ im September 2020 gestartet wurde. Erste Ergebnisse zum Rücklauf dieser Studie, die ab Oktober 2021 mit einer zweiten Erhebungswelle bei denselben Personen fortgesetzt werden wird, werden vorgestellt. Es zeigt sich, dass knapp fünf Prozent der bereits in der Vergangenheit erfolgreich Befragten aufgrund der Anfrage zwei Tests zu machen die weitere Teilnahme an der SOEP-Studie verweigern. Berücksichtigt man alle in der Studie erhobenen Informationen (IgG-Antikörper-Tests, PCR-Tests und Fragebögen) ergibt eine erste Schätzung, dass sich bis November 2020 nur etwa zwei Prozent der in Privathaushalten lebenden Erwachsenen in Deutschland mit SARS-CoV‑2 infiziert hatten. Damit war die Zahl der Infektionen etwa doppelt so hoch wie die offiziell gemeldeten Infektionszahlen.</p></div></div>","PeriodicalId":100134,"journal":{"name":"AStA Wirtschafts- und Sozialstatistisches Archiv","volume":"15 3-4","pages":"155 - 196"},"PeriodicalIF":0.0,"publicationDate":"2021-12-09","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"https://link.springer.com/content/pdf/10.1007/s11943-021-00296-x.pdf","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"50464838","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"OA","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Ulrich Rendtel, Ulrike C. Wasmuht, Peter-Theodor Wilrich
{"title":"Emil Julius Gumbel","authors":"Ulrich Rendtel, Ulrike C. Wasmuht, Peter-Theodor Wilrich","doi":"10.1007/s11943-021-00293-0","DOIUrl":"10.1007/s11943-021-00293-0","url":null,"abstract":"<div><h2>Zusammenfassung</h2><div><p>Emil J. Gumbel ist der Namensgeber der jährlichen Gumbel-Vorlesung auf der Statistischen Woche. Leider ist der Namensgeber dieser Vorlesung nur noch wenigen Teilnehmern und Vortragenden bekannt. Dieser Artikel möchten diesem Defizit abhelfen. Denn Gumbel war nicht nur der Namensgeber irgendeiner statistischen Verteilung.</p><p>Der Aufsatz beschreibt den Lebensweg Gumbels vom Weltkriegsteilnehmer zu einem weithin bekannten Pazifisten, der die politischen Morde in der frühen Weimarer Republik mit statistischen Schlußweisen analysierte. Seine Zahlenwerke legten die Defizite der Rechtssprechung in der Weimarer Republik offen. Die Richter kompromittierten sich mit ihren Urteilen. Seine Statistik-Professur an der Universität Heidelberg verlor er nach Angriffen der NS-Studenten und einer deutsch-nationalistischen Universitätsleitung noch vor Beginn der NS-Herrschaft. Wir schildern Gumbels Emigration erst nach Frankreich und von da in die USA und seine vergeblichen Versuche, wieder an deutschen Universitäten aufgenommen zu werden.</p><p>Im zweiten Teil skizzieren wir Gumbels wissenschaftliches Werk im Bereich der Statistik der Extremwerte. Gumbel schrieb nicht nur den Klassiker dieses Statistik-Bereichs. Er baute auch vielen Ingenieuren einen fachlichen Zugang mit leicht berechenbaren und gut interpretierbaren Diagrammen.</p><p>Schließlich schildert einer der Autoren, der Gumbel noch persönlich kannte, seine Erinnerungen an den freundlichen und interessierten Gastprofessor aus den USA.</p></div></div>","PeriodicalId":100134,"journal":{"name":"AStA Wirtschafts- und Sozialstatistisches Archiv","volume":"15 3-4","pages":"273 - 291"},"PeriodicalIF":0.0,"publicationDate":"2021-11-19","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"https://link.springer.com/content/pdf/10.1007/s11943-021-00293-0.pdf","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"50497430","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"OA","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}