job I/O – Virtual Job Event: Triff IT-Arbeitgeber live am 20.06.2024 14:00 – 18:00.
job I/O – Virtual Job Event am 20.06.
Jetzt kostenlos anmelden!
Deutsches Zentrum für Luft- und Raumfahrt (DLR)

Student/in Informatik (w/m/d) - Masterthesis Spatial temporal bias challenge

Braunschweig

Datenanalyse
Python
company visual

Steigen Sie ein in die faszinierende Welt des Deutschen Zentrums für Luft- und Raumfahrt (DLR), um mit Forschung und Innovation die Zukunft mitzugestalten! Mit dem Know-how und der Neugier unserer 11.000 Mitarbeitenden aus 100 Nationen sowie unserer einzigartigen Infrastruktur, bieten wir ein spannendes und inspirierendes Arbeitsumfeld. Gemeinsam entwickeln wir nachhaltige Technologien und tragen so zur Lösung globaler Herausforderungen bei. Möchten Sie diese große Zukunftsaufgabe mit uns zusammen angehen? Dann ist Ihr Platz bei uns!

Für unser Institut für Softwaretechnologie in Braunschweig suchen wir eine/n Student/in Informatik (w/m/d), Addressing Class Imbalance Challenges and Bias in Outbreak Prediction from Spatial and Temporal data

Das erwartet Sie:

Epidemiology extensively employs spatial and temporal models for predicting outbreaks and hotspots based on real historical data. In scenarios involving infrequent events like hotspots, a common challenge arises from the uneven distribution of classes in predictor variables. Standard solutions include techniques like stratified k-fold and oversampling or under sampling etc. However, when dealing with geospatial and temporal data, these techniques may introduce biases. This bias may emerge from oversampling data from the same geographical regions or similar timeframes. This, if not dealt with in care, can lead to a bias model.

Spatial models represent another problematic area since these models, incorporating methods like spatial autocorrelations etc., aim to address unbiased class distribution often overlook temporal factors. Conversely, temporal models focus on temporal aspects but may overlook spatial considerations.

In cases such as outbreaks and hotspots, it is crucial to incorporate biased data that reflects inherent spatial and temporal patterns.

A possible strategy to solve this problem is to preprocess data and fed into the model with some loss or cost function. This function can be calculated based on the gathered hotspot information from the neighboring data in the radius of each geographical point. Closer points show similar patterns can could hold the same hotspot value, farther points are more likely to be dissimilar. The points in between can get a continuous value based on its position within the radius. For this it is important to divide the space employing a hierarchical spatial representation, like a quadtree or kD-tree. Another important aspect is than based on each point further parameters can be imputed for example mobility information.

In this thesis, the student will have to undertake thorough gap analyses, delving into existing literature, experimenting with prevailing solutions, pinpointing disparities, and formulating approaches to address identified problems.

Students interested in this position should have a Computer Science background, proficient in Python and should have previous data analysis experience. An asset would be basic knowledge in the development of algorithms using spatial data structures, but this is not a must.

Das erwarten wir von Ihnen:

  • Pursuing Master degree in Computer or mathematical science or similar
  • Proficient in Python
  • Should have previous data analysis experience
  • An asset would be basic knowledge in the development of algorithms using spatial data structures, but this is not a must.

Unser Angebot:

Das DLR steht für Vielfalt, Wertschätzung und Gleichstellung aller Menschen. Wir fördern eigenverantwortliches Arbeiten und die individuelle Weiterentwicklung unserer Mitarbeitenden im persönlichen und beruflichen Umfeld. Dafür stehen Ihnen unsere zahlreichen Fort- und Weiterbildungsmöglichkeiten zur Verfügung. Chancengerechtigkeit ist uns ein besonderes Anliegen, wir möchten daher insbesondere den Anteil von Frauen in der Wissenschaft und Führung erhöhen. Bewerbungen schwerbehinderter Menschen bevorzugen wir bei fachlicher Eignung.

Weitere Angaben:

  • Eintrittsdatum: sofort
  • Dauer: 6 Monate
  • Vergütung: Keine
  • Kennziffer: 91728
Job-Infos
Berufsfelder
Forschung
Studienfächer
Informatik
Informationstechnik
Wirtschaftsinformatik
Abschluss
Bachelor
Unternehmen
Deutsches Zentrum für Luft- und Raumfahrt (DLR)
Deutsches Zentrum für Luft- und Raumfahrt (DLR)
Profil100 IT-Jobs
Auszeichnungen