Deutsches Zentrum für Luft- und Raumfahrt (DLR)
Praktikum / Abschlussarbeit im Bereich Informatik, Data Science, Mathematik (w/m/d)
Jena
Am Institut für Datenwissenschaften in Jena beschäftigen wir uns damit, das Datenrückgrat für alle Anwendungsbereiche des DLR (Luftfahrt, Raumfahrt, Energie, Verkehr, Sicherheit) Realität werden zu lassen. Dafür entwickeln und erforschen wir in interdisziplinärer Arbeit Methoden mit Fokus auf Anwendungen z. Bsp. für nachhaltige und kreislaufgerechte Prozesse, resiliente Lieferketten, datengetriebene Wertschöpfungsketten oder robuste Entscheidungsunterstützung. Die so entwickelten Methoden werden in Kooperation mit anderen DLR-Instituten und externen Partnern zur Anwendung gebracht, sei es im Rahmen gemeinsamer Projekte oder im Rahmen von Technologietransferaktivitäten.
Das erwartet dich
Im Projekt OpenSearch@DLR2.0 erfolgt der Aufbau einer DLR-Suchinfrastruktur aus modularen Komponenten zur Akquisition, Aufbereitung und Anreicherung von Web- und Forschungsmetadaten. Gleichzeitig soll es neue Technologien und Innovationen im Bereich der Internetsuche und des Informationsmanagements integrieren. Dies umfasst internes wie externes verteiltes Webcrawling, Anschluss an Spezialdatenbanken, zum Beispiel in der Erdbeobachtung oder im Forschung-Datenmanagement, sowie neue Methoden zur automatischen Informationserschließung in sehr großen Datenbeständen durch den Einsatz von Methoden der künstlichen Intelligenz (KI).
Deine Aufgaben
Für die Anreicherung der Metadaten von Webseiten erfolgt im Projekt die Klassifikation dieser anhand von Textinhalten. Während vortrainierte Modelle für eine Klassifikation in grobe Klassen, wie News oder Wissenschaft, bereits vorliegen, ist auch eine feingranulare Kategorisierung von Webseiten mit thematisch ähnlichen Inhalten erforderlich. Dazu wurde bereits ein Konzept zum Clustering der Webseiten erarbeitet, welches es im Rahmen des ausgeschriebenen Praktikums oder der Erstellung einer Abschlussarbeit, weiter zu entwickeln gilt.
- Konzeptionierung, Implementierung und Evaluierung eines flexiblen Klassifikationsansatzes zur unüberwachten feingranularen Klassifikation von Webseiten innerhalb einer thematischen Domäne
- Nutzung von Software zum fokussierten Crawling von Webseiten
- Analyse der Daten bezüglich des Informationsgehalts, beispielsweise im Kontext von kritischen Infrastrukturen und Extremwetterereignissen
- Dokumentation der implementierten Software und der Ergebnisse
Das bringst du mit
- Laufendes Studium der Informatik, Data Science oder Mathematik
- Vorgesehenes Pflichtpraktikum oder Abschlussarbeit
- Sehr gute Python Kenntnisse
- Schnelle Auffassungsgabe mit zielorientierter und selbständiger Arbeitsweise
Wir freuen uns darauf, dich kennenzulernen!
Fragen zu dieser Position (Kennziffer 2824) beantwortet dir gerne:
Jens Kersten
Email: jens.kersten@dlr.de
- Deutsches Zentrum für Luft- und Raumfahrt (DLR)Martin von Depka ProndzinskiSoftwareentwickler"Ich kann mich sehr gut mit den Werten des DLR identifizieren."Mehr
- Deutsches Zentrum für Luft- und Raumfahrt (DLR)Henry RotzollSoftware-Entwickler"Unsere Systeme sind alle langfristig angelegt, wir haben schließlich ein ehrgeiziges Ziel: die Speicherung der Daten für die Ewigkeit."Mehr
- Schwarz ITBI Platform (Junior-) Engineer (SAP BW/4HANA) (m/w/d)HeilbronnDatenbankentwicklung/BI
- DZ BANKData Analyst / Data Engineer Vertriebscontrolling m/w/dFrankfurt am MainBusiness Analysis +1
- HanseMerkurData Engineer (m/w/d)HamburgDatenbankentwicklung/BI
- DZ BANKBusiness Analyst ML / Data Lake / AI / Cloud m/w/dFrankfurt am MainSystem Engineering / Admin +2
- REWE GroupIT Datenbankadministrator Microsoft SQL Server (m/w/d)KölnSystem Engineering / Admin +1