ML/LLM Engineer (m/w) 60-100%

Job Informationen

Arbeitsort: Rotkreuz vor Ort, mit zusätzlicher Option auf Homeoffice Pensum: 60-100% Aufgaben: ‍• Integration und Fine-Tuning von Open-Weight- und kommerziellen LLMs (GPT OSS, Mistral, Cohere, OpenAI) • Entwicklung und Optimierung multimodaler Verarbeitungspipelines (Text, Audio, Bild) inkl. OCR, Docling und Whisper • Design und Verbesserung von RAG-Pipelines mit Fokus auf Recall, semantische Relevanz und Robustheit • Implementierung von Query-Focused Summarization (QFS) für präzise, kontextgerechte Informationsaufbereitung • Optimierung von Chunking-, Embedding- und Indexierungsstrategien für skalierbares Retrieval • Definition und Auswertung von Metriken zu Relevanz, Halluzinationskontrolle und Modellzuverlässigkeit • Aufbau von Human-in-the-Loop Prozessen für Qualitätskontrolle • Sicherstellung von Model Governance, Zugriffsmanagement und sicherem Umgang mit Daten • Dokumentation von Modellarchitekturen, Benchmarks und Deployment-Prozessen • Aktives Verfolgen aktueller Entwicklungen in Open-Source-LLMs und verantwortungsvoller KI Dein Profil: ‍• Nachweisbare Erfahrung im produktiven Einsatz von LLMs • Tiefes Verständnis von Frameworks wie PyTorch, Transformers und LangChain • Erfahrung im Fine-Tuning von Open-Weight Modellen (GPT OSS, Mistral, Cohere) • Gute Kenntnisse von Datenpipelines, Vector-Datenbanken und RAG-Architekturen • Vertraut mit multimodaler Verarbeitung (Text, Audio, Bild) sowie ETL-Pipelines für unstrukturierte Daten • Erfahrung mit MLflow, Kubeflow oder Weights & Biases • Sehr gute Python-Kenntnisse sowie Erfahrung mit Pandas, NumPy und PyTorchLightning • Analytische und strukturierte Arbeitsweise, sowie Interesse an verantwortungsvoller und transparenter KI

Benötigte Skills

ETL
Python
Machine Learning

Job Details

Job Status Aktiv
Pensum Voll-/Teilzeit