![]() AI DevOps / Infrastructure / Optimisation - Infomaniak Infomaniak, c est 30 ans de savoir-faire et plus de 290 passionné e s, avec une ambition commune : créer un cloud éthique sans compromis sur l écologie, la vie privée et l créons des centers qui sont Ä la pointe de écologique et nous développons des services IaaS, PaaS et SaaS entièrement hébergés et développés en Suisse pour le B2B et le B2C. Nos solutions comprennent une suite en ligne et des solutions d hébergement cloud, de streaming, de marketing et d évé des millions et la confiance publiques et privées dans toute l Europe - telles que la RTBF, les Unies, des banques centrales, plus de radios et TV, et de nombreuses métropoles et organismes de sécurité - Infomaniak est une entreprise indépendante, engagée pour l indépendance technologique en Europe, l économie locale et un numérique plus soutenable pour la planè prĪ Ä rejoindre une entreprise en pleine croissance, Ä donner le meilleur de toi-mĪme et Ä grandir avec nous afin de contribuer au développement d une éthique aux géants du Web ? Alors, nous avons hÄ¢te de te rencontrer !Nous recherchons un e : AI DevOps / Infrastructure / :Infomaniak développe une IA open source hébergée sur ses propres suisses. Nous déployons des modèles de langage Ä grande échelle et construisons des agents intelligents pour nos produits kMeet, kDrive). Nous recherchons un e AI Engineer pour concevoir, implémenter et optimiser nos agents IA, avec un focus sur la qualité, la fiabilité et l expérience responsabilités :Déploiement & : Déployer, maintenir et optimiser des LLM X en maximisant l efficacité des ressources GPU / & Améliorer et industrialiser nos pipelines Gitlab CI pour les modèles IA (build, test, déploiement, rollback). Piloter les déploiements via Flux CD (GitOps).Monitoring & Observabilité : Renforcer notre stack Prometheus / Grafana / Victoria Metrics pour une visibilité fine sur les performances, la GPU, la la disponibilité et de manière générale la santé des services des ressources : Travailler sur l efficacité des coÄ»ts et des performances (autoscaling, scheduling, gestion des quotas, des é & Fiabilité : Garantir la robustesse, la sécurité et la reproductibilité des déploiements dans un environnement critiqueLe profil qui nous fait vibrer :MaÄ®trise des frameworks modernes de serving (ex : vLLM, TGI, Ä®trise de GitLab CI (pipelines, runners, variables, avec Kubernetes).Expérience confirmée en Kubernetes Helm, CRDs, networking, autoscaling).Expérience avec Flux CD (GitOps, HelmReleases, Kustomize, des déploiements).Expérience avec Prometheus / Grafana (dashboards, alerting, exporters).Connaissance des infrastructures GPU (NVIDIA, CUDA, GPU scheduling, monitoring).Appétence pour la qualité, la fiabilité et la performance.Capacité Ä travailler en environnement critique (SLA élevé, haute disponibilité).Bonne capacité Ä collaborer avec des équipes ML X .Un si tu as des connaissances en :Curiosité technique, goÄ»t pour les challenges innovants et contributions open source ou les side projects sont appréciésTu aimes travailler en équipe, et fais preuve d une positiveTon humour, ta flexibilité et ton esprit d équipe sont des indispensables pour travailler dans le funLa stack technique que l on utiliseLangChainPydantic-aivLLMFastAPIGitlabSentryQdrant Le poste : Ä durée indéterminéeTaux : 80 - : GenèveDisponibilité : Au plus vite Les étapes du processus de recrutement :Un premier entretien technique pour valider tes compé second entretien dans nos bureaux jidd356857afr jit0207afr jpiy26afr |