Remote
Job description
Rejoignez **Tether**, le leader de la finance numérique, pour concevoir et piloter l’infrastructure d’inférence IA de notre plateforme QVAC. Vous intégrerez une équipe technique internationale, en full‑remote, et serez le garant de la couche système C++ qui assure l’exécution ultra‑rapide, fiable et prévisible des modèles d’intelligence artificielle sur le matériel de nos utilisateurs (CPU, GPU, NPU, Edge‑TPU, etc.).
### Vos missions principales
- **Conception et implémentation** d’une stack C++ haute performance, capable de charger, initialiser et exécuter des modèles IA en quelques millisecondes.
- **Optimisation du temps de démarrage** (cold‑start) et de la consommation mémoire afin de garantir une expérience fluide même sur des appareils aux ressources limitées.
- **Gestion fine du débit / latence** : mise en place de mécanismes d’équilibrage dynamique, de pipelines asynchrones et de stratégies de batching adaptatives.
- **Stabilité à long terme** : surveillance et correction des fuites mémoire, des dérives de performance et des blocages lors de sessions prolongées.
- **Définition d’abstractions modulaires** permettant d’ajouter de nouvelles fonctionnalités (quantisation, pruning, compilation JIT) sans impacter les performances existantes.
- **Collaboration étroite** avec les équipes produit, data‑science, sécurité et UX pour garantir que les exigences fonctionnelles et de confidentialité soient respectées.
- **Contribution à la documentation technique** et aux bonnes pratiques de code (revues, tests unitaires, benchmarks, CI/CD).
### Profil recherché
- Minimum 5 ans d’expérience professionnelle en développement C++ sur Linux, idéalement dans le domaine du calcul haute performance ou de l’inférence IA.
- Maîtrise des concepts d’optimisation (profilage, vectorisation, cache‑aware programming, gestion de la pression mémoire).
- Connaissance approfondie des frameworks d’inférence (TensorRT, ONNX Runtime, TVM, OpenVINO) et des formats de modèles (ONNX, TorchScript, TensorFlow Lite).
- Expérience avec les architectures matérielles variées (CPU multi‑core, GPU CUDA/ROCm, accélérateurs Edge) et les contraintes d’exécution sur appareils mobiles ou embarqués.
- Bonnes pratiques DevOps : CI/CD, tests automatisés, conteneurisation (Docker), monitoring.
- Capacité à travailler en anglais (écrit et oral) dans un contexte distribué et à communiquer clairement avec des équipes non‑techniques.
- Esprit d’innovation, curiosité pour les dernières avancées en IA et volonté de contribuer à des projets open‑source ou internes.
### Ce que nous offrons
- **Contrat CDI** à temps plein, 100 % remote – travaillez depuis n’importe où dans le monde.
- Rémunération compétitive + bonus basé sur les performances.
- Programme d’actions (stock‑options) et participation aux succès de l’entreprise.
- Budget dédié à la formation continue (conférences, certifications, cours en ligne).
- Horaires flexibles, politique de congés généreuse et soutien à l’équilibre vie pro / vie perso.
- Environnement de travail stimulant, culture d’innovation et équipe internationale passionnée.
Vous êtes prêt(e) à relever le défi de rendre l’IA accessible, rapide et fiable sur chaque appareil ? Postulez dès maintenant et participez à la prochaine génération de services financiers intelligents.