Bio
type
Page
status
Published
date
Apr 4, 2026
slug
about
summary
tags
category
icon
password
Qian SUN
Paris, France
Expérience Professionnelle
Data GovernanceData ManagementData EngineeringMachine Learning EngineeringData Architecture
Data Governance & Data management
- Implémentation d’IHM pour recueillir des spécifications de qualité des données
- Implémentation des pipelines des contrôles de qualité des données
Implémentation un workflow pour scraping open data d’assureur
- Collection des rapports narratives SFCR (Rapports sur la Solvabilité et la Situation Financière) à l’échelle européenne
- Collection des CGA (Conditions Générales Assurance) sur des assureurs français
Pilotage et réalisation technique de l’industrialisation et de la mise en production des cas d’usage data science
- Architecture, Design et implémentation du workflow ETL et ML (Python)
- Collaboration avec la DSI pour la définition et déploiement des stacks d’automatisation (AWS CloudFormation) et jobs scheduling
- Support des équipes décisionnelles pour la mise en place des pipelines d’ingestion des sources internes et externes
- Industrialisation et Refonte des codes projets Data Science/ Data Analysis pour mise à disposition en montée de charge
- Design et Implémentation d’une interface IHM permettant de remonter les anomalies
Finops
- Optimisation des use cases en production (Réduction de complexité, optimisation de l’usage de RAM, Parallélisation des jobs)
- Optimisation et Support pour l’Infrastructure AWS
Renforcement et enrichissement de la plateforme Big Data AWS
- Automatisation des process de monitoring pour les workflows ETL et les Use Cases
- Design et Implémentation du Data Lakehouse (Deltalake, Spark, K8S, Docker, ECR, Jenkins, Athena Glue, AirFlow)
- Projet Fraude Décaissement Vie: Détection des anomalies & fraudes sur les contrats assurances VIE
Projet ASK ControlIndustrialisation des projets des détections des anomalies dans la plateforme Big Data Allianz (On promise)
- Création de workflow ETL et ML
- Implémentation et Suivi des workflow ETL avec Pyspark et Luigi
- Intégration du CI/CD avec Gitlab CI et Ansible dans les pipelines existantes et nouvelles
- Mise en place de processus de supervision pour les workflows Data
Projet Détection des anomalies & fraudes sur les contrats assurances non-vie
Détection des fraudes pour les contrats Auto chez Allianz
Benchmark des Deep Learning Frameworks dans la machine IBM PowerAI multi-cores multi-GPUs Nvidia
Traitement massif de données (200To) GNSS/GPS GEONET dans la Plateforme HPC CIMENT avec 3600 coresÉtude des séismes avec séries temporelles GPS
Levés bathymétriques et manipulation de la donnée sur toute la chaine de valeur
Expérience Professionnelle Supplémentaire
Diplômes et Etudes

Publication
Loading...















