Retour à l’accueil
Omar ARIF
Data Scientist / Machine Learning Engineer
À propos de moi
Je suis ingénieur en informatique, spécialisé en Intelligence Artificielle et Data Science, avec une expertise particulière en Deep Learning, Natural Language Processing (NLP) et Computer Vision.
Mon parcours comprend des expériences dans des entreprises renommées ainsi que des projets freelance innovants.
Passionné par les techniques d’IA et les avancées dans le domaine, j’explore l’état de l’art tout en développant des applications concrètes. Je m’engage à approfondir mes connaissances à travers la lecture d’articles scientifiques et la mise en œuvre de solutions réelles.
De plus, j’ai acquis une solide expérience en ingénierie des données, ainsi qu’en production et monitoring de systèmes de Machine Learning, ce qui me permet de résoudre des problèmes complexes de manière efficace.
- Langues : Français (courant), Anglais (courant, IELTS 8.0), Arabe (courant)
- Soft skills : Autonomie, Curiosité, Esprit d’équipe, Esprit analytique, Créativité, Travail sous pression
Expériences professionnelles
Cdiscount - Data Scientist (Stage)
Février 2022 - Juillet 2022
- Projet : Automatisation du matching de produits entre le catalogue Cdiscount et les sites concurrents, en utilisant des données textuelles (NLP) et visuelles (Computer Vision).
- Étapes clés :
- État de l’art des techniques de matching produits.
- Collecte, analyse et traitement de données issues de descriptions textuelles et d’images de produits.
- Développement et entraînement de modèles de Deep Learning.
- Optimisation et mise en production du modèle final.
- Utilisation de Snowflake pour le traitement des données volumineuses.
- Stack technique : Python, Pytorch, SQL, Snowflake, Pandas, Transformers, Docker, Kubernetes, Power BI.
- Résultats : Amélioration du taux de matching produits avec une réduction significative des efforts manuels.
Agence du Développement du Digital - Développeur Python (Stage)
Août 2022 - Octobre 2022
- Projet : Création d’une API de scraping pour collecter et analyser des publications scientifiques à partir de plusieurs sites.
- Responsabilités :
- Conception de l’architecture de l’API en FastAPI.
- Collecte, nettoyage des données et création de tableaux de bord pour visualiser les tendances.
- Déploiement et optimisation des performances de l’API.
- Stack technique : Python, FastAPI, BeautifulSoup, HTML, Power BI, Docker, Git.
- Résultats : API robuste et scalable, capable de traiter de grandes quantités de données avec un monitoring efficace.
Freelance - Développeur IA
2023 - présent
Exemple de projets:
- Développement d’un agent IA vocal et textuel pour sites d’e-commerce : Création d’un agent intelligent utilisant l’Agentic RAG pour interagir avec les clients, recommander des produits personnalisés et gérer leur panier d’achat
- API de détection de contenu toxique : Utilisation de modèles de Machine Learning pour identifier automatiquement les messages ou images toxiques à censurer.
- Application de super-résolution : Amélioration de la qualité d’une zone floue de vidéos de surveillance en utilisant des techniques de Computer Vision.
- Extraction automatisée de données de factures images : Développement d’un système basé sur des réseaux de neurones légers et fine-tunés pour extraire les champs clés depuis des factures scannées, avec génération d’un fichier XML structuré selon le format requis par l’entreprise, éliminant la saisie manuelle.
- Création d’un dashboard en temps réel pour les données de marchés financiers : Développement d’une plateforme interactive permettant de suivre en temps réel les prix des actifs financiers, les indicateurs techniques (moyennes mobiles, Bollinger Bands, RSI, etc.) et d’effectuer une analyse de sentiment à partir des discussions sur les réseaux sociaux.
- API de recommandation de films : Développement d’un système suggérant des films en fonction de la similarité sémantique (NLP) (en utilisant des LLMs) entre les scénarios des films présents dans une base de données et le prompt de l’utilisateur.
Septembre 2024 - présent
Responsibilités:
- Optimiser les LLM pour améliorer les capacités de génération de code et d’appel de fonctions en utilisant Reinforcement Learning à travers le feedback humain (RLHF).
- Fournir des retours, réécrire et classer le code généré par l’IA, principalement en Python et C++, pour améliorer l’exactitude et l’applicabilité dans le monde réel.
- Concevoir et tester des prompts pour maximiser l’efficacité du modèle dans la génération de sorties de code précises et fonctionnelles.
- Soutenir l’avancement des performances de l’IA générative à travers des projets divers et flexibles dans un environnement de travail à distance.
Projets GitHub
Voici quelques projets disponibles sur mon GitHub :
- Semantic Movie Recommender : Système de recommandation de films basé sur la similarité sémantique des scénarios, utilisant FastAPI et Sentence Transformers. Tester
- AI Cover Letter Generator : Outil générant des lettres de motivation personnalisées à partir de CV et d’offres d’emploi, en prenant en charge les formats DOCX et PDF. Tester
- Day-Night Image Conversion GAN : Projet de conversion d’images de jour en images de nuit (et inversement) en utilisant des réseaux de neurones conditionnels, avec des données issues du simulateur Carla.
- Genetic AI Snake Player : Un joueur Snake intelligent (Deep Learning), entraîné via un algorithme génétique pour optimiser le réseau de neurones.
- RL-DQN Prioritized Experience Replay : Reinforcement Learning Implémentation d’un Deep Q-Network avec le Prioritized Experience Replay sur l’environement highway-env d’OpenAI.
Compétences techniques
- Langages : Python, Java, C, C++, SQL, Bash, HTML/CSS, Assembleur x86
- Frameworks et Bibliothèques : Pytorch, Tensorflow/Keras, Scikit-learn, Pandas, OpenCV, Transformers
- Outils : Docker, Kubernetes, Git, Power BI, Snowflake, FastAPI, BeautifulSoup
- Méthodes : Deep Learning, NLP, Computer Vision, Machine Learning, Data Engineering, Systèmes de recommandation
AIVANCITY (Paris, France) - MSc in Data Engineering and Cloud Computing (M2)
2025–2026
2019 - 2023
Spécialité : Intelligence Artificielle
CPGE Moulay Youssef (Rabat, Maroc) - Classes préparatoires aux grandes écoles
2016 - 2019
Filière : Mathématiques-Physique (MP)
Lycée Assabil (Rabat, Maroc) - Baccalauréat Sciences Mathématiques
2015 - 2016
Certificats
- Introduction to Machine Learning in Production - Coursera
Certification