Histoire du Projet : Afritech Talent Hub
💡 Inspiration :
En Afrique, les entreprises peinent à recruter les bons talents, et des milliers de professionnels qualifiés restent invisibles. Ce problème n'est que le symptôme d'un défi plus profond : la donnée essentielle est enfermée dans des documents non structurés comme les CVs. Cette "donnée enfermée" est le principal frein à la transformation digitale locale. Notre inspiration est de créer la clé pour libérer ce potentiel, en fournissant un outil qui transforme le chaos documentaire en données claires et exploitables, permettant enfin aux entreprises de devenir véritablement "data-driven" ce qui permettra ensuite d'accroître leur croissance avec des projets automatisations et l'intégration véritable de solutions IA.
Et si chaque document de votre entreprise devenait une source de données intelligente ?
Imaginez la scène, familière dans tant de bureaux en Afrique : des piles de CVs, de rapports, de factures. À l'intérieur, des informations cruciales – des compétences rares, des chiffres clés, des opportunités stratégiques. Mais aujourd'hui, cette richesse est silencieuse, piégée dans un format non structuré. La seule façon d'y accéder ? Des heures de lecture, de saisie manuelle ; un travail fastidieux, coûteux et source d'erreurs.
Notre projet est la clé qui libère ce potentiel. D'un simple clic, notre moteur d'extraction, propulsé par les API Vision et Gemini, lit et comprend ces documents en quelques secondes. Il ne se contente pas de transcrire des mots ; il identifie, classifie et structure l'information avec une précision chirurgicale. Le chaos devient un tableau de bord. La pile de papier devient une base de données propre et exploitable.
🧠 Ce que fait le projet
Notre projet, Afritech Talent Hub, a un module qui est un moteur d'extraction intelligent qui transforme les documents non structurés en décisions stratégiques. Il a été conçu pour être la première brique de la transformation digitale des entreprises, en libérant le potentiel des données piégées dans leurs archives papier et numériques.
Le fonctionnement est un pipeline de bout en bout, simple et puissant :
Ingestion Flexible : L'application accepte n'importe quel document (image ou PDF), comme un CV.
Lecture Haute-Fidélité : L'API Google Cloud Vision est utilisée pour réaliser un OCR (reconnaissance de caractères) d'une précision inégalée, transformant l'image en texte brut.
Compréhension Sémantique : Ce texte est ensuite analysé par Gemini. Grâce à une ingénierie de prompts avancée, nous lui demandons d'agir en expert pour non seulement lire, mais aussi comprendre le contexte, identifier les informations clés et les classifier.
Livraison de Données Pures : Le résultat final est un fichier JSON propre, structuré et standardisé. Cette donnée est immédiatement exploitable, prête à être injectée dans n'importe quel système : une base de données de talents, un ERP, un outil d'analyse, ou tout autre application "data-driven".
En se concentrant sur ce moteur d'extraction, nous créons un outil fondamental et polyvalent. Avec les données de CV que nous traitons aujourd'hui, il devient possible de construire des applications puissantes, comme un agent conversationnel pour le recrutement. En l'adaptant demain pour les factures, il pourra automatiser la comptabilité. Notre projet est la fondation qui rend ces innovations possibles.
🏗️ Comment Nous L'avons Conçu
Afritech Talent Hub est une application web modulaire conçue pour la Productivité au Travail:
- Le Moteur d'Extraction de Données (Module1) : C'est le cœur de notre innovation, développé en Python avec le framework Flask. Il orchestre un pipeline IA puissant :
-> Google Cloud Vision est utilisé pour sa reconnaissance de caractères (OCR) de haute précision sur tout type de document (image ou PDF). -> L'API Gemini (via Google AI Studio) prend ensuite le relais pour l'analyse sémantique. Grâce à une ingénierie de prompts avancée, nous transformons le texte brut en données JSON structurées, propres et prêtes à l'emploi.
2- L'Agent Conversationnel de Recrutement (Module2) : C'est l'interface qui démontre la valeur de nos données.
-> Un agent IA conversationnel (Jotform), intégré dans une interface web légère en HTML/CSS, dialogue avec les entreprises pour cerner leurs besoins de recrutement de manière intuitive. -> En arrière-plan, cet agent interroge la base de données alimentée par notre moteur d'extraction pour réaliser un matching intelligent et proposer les profils les plus pertinents, sans biais et sans délai.
Cette architecture à deux modules nous permet de créer une solution à la fois extrêmement puissante sous le capot et très simple à utiliser en surface.
🚧 Les Défis Rencontrés
La construction du projet a présenté des défis stimulants :
Pour le Moteur d'Extraction (Module1) :
-> Maîtriser l'environnement de développement : Notre plus grand défi a été de résoudre les conflits profonds entre les environnements Python venv et Conda, qui causaient des erreurs de dépendances et de versions nous forçant à une réinitialisation complète de l'environnement. -> Naviguer les complexités du Cloud : Nous avons surmonté des erreurs de configuration GCP, notamment une tenace erreur 404 Publisher Model not found qui nous a appris que l'activation d'une API ne garantit pas toujours l'accès immédiat à toutes ses ressources. -> Le Pivot Technique Agile : Face à ce blocage sur Vertex AI, nous avons démontré notre agilité en migrant avec succès notre logique vers l'API de Google AI Studio pour assurer l'accès à Gemini, une décision qui a sauvé le projet.
Pour l'Agent Conversationnel (Module2) :
-> Intégration et Cohérence : Assurer une intégration fluide et esthétique de l'agent conversationnel (Jotform) dans notre design de page HTML/CSS, tout en maintenant une performance réactive. -> Précision de l'Adéquation IA : Configurer l'agent pour qu'il comprenne avec exactitude les besoins complexes d'un poste technique et qu'il fasse des correspondances pertinentes a été un défi constant d'ingénierie des prompts. -> Simplification pour le Hackathon : Rendre la logique complexe (comme une base de profils en direct) démontrable dans le temps imparti, tout en communiquant efficacement la vision d'un système complet.
⭐ Nos Accomplissements Notables
Nous sommes fiers d'avoir construit un prototype fonctionnel qui démontre concrètement notre vision. Nous avons réussi à :
Pour le Moteur d'Extraction (Module1) :
-> Un Pipeline de Données 100% Fonctionnel : Nous avons construit un système de bout en bout qui transforme un document brut (image ou PDF) en données JSON structurées et prêtes à l'emploi, en orchestrant avec succès les API Cloud Vision et Gemini. -> Une Expertise en Prompt Engineering : Nous avons développé un prompt avancé qui transforme Gemini en un expert métier, capable de réaliser des extractions complexes et de s'adapter aux informations manquantes, garantissant une sortie de données de haute qualité. -> Une Résilience Technique Prouvée : Notre plus grande fierté est d'avoir diagnostiqué et résolu des problèmes d'environnement et de configuration cloud profonds, démontrant notre persévérance et notre capacité à livrer une solution fonctionnelle malgré les obstacles.
Pour l'Agent Conversationnel (Module2) :
-> Une Interface Conversationnelle Intuitive : Nous avons mis en place une interface vocale qui simplifie radicalement l'expression des besoins pour les recruteurs. -> Un Matching Intelligent au-delà des Mots-Clés : Le système est capable de comprendre les nuances d'un poste pour proposer des profils pertinents basés sur une réelle adéquation des compétences. -> Une Démonstration à Fort Potentiel : Nous avons réussi à prouver qu'il est possible de réduire drastiquement le temps et les coûts de recrutement tout en augmentant la qualité des embauches.
🧠 Ce Que Nous Avons Appris
Cette expérience nous a permis d'apprendre que :
Pour le Moteur d'Extraction (Module1) :
-> L'environnement est la fondation de tout : Nous avons appris, parfois difficilement, qu'un environnement de développement propre, isolé et correctement versionné n'est pas une option, mais le prérequis indispensable à la réussite d'un projet. -> Le Cloud exige une expertise au-delà du code : La réussite d'une application cloud dépend autant de la maîtrise des permissions IAM, du provisioning des services et des configurations régionales que de la qualité du code lui-même. -> Le Prompt Engineering est une discipline centrale : Nous avons constaté que la qualité de l'extraction de Gemini était directement proportionnelle à la précision et à l'intelligence de nos prompts. Piloter l'IA est une compétence de développement à part entière.
Pour l'Agent Conversationnel (Module 2) :
-> L'IA conversationnelle simplifie le complexe : Nous avons appris qu'une interface de dialogue peut rendre des processus métier, comme l'expression d'un besoin de recrutement, beaucoup plus accessibles et efficaces. ** -> Le NLP est la clé de la pertinence :** Le traitement du langage naturel est essentiel pour une compréhension profonde des besoins humains, bien au-delà de la simple reconnaissance de mots-clés, menant à des résultats plus précis. *-> L'itération rapide est cruciale : * La capacité à collaborer et à itérer rapidement sur le design de l'interaction a été fondamentale pour surmonter les défis en un temps limité.
🚀 Prochaines Étapes pour AFRITECH TALENT HUB
Notre prototype fonctionnel n'est que le début. Notre vision est de faire de notre moteur d'extraction une plateforme fondamentale, une véritable "prise de courant" de données pour la digitalisation en Afrique.
Industrialiser le Moteur d'Extraction (Module 1) La priorité est de rendre notre moteur encore plus robuste et facile à intégrer. Cela passe par la création d'une API REST bien documentée, la migration du stockage vers une base de données Cloud scalable (comme Firestore), et surtout, l'implémentation de la "boucle d'apprentissage" pour que l'IA s'améliore à chaque correction utilisateur.
Déployer le Moteur sur de Nouveaux Verticaux Le véritable potentiel de notre solution réside dans sa polyvalence. Une fois le moteur industrialisé, il peut être adapté en quelques jours pour révolutionner des secteurs critiques en Afrique :
-> Santé : Extraire instantanément les résultats d'analyses de formulaires papier pour créer des dossiers patients numériques. -> Agriculture :: Digitaliser les bordereaux de pesée manuscrits pour garantir la transparence de la chaîne d'approvisionnement du cacao ou du café. -> Administration Publique : Automatiser le traitement des demandes de permis de construire ou des actes d'état civil pour réduire la bureaucratie. -> Secteur Légal & Assurance : Analyser des contrats ou des déclarations de sinistre en quelques secondes pour en extraire les clauses et informations clés.
Construire la Première Application Phare (Module 2) Enfin, fort de ce moteur polyvalent, nous développerons sa première grande application : Afritech Talent Hub. Cet agent conversationnel intelligent ne sera pas un projet séparé, mais la démonstration ultime de la puissance de notre moteur, en utilisant les données de CV qu'il extrait pour connecter les talents aux opportunités de manière fluide et pertinente.
Log in or sign up for Devpost to join the conversation.