🔬⚖️🤖 CRFPiA - Corpus de Recherche et Feedback sur les Performances des IAs

Contact : Guillaume Simiand

Build Status Last Updated


Sommaire


Présentation du projet {#presentation-du-projet}

Le projet CRFPiA vise à évaluer les grands modèles d'IA généralistes sur les épreuves du CRFPA (examen d'accès à la profession d'avocat).

Concrètement, chaque année en septembre, au moment où les candidats humains passent les épreuves d'admissibilité, nous soumettons les sujets officiels aux IAs à l'état de l'art.

Les réponses aux épreuves de la session 2024 sont en cours de génération, les réponses à celle de la session 2023 viendront ensuite avec les modèles à l'état de l'art en septembre 2023.

Notre protocole est simple :

Cette approche présente plusieurs avantages :

Limites

CRFPiA ne vise pas à développer des IAs spécialisées pour l'examen du CRFPA, mais plutôt à utiliser cet examen comme un « reality check » permettant d'évaluer où en sont les modèles généralistes sur des tâches juridiques complexes.

L'objectif est de permettre aux professionnels du droit et aux acteurs de l'IA de disposer d'un aperçu concret et actualisé des capacités réelles de ces technologies, tant du côté de leurs forces que de leurs faiblesses.


🚨 Important 🚨


Résultats détaillés

⬇️Les copies et les rapports détaillés sont disponibles via les icônes après chaque résultat.⬇️

2024

Droit Civil

Modèle Éditeur Date de sortie Prompt simple Prompt structuré Prompt structuré avec méthodologie
Meta-Llama/Llama-3.1-70B-Instruct Meta 2024-07-23 - - 49.17%
📝 📊 📄
O1-Preview-2024-09-12 Openai 2024-09-12 - 75.24%
📝 📊 📄
-

Droit Fiscal

Modèle Éditeur Date de sortie Prompt simple Prompt structuré Prompt structuré avec méthodologie
O1-Preview-2024-09-12 Openai 2024-09-12 - 100.00%
📝 📊 📄
-

Graphiques de performance


Méthodologie {#methodologie}

Le projet se distingue par sa simplicité volontaire :

Stratégies de prompt

Trois approches différentes sont utilisées pour évaluer les modèles :


Objectifs et bénéfices

Pour les professionnels du droit

Pour les acteurs de l'IA

Pour la formation juridique


Valeur scientifique

Le projet apporte plusieurs contributions significatives :


Transparence et ouverture

Le projet s'engage dans une démarche transparente :