banque, finance, data mining, risque de crédit, arbres de décision, règle d'association, taux d'erreur, crédit client, critères d'attribution de crédit, crédit bancaire
Le domaine des banque et particulièrement, le secteur associé aux crédits clients connait une croissance remarquable. La demande de carte de crédit et des autres types de crédit augmentent significativement.
Le processus d'attribution de crédit est complexe. Pourtant, jusqu'à très récemment, l'approbation des crédits se faisaient intuitivement basée sur l'expérience et le jugement humains. Cette approche acquiert beaucoup de ressources humaines. Elle est coûteuse et demande beaucoup de temps. Des modèles de classification statistiques et de data mining ont été suggérées comme support à la décision de l'approbation de crédits.
En effet, le risque d'approbation d'un crédit pour un client qui ne paiera pas devrait être attentivement évalué (Cunha et Agard, 2006). L'attribution ou non d'un crédit dépend de plusieurs caractéristiques. Il est souvent avancé qu'une personne avec un salaire élevé et un bon historique de crédit est plus fiable. Il est aussi souvent avancé qu'une personne sans travail a moins de chance de réussir sa demande de crédit. Cette affirmation est-elle fondée?
[...] Aucun attribut ne devrait être retiré. D'un autre coté, les données sont bien formulées, aucun point aberrant n'a été trouvé Traitement des attributs Des graphes camemberts et les des histogrammes sont présentés dans cette sous section. Ces graphes permettent d'analyser la répartition des données selon les catégories et les histogrammes visualisant la distribution des clients (sûrs et à risque) par catégories d'attributs. Étant donnée le nombre élevé d'attributs, seuls les attributs importants sont présentés dans cette section. La proportion de clients surs représentent uniquement 30% des observations, alors que 70% des observations représentent des clients à risque P a g e État du compte chèque (SECA) Intuitivement, cette variable doit avoir une influence sur la qualité du client. [...]
[...] Le processus d'attribution de crédit est complexe. Pourtant, jusqu'à très récemment, l'approbation des crédits se faisaient intuitivement basée sur l'expérience et le jugement humains. Cette approche acquiert beaucoup de ressources humaines. Elle est couteuse et demande beaucoup de temps. Des modèles de classification statistiques et de data mining ont été suggérées comme support à la décision de l'approbation de crédits. En effet, le risque d'approbation d'un crédit pour un client qui ne paiera pas devrait être attentivement évalué (Cunha et Agard, 2006). [...]
[...] Présenter les données sur les figures afin d'avoir une idée préliminaire des distributions. Réaliser des prétraitements nécessaires à chaque algorithme. Pour les méthodes de segmentation, cette étape consistait à transformer les attributs catégoriques en attributs numériques. Pour les arbres de décisions, une opération au sens inverse a été réalisée. Plus d'explications seront présentées dans les sections qui suivent Prétraitement et analyse préliminaire Dans cette base de données, il n'existe pas de trous Pour tous les attributs, la proportion maximum de valeur indisponible ne dépasse pas 20%. [...]
[...] En effet, il s'agit de trouver les règles qui permettent de classer un client à partir de ses caractéristiques. L'étude se fait en utilisant une base de données de crédit allemande. Cette étude commence par la préparation de données qui a permis de vérifier la pertinence des données et leurs formulations. Ensuite, un prétraitement a été réalisé en vue d'analyser les données et d'avoir une idée sur leur distribution et sur leur répartition. Finalement, l'analyse avec des méthodes de Data mining est présentée. [...]
[...] La base de données utilisée concerne des données historiques de demandes de crédits dans une banque allemande. Elle contient 1000 observations et 22 attributs. Le dernier attribut permet de caractériser le client qui fait sa demande, c'est à dire est associé au client sur et 1 est associé au client à risques. Les attributs représentant les caractéristiques de chaque client. Les attributs sont représentés par le tableau X. Attributs catégoriques Attributs numériques État du compte chèque (SECA) Durée de payement du crédits ( en mois) Historique de crédit Motif du crédit Compte d'épargne Emploi actuel depuis Status maritale et sexe Montant du crédit Taux d'intérêt Age Nombre de crédits existants (NBC) Nombre de personnes garants Autres demandeurs et ou garants (Relia) Logement actuel depuis (Pres) Propriété (Prop) Maison (Hous) Emploi (Job) Téléphone (tel) Étranger Les autres 20 attributs servent, donc, à décrire les caractéristiques des clients soient statut de compte courant existant, durée d'existence du compte en mois, historique de crédit, motif du crédit, montant du crédit demandé, etc. [...]
Référence bibliographique
Source fiable, format APALecture en ligne
avec notre liseuse dédiée !Contenu vérifié
par notre comité de lecture