Internet a explosé ces dernières années avec la création de nombreux sites marchands online. Cependant, un grand nombre de ces sites, croyant à un succès assuré et immédiat, n'ont pas su mettre en place une bonne stratégie marketing ni utiliser des outils de contrôle présents sur le marché, pour assurer leur réussite.
Actuellement, les entreprises disposent d'un ensemble de données énorme. L'explosion des données est due au développement de techniques aidant à collecter des données comme par exemple les logs des serveurs Internet. De plus, de nouvelles techniques permettent de stocker de grandes quantités de données dans des bases de données ou sur Internet ce qui permet une amélioration de la performance de l'entreprise. L'utilisation de ce grand nombre de données à fort potentiel est extrêmement importante pour la prise de décision. Cependant, il est souvent difficile pour les utilisateurs d'en tirer des informations utiles. Les données existantes sont trop nombreuses pour être traitées manuellement étant donné l'hétérogénéité des sources de données et du trop grand nombre d'attributs entre lesquelles peuvent exister une cohérence.
Le Data Mining et son application sur Internet peuvent faciliter l'analyse de ces nombreuses données pour se différencier face à la concurrence.
Nous allons donc définir ce qu'est le Data Mining et nous concentrer vers son application spécifique sur Internet, le Web Mining. Nous appliquerons ce concept à un exemple précis d'actualité, le site Internet www.amazon.fr.
Le Data Mining ou le forage de données est l'ensemble des techniques d'analyse qui permettent d'extraire des connaissances d'une grande quantité de données .
Le Data Mining permet aux entreprises d'identifier des corrélations existantes entre les données. Ces corrélations sont souvent cachées et ne sont pas explicites ou prises en considération par les entreprises. Ainsi, le Data Mining peut-il détecter des régularités ou irrégularités dans des données, ce qui permet d'extraire des connaissances utiles et compréhensibles qui étaient alors inconnues ou implicites avant l'analyse.
Bien que le Data Mining se serve entre autres de méthodes statistiques, il reste une différence importante par rapport à au domaine statistique : Les statisticiens partent d'hypothèses préalables dont la validité est vérifiée par l'analyse des données alors que le data mining prend des données brutes comme point de départ et trouve des hypothèses inconnues dans ces données. La pertinence de ces hypothèses doit être vérifiée par les utilisateurs.
[...] Les données erronées peuvent mener à des résultats qui ne sont alors plus pertinents. Par ailleurs, les résultats du Web Mining sont parfois déjà connus ou inintéressants. Par exemple, des structures qui sont statistiquement intéressantes ne le sont pas pour la réalisation d'un objectif réel. Un autre inconvénient est le grand espace qui est nécessaire pour le stockage des données. De plus, les coûts du Web Mining sont élevés, surtout pour les solutions de personnalisation en ligne en temps réel.[25] En 2003, un logiciel préprogrammé du data mining était disponible dans une fourchette de prix allant de 3000 à 7000 euros tandis que le prix d'un logiciel beaucoup plus performant allait de 50000 jusqu'à 200.000 euros[26]. [...]
[...] Le site propose donc un site personnalisé pour chacun en fonction de ses précédents achats. Jeff Bezos et ses collaborateurs ont aussi testé différents agencements et looks pour leur site et mesuré l'effet sur les visiteurs. Par exemple, si un client achète un lecteur DVD, un message lors de sa prochaine visite apparaît : ‘Achetez pour votre nouveau lecteur DVD des DVDs à 25 %' Les réductions sont personnalisées en rapport avec des paramètres calculés par les algorithmes de l'entreprise. [...]
[...] Nous le bichonnons depuis le premier clic jusqu'à l'emballage du colis. Voilà comment il décrit le centrage sur le client : La première chose est de savoir qu'elles sont les attentes des clients en le leur demandant. Ensuite, il faut se demander comment leur apporter et leur apporter. C'est la signification traditionnelle du ‘customer- centrism'. La seconde est plus innovante. On doit se demander ce dont les clients auraient besoin, mais dont ils n'ont pas encore besoin, puis leur donner. La troisième signification, spécifique à internet, est l'idée de personnalisation. [...]
[...] Ensuite il faut sélectionner les sources de données nécessaires pour cette analyse. Les données provenant de différentes sources doivent être nettoyées avant qu'elles puissent être transformées dans le Data Warehouse. Il est indispensable d'effacer des éléments insignifiants dans les données pour assurer que les résultats de l'analyse reproduisent la réalité du comportement des visiteurs[13]. Dans les fichiers log, par exemple, toutes les références à des images ou graphiques peuvent être effacées. Par ailleurs, les accès aux pages doivent être affectés à un utilisateur ou une séance particulière pour être capables de déterminer le comportement de navigation des utilisateurs[14]. [...]
[...] And you are likely to be in a different state of mind if you came from a search engine through a keyword, or from a shopping comparison engine, or if you typed “www.amazon.com” in your browser. It also matters whether you keep clicking and clicking and clicking, or whether you enter something into a search box. And if you conduct a search, it depends on how many results you get back. Looking at the search terms that people use and refine can be a revealing view into the mind and the soul of a person. [...]
Référence bibliographique
Source fiable, format APALecture en ligne
avec notre liseuse dédiée !Contenu vérifié
par notre comité de lecture