• Les défis que posent les questionnaires

    • Souvent un grand nombre de variables (>> 30)
    • Des variables de type différents (catégorielles, continues, entiers, ordinales)
    • Un grand nombre et différents types de valeurs manquantes
    • La longueur élevée des libellés des questions et des réponses
    • Des questions dépendantes
    • Les questions ouvertes

    Les réponses des services existants

    • Des analyses souvent se limitant à des tris à pla et des tris croisés.
    • Pas de codification systématique des variables ordinales
    • Des clusterisations utilisant des modèles non optimaux pour les questionnaires (Kmeans)
    • L'utilisation des attributs socio-démographiques dans la modélisation, et non comme variables illustratives.

    La solution scanClues

    Une extraction d'insight rapide, qui fait collaborer efficacement analystes et IA, qui inclut:

    • Une attribution de noms (personas) pour chaque groupe de la segmentation
    • Un analyse avancée des données manquantes et les traitements appropriés
    • L'identification de réponses anormales
    • Une codification des variables ordinales
    • Des représentations graphiques innovantes
    • La protection des données (analyse LLM en local)
    • Des solutions sur mesure

    L'IA pour des analyses plus approfondie et plus rapide

    • Utilisation de LLM et de bibliothèques Python avancées
    • Livraison du code en mode évolutif (notebooks Jupyter et apps Streamlit).
    • Possibilité d'adapter le code.
    • Accompagnement et formation des analystes, maintenance évolutive des applications
  • Ils nous font confiance

    Allianz, labex ICCA, Université Lyon2, consultants indépendants.

  • Blog

    La préparation des données inclut plusieurs étapes : le traiement des données manquantes, des valeurs extrêmes, et des doublons. Pour mener à bien cette étape, il convient de sélectioner le traitement adéquat, en fonction des caractéristiques du jeu de données (nature du jeu de données,...