img_header_blog

    Demain la Data : Le temps réel

    [fa icon="calendar'] 09/07/20 15:31 / par Laurent Letourmy dans Actu Ysance, Data, Data Services, omnicanal, temps réel, cloud, Data-Driven

    [fa icon="comment"] 0 Commentaires

    De nombreuses entreprises migrent actuellement la donnée dans le Cloud pour de très bonnes raisons : modernisation de leur stack technologique, utilisation de la capacité de stockage et de calcul du Cloud, intégration simplifiée avec leurs logiciels SaaS ou leurs partenaires, capacité à scaler mais aussi pour attirer les bonnes compétences,  se créer ainsi un futur data-driven.

    Lire la suite [fa icon="long-arrow-right"]

    Algorithme N°3 - Comprendre l’isolation forest en 5 min

    [fa icon="calendar'] 03/07/20 17:52 / par Équipe Data Science dans Actu Ysance, Data Science, Data Services, Data Scientist

    [fa icon="comment"] 1 Commentaire

    Un algorithme de détection d’anomalies a pour objectif principal de repérer des données atypiques et non conformes aux autres données.

    Lire la suite [fa icon="long-arrow-right"]

    Algorithme N°2 - Comprendre comment fonctionne un random forest en 5 min

    [fa icon="calendar'] 19/06/20 14:33 / par Équipe Data Science dans Actu Ysance, Data Science, Data Services, Data Scientist

    [fa icon="comment"] 0 Commentaires

    Le random forest est un algorithme incontournable en machine learning. Random forest signifie « forêt aléatoire ». Proposé par Leo Breiman en 2001, c'est un algorithme qui se base sur l’assemblage d’arbres de décision. Il est assez intuitif à comprendre, rapide à entraîner et il produit des résultats généralisables. Seul bémol, le random forest est une boîte noire qui donne des résultats peu lisibles, c’est-à-dire peu explicatifs.

    Lire la suite [fa icon="long-arrow-right"]

    Algorithme N°1 - Comprendre ce qu’est un arbre de décision en 5 min

    [fa icon="calendar'] 12/06/20 10:59 / par Aurélien Bénard dans Actu Ysance, Data Science, Data Services, Data Scientist

    [fa icon="comment"] 0 Commentaires

    On vous propose une série d’articles pour revenir sur quelques algorithmes les plus souvent utilisés chez nos clients. On commence par l’un des algorithmes les plus simples : l’arbre de décision.

    Lire la suite [fa icon="long-arrow-right"]

    Mieux comprendre les essais cliniques et les techniques d’analyse de survie à l’heure du COVID-19

    [fa icon="calendar'] 05/06/20 16:21 / par Aurélien Bénard dans Actu Ysance, Data Science, Data Services, Data Scientist, Data Engineer

    [fa icon="comment"] 0 Commentaires

    Face à la pandémie du COVID-19, c’est une véritable course aux essais thérapeutiques qui s’est engagée depuis quelques mois avec actuellement un grand nombre de laboratoires pharmaceutiques mobilisés sur le sujet. A ce jour, c’est plus d’une cinquantaine de demandes d’autorisations d’essais cliniques sur le Covid-19 qui ont été soumises rien qu’en France ! Mais qu’est-ce exactement qu’un essai clinique ?

    Lire la suite [fa icon="long-arrow-right"]

    Conseil N°10 pour être un super Data Engineer

    [fa icon="calendar'] 29/05/20 11:11 / par Laurent Letourmy dans Actu Ysance, Data Services, Data Engineer

    [fa icon="comment"] 0 Commentaires

    Nous arrivons à la fin de cette série de “10 conseils pour être un super data engineer”, nous avons abordés ensemble différentes techniques afin de rendre vos traitements plus performants, efficaces et  scalables. Nous allons conclure avec “Everything as code” qui vous permettra de versionner vos traitements, les partager, les réutiliser et les affiner par le biais de la collaboration.

    Lire la suite [fa icon="long-arrow-right"]

    Le moteur de requêtes Apache Drill

    [fa icon="calendar'] 20/05/20 14:46 / par Catherine Verdier dans Actu Ysance, Data Services, Apache Drill, expert

    [fa icon="comment"] 0 Commentaires

    Apache Drill, qu’est-ce que c’est ?

    Apache Drill est un moteur de requêtes distribué avec lequel il est possible d’effectuer des requêtes SQL sur de multiples types de datasources (bases de données SQL ou NoSQL, fichiers Apache Parquet, fichiers CSV, JSON, … etc …)

    Lire la suite [fa icon="long-arrow-right"]

    Conseil N°9 pour être un super Data Engineer

    [fa icon="calendar'] 15/05/20 10:36 / par Laurent Letourmy dans Actu Ysance, Data Services, Data Engineer

    [fa icon="comment"] 0 Commentaires

    Les Traces vous aident à mieux comprendre l'état d’avancement de vos traitements. Continuons cet échange avec les traitements et regardons leur fonctionnement en profondeur afin de les rendre plus efficaces.

    Lire la suite [fa icon="long-arrow-right"]

    Conseil N°8 pour être un super Data Engineer

    [fa icon="calendar'] 30/04/20 13:49 / par Laurent Letourmy dans Actu Ysance, Data Services, Data Engineer

    [fa icon="comment"] 0 Commentaires

    Dans les articles précédents nous avons abordé différentes bonnes pratiques autour de la taille et du rôle des jobs, et de l’automatisation de l'exécution de vos jobs à l’aide d’un orchestrateur.  Et si vous laissiez vos jobs vous informer, à l’aide de traces, dans quelle étape du traitement sont-ils ?

    Lire la suite [fa icon="long-arrow-right"]

    Conseil N°7 pour être un super Data Engineer

    [fa icon="calendar'] 17/04/20 10:19 / par Laurent Letourmy dans Actu Ysance, Data Services, Data Engineer

    [fa icon="comment"] 0 Commentaires

    Les bonnes pratiques peuvent parfois nous échapper. Pensez à séparer la logique d’orchestration de la logique de traitement et gardez vos données en parfaite harmonie. Nous allons continuer avec un axe majeur pour une architecture data réussie et durable : la scalabilité.

    Lire la suite [fa icon="long-arrow-right"]

    S'abonner au blog