img_header_blog

    Regard approfondi sur autoML Tables

    [fa icon="calendar'] 23/10/20 15:44 / par Idriss BRAHIMI dans Actu Ysance, Data Science, Data Services, Data Scientist, Auto ML

    [fa icon="comment"] 0 Commentaires

    Dans notre dernier article, nous avons vu ce qu’est l’autoML, ses avantages/inconvénients et son utilisation dans le cadre d'un projet de machine learning. Nous avons dressé un comparatif des différentes solutions autoML présentes sur le marché pour finir sur un cas pratique développé avec MLBox.

    Lire la suite [fa icon="long-arrow-right"]

    Learning by doing : l’apprentissage par renforcement

    [fa icon="calendar'] 13/10/20 16:38 / par Temmame Said dans Actu Ysance, Data Science, Data Services, Data Scientist, Auto ML

    [fa icon="comment"] 0 Commentaires

    Nous prenons au quotidien de nombreuses décisions en fonction de nos expériences passées, de l’avis des autres ou encore du rapport bénéfice/risque que comporte notre choix sur le court-terme comme sur le long-terme.

    Lire la suite [fa icon="long-arrow-right"]

    Un premier retour d’expérience sur AutoML

    [fa icon="calendar'] 28/09/20 10:34 / par Idriss BRAHIMI dans Actu Ysance, Data Science, Data Services, Data Scientist, Auto ML

    [fa icon="comment"] 0 Commentaires

    L’AutoML (ou en français, « le machine learning automatisé ») permet l’assistance et l’automatisation du processus de création d’un modèle de Machine Learning.

    A l’instar des data scientists, de telles solutions sont capables d’élaborer des modèles mathématiques complexes et de développer ces modèles jusqu’à l’implémentation en production.

    Lire la suite [fa icon="long-arrow-right"]

    Algorithme N°5 - Comprendre la méthode des "k-plus proches voisins" en 5 min

    [fa icon="calendar'] 21/09/20 10:57 / par Équipe Data Science dans Actu Ysance, Data Science, Data Services, Data Scientist

    [fa icon="comment"] 0 Commentaires

    L’algorithme des k plus proches voisins, en anglais k-NN pour « k Nearest Neighbors » est un algorithme simple à comprendre.

    D’abord, vous devez savoir qu’il s’agit d’un algorithme d’apprentissage supervisé qui permet à la fois de résoudre un problème de classification et de régression. 

    Lire la suite [fa icon="long-arrow-right"]

    RCU - #1 - Les pièges à éviter

    [fa icon="calendar'] 10/09/20 11:34 / par Guillaume Masseau dans Actu Ysance, Data, Data Services, rcu

    [fa icon="comment"] 0 Commentaires

    A l’heure du customer-centric, le Référentiel Client Unique (RCU) est au coeur des projets d’entreprise.. Véritable pierre angulaire de la vision 360°, le RCU peut se résumer à une application qui contient l’unicité de l’identité de vos clients. Cependant, par expérience nous constatons que le plus souvent les données clients sont disséminées au sein du SI de l’entreprise et absolument pas centralisées entraînant :

    • de très nombreux doublons, 
    • un manque de complétude,
    • un risque majeur d’avoir des données disparates.
    Lire la suite [fa icon="long-arrow-right"]

    Common-Crawl Fouille de données Common-crawl avec ElasticSearch et Kibana

    [fa icon="calendar'] 04/09/20 16:37 / par Catherine Verdier dans Actu Ysance, Data, Data Services, Common Crawl

    [fa icon="comment"] 0 Commentaires

    Dans notre dernier article, nous avons vu comment extraire les données brutes des pages du Common-crawl et à partir des données de ces pages, nous avons produit quelques statistiques portant sur les langues utilisées dans les pages, les domaines internet des pages ainsi que sur la localisation (niveau pays) des serveurs d’où elles sont publiées.

     

    Aujourd’hui, nous proposons de reprendre les données téléchargées et de constituer un corpus de textes. Nous indexerons ensuite ces données en “text intégral” (full-text en anglais) à l’aide du moteur ElasticSearch. Après cela, nous utiliserons l’application Kibana pour explorer en langage naturel les pages web enregistrées dans ElasticSearch.

    Lire la suite [fa icon="long-arrow-right"]

    Demain la data​: Cloud-Native Softwares

    [fa icon="calendar'] 07/08/20 10:26 / par Laurent Letourmy dans Actu Ysance, Data, Data Services

    [fa icon="comment"] 0 Commentaires

    Affirmons-le simplement, le cloud aura tout changé dans notre industrie.

    Lire la suite [fa icon="long-arrow-right"]

    Common-Crawl Première extraction et construction de statistiques

    [fa icon="calendar'] 31/07/20 15:37 / par Catherine Verdier dans Actu Ysance, Data, Data Services, Common Crawl

    [fa icon="comment"] 1 Commentaire

    Suite à notre premier article abordant le Programme “AWS Open Data”, nous allons nous intéresser au projet Common-Crawl, inclus dans ce programme, et présenter un exemple de code écrit en Python pour voir “comment exploiter le contenu des pages WEB mises à disposition par ce projet”.

    Lire la suite [fa icon="long-arrow-right"]

    Algorithme N°4 - La régression linéaire pour comprendre les grands principes du Machine Learning

    [fa icon="calendar'] 23/07/20 16:44 / par Équipe Data Science dans Actu Ysance, Data Science, Data Services, Data Scientist

    [fa icon="comment"] 0 Commentaires

    Beaucoup de gens pensent que la régression linéaire est simple : il est simplement question de trouver une droite au milieu d'un nuage de points. Ce n’est pas vrai ! Nous pouvons même dire que la régression linéaire est un modèle faussement simple : vous allez voir pourquoi dans cet article.

    Lire la suite [fa icon="long-arrow-right"]

    AWS Open Data Program

    [fa icon="calendar'] 16/07/20 18:04 / par Catherine Verdier dans Actu Ysance, Data, Data Services, aws

    [fa icon="comment"] 0 Commentaires

    Le développement de l’Open Data

    Depuis environ les années 2000, un nombre grandissant d'États et d’Administrations mettent à disposition un partie des données qu’elles produisent.

    En effet, au même titre que leurs acteurs militants du logiciel libre considèrent que les progrès technologiques doivent faire partie du bien commun, ce même paradigme est apparu pour la data que certains ont qualifiée de nouvel “Or Noir du XXIème siècle”.

    Lire la suite [fa icon="long-arrow-right"]

    S'abonner au blog