{"id":3176,"date":"2022-03-01T16:27:10","date_gmt":"2022-03-01T16:27:10","guid":{"rendered":"https:\/\/akyalab.com\/?p=3176"},"modified":"2022-03-01T16:28:08","modified_gmt":"2022-03-01T16:28:08","slug":"the-data-science-process","status":"publish","type":"post","link":"https:\/\/akyalab.com\/fr\/the-data-science-process\/","title":{"rendered":"Le processus de data science"},"content":{"rendered":"<h2 class=\"wp-block-heading\">Introduction:<\/h2>\n\n\n\n<p>Le processus de data science se compose g\u00e9n\u00e9ralement de six \u00e9tapes\u00a0: d\u00e9finir le probl\u00e8me, collecter des donn\u00e9es, traiter les donn\u00e9es, explorer les donn\u00e9es, mod\u00e9liser les donn\u00e9es, communiquer les r\u00e9sultats. Dans cet article nous allons les affronter un par un pour enfin se familiariser avec le processus de la science des donn\u00e9es.<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img decoding=\"async\" loading=\"lazy\" width=\"1024\" height=\"545\" src=\"http:\/\/akyalab.com\/wp-content\/uploads\/2022\/03\/data_process-1024x545.jpeg\" alt=\"\" class=\"wp-image-3185\" srcset=\"https:\/\/akyalab.com\/wp-content\/uploads\/2022\/03\/data_process-1024x545.jpeg 1024w, https:\/\/akyalab.com\/wp-content\/uploads\/2022\/03\/data_process-300x160.jpeg 300w, https:\/\/akyalab.com\/wp-content\/uploads\/2022\/03\/data_process-768x409.jpeg 768w, https:\/\/akyalab.com\/wp-content\/uploads\/2022\/03\/data_process-18x10.jpeg 18w, https:\/\/akyalab.com\/wp-content\/uploads\/2022\/03\/data_process.jpeg 1400w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><figcaption><strong>Cycle de vie de la science des donn\u00e9es.\u00a0<\/strong>(Drawn by Chanin Nantasenamat in collaboration with Ken Jee)<\/figcaption><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">1. Cadrer le probl\u00e8me<\/h3>\n\n\n\n<p>Lorsqu'il s'agit de r\u00e9aliser un projet de science des donn\u00e9es, la premi\u00e8re chose \u00e0 faire est de cadrer le probl\u00e8me\u00a0; cela signifie que vous devez pr\u00e9parer une charte de projet. Cette charte contient des informations telles que ce que vous allez rechercher, comment l'entreprise en b\u00e9n\u00e9ficie, quelles donn\u00e9es et ressources vous avez besoin.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">2. Collecter des donn\u00e9es<\/h3>\n\n\n\n<p>La deuxi\u00e8me \u00e9tape consiste \u00e0 collecter des donn\u00e9es. vous aurez besoin de donn\u00e9es pour vous donner les informations n\u00e9cessaires pour r\u00e9soudre le probl\u00e8me avec une solution. Cette partie du processus implique de r\u00e9fl\u00e9chir aux donn\u00e9es dont vous aurez besoin et de trouver des moyens d'obtenir ces donn\u00e9es, qu'il s'agisse d'interroger des bases de donn\u00e9es internes ou d'acheter des ensembles de donn\u00e9es externes. Les donn\u00e9es peuvent prendre de nombreuses formes allant des feuilles de calcul Excel \u00e0 diff\u00e9rents types de bases de donn\u00e9es<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">3.  Traitement des donn\u00e9es<\/h3>\n\n\n\n<p>L'exploration de donn\u00e9es vise \u00e0 approfondir la compr\u00e9hension de vos donn\u00e9es. Vous essayez de comprendre comment les variables interagissent les unes avec les autres, la distribution des donn\u00e9es et s'il existe des valeurs aberrantes. Pour y parvenir, vous utilisez principalement des statistiques descriptives, des techniques visuelles et une mod\u00e9lisation simple. Cette \u00e9tape est souvent d\u00e9sign\u00e9e par l'abr\u00e9viation EDA, pour Exploratory Data Analysis.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">4. Mod\u00e9liser les donn\u00e9es<\/h3>\n\n\n\n<p>Dans cette phase, vous utilisez des mod\u00e8les, des connaissances du domaine et des informations sur les donn\u00e9es que vous avez trouv\u00e9es dans les \u00e9tapes pr\u00e9c\u00e9dentes pour r\u00e9pondre \u00e0 la question de recherche. Vous s\u00e9lectionnez une technique dans les domaines des statistiques, de l'apprentissage automatique, de la recherche op\u00e9rationnelle, etc. La construction d'un mod\u00e8le est un processus it\u00e9ratif qui implique la s\u00e9lection des variables du mod\u00e8le, l'ex\u00e9cution du mod\u00e8le et les diagnostics du mod\u00e8le.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">5. Communiquer les r\u00e9sultats<\/h3>\n\n\n\n<p>Enfin, vous pr\u00e9sentez les r\u00e9sultats \u00e0 votre entreprise. Ces r\u00e9sultats peuvent prendre plusieurs formes, allant de pr\u00e9sentations \u00e0 des rapports de recherche. Parfois, vous devrez automatiser l'ex\u00e9cution du processus, car l'entreprise voudra utiliser les informations que vous avez acquises dans un autre projet ou permettre \u00e0 un processus op\u00e9rationnel d'utiliser le r\u00e9sultat de votre mod\u00e8le.<\/p>","protected":false},"excerpt":{"rendered":"<p>Introduction\u00a0: Le processus de data science se compose g\u00e9n\u00e9ralement de six \u00e9tapes\u00a0: d\u00e9finir le probl\u00e8me, collecter des donn\u00e9es, traiter les donn\u00e9es, explorer les donn\u00e9es, mod\u00e9liser les donn\u00e9es, communiquer les r\u00e9sultats. Dans cet article nous allons les affronter un par un pour enfin se familiariser avec le processus de la science des donn\u00e9es. 1. Encadrer le probl\u00e8me Lorsqu'il s'agit d'effectuer un [\u2026]<\/p>","protected":false},"author":3,"featured_media":3185,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_monsterinsights_skip_tracking":false,"_monsterinsights_sitenote_active":false,"_monsterinsights_sitenote_note":"","_monsterinsights_sitenote_category":0},"categories":[91],"tags":[],"_links":{"self":[{"href":"https:\/\/akyalab.com\/fr\/wp-json\/wp\/v2\/posts\/3176"}],"collection":[{"href":"https:\/\/akyalab.com\/fr\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/akyalab.com\/fr\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/akyalab.com\/fr\/wp-json\/wp\/v2\/users\/3"}],"replies":[{"embeddable":true,"href":"https:\/\/akyalab.com\/fr\/wp-json\/wp\/v2\/comments?post=3176"}],"version-history":[{"count":6,"href":"https:\/\/akyalab.com\/fr\/wp-json\/wp\/v2\/posts\/3176\/revisions"}],"predecessor-version":[{"id":3188,"href":"https:\/\/akyalab.com\/fr\/wp-json\/wp\/v2\/posts\/3176\/revisions\/3188"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/akyalab.com\/fr\/wp-json\/wp\/v2\/media\/3185"}],"wp:attachment":[{"href":"https:\/\/akyalab.com\/fr\/wp-json\/wp\/v2\/media?parent=3176"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/akyalab.com\/fr\/wp-json\/wp\/v2\/categories?post=3176"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/akyalab.com\/fr\/wp-json\/wp\/v2\/tags?post=3176"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}