{"id":2976,"date":"2022-01-29T14:05:49","date_gmt":"2022-01-29T14:05:49","guid":{"rendered":"https:\/\/akyalab.com\/?p=2976"},"modified":"2022-02-26T14:53:24","modified_gmt":"2022-02-26T14:53:24","slug":"decouvrir-la-data-science","status":"publish","type":"post","link":"https:\/\/akyalab.com\/fr\/decouvrir-la-data-science\/","title":{"rendered":"D\u00e9couvrir la science des donn\u00e9es"},"content":{"rendered":"<h2 class=\"wp-block-heading\">Introduction:<\/h2>\n\n\n\n<figure class=\"wp-block-image size-full\"><img decoding=\"async\" loading=\"lazy\" width=\"955\" height=\"440\" src=\"http:\/\/akyalab.com\/wp-content\/uploads\/2022\/01\/hottest-jobs-data-science-right-now-955x440.jpeg.optimal.jpeg\" alt=\"\" class=\"wp-image-3071\" srcset=\"https:\/\/akyalab.com\/wp-content\/uploads\/2022\/01\/hottest-jobs-data-science-right-now-955x440.jpeg.optimal.jpeg 955w, https:\/\/akyalab.com\/wp-content\/uploads\/2022\/01\/hottest-jobs-data-science-right-now-955x440.jpeg.optimal-300x138.jpeg 300w, https:\/\/akyalab.com\/wp-content\/uploads\/2022\/01\/hottest-jobs-data-science-right-now-955x440.jpeg.optimal-768x354.jpeg 768w, https:\/\/akyalab.com\/wp-content\/uploads\/2022\/01\/hottest-jobs-data-science-right-now-955x440.jpeg.optimal-18x8.jpeg 18w\" sizes=\"(max-width: 955px) 100vw, 955px\" \/><figcaption>https:\/\/www.information-age.com\/hottest-jobs-data-science-right-now-123496406\/<\/figcaption><\/figure>\n\n\n\n<p>Avec la num\u00e9risation, nous vivons une \u00e9poque passionnante o\u00f9 les donn\u00e9es affluent de partout (appareils mobiles, ordinateurs, etc.). Ces informations sont collect\u00e9es, stock\u00e9es et trait\u00e9es afin de leur donner un sens. C'est-\u00e0-dire que ces informations sont utilis\u00e9es pour prendre des d\u00e9cisions marketing, r\u00e9soudre des probl\u00e8mes complexes, r\u00e9agir plus rapidement au changement et comprendre le monde qui nous entoure. Cependant, donner un sens \u00e0 ces informations peut \u00eatre subtil lorsque vous ne savez pas par o\u00f9 commencer ni comment vous y prendre ; Et c'est l\u00e0 que la science des donn\u00e9es entre en jeu.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">1.Definition<\/h2>\n\n\n\n<p>La science des donn\u00e9es est l'utilisation de m\u00e9thodes pour analyser des quantit\u00e9s massives de donn\u00e9es et extraire les connaissances qu'elles contiennent. La science des donn\u00e9es est une combinaison de connaissances analytiques en math\u00e9matiques et en statistiques, de connaissances en programmation informatique n\u00e9cessaires pour travailler avec des donn\u00e9es et d'un domaine d'expertise. Le domaine d'expertise est l'\u00e9l\u00e9ment fondamental en science des donn\u00e9es car sans cet \u00e9l\u00e9ment on est appel\u00e9 \u00e0 \u00eatre math\u00e9maticien, statisticien ou programmeur. Le data scientist est alors charg\u00e9 d'analyser, de traiter, de mod\u00e9liser les donn\u00e9es puis de les interpr\u00e9ter pour une \u00e9ventuelle prise de d\u00e9cision.<\/p>\n\n\n\n<p>Les secteurs d'activit\u00e9 utilisant la data science dans la prise de d\u00e9cision ne font que cro\u00eetre, on peut ainsi citer :<\/p>\n\n\n\n<ul><li>Les data scientists en marketing utilisent la r\u00e9gression logistique pour pr\u00e9dire et anticiper le taux de d\u00e9sabonnement (perte) de clients de votre produit ou service vers celui du concurrent ;<\/li><li>Les ing\u00e9nieurs en architecture utilisent l'apprentissage automatique pour optimiser l'efficacit\u00e9 \u00e9nerg\u00e9tique dans la conception de b\u00e2timents modernes ;<\/li><li>Dans le domaine m\u00e9dicale, les data scientists travaillent sur la personnalisation des plans de traitement et l'utilisation de l'informatique de la sant\u00e9 pour pr\u00e9dire et anticiper les probl\u00e8mes de sant\u00e9 futurs chez les patients \u00e0 risque ;<\/li><li>Dans le monde automobile, gr\u00e2ce \u00e0 la technologie de conduite assist\u00e9e, les informations recueillies aupr\u00e8s des v\u00e9hicules sillonnant les villes sont utilis\u00e9es pour am\u00e9liorer leurs syst\u00e8mes de navigation, conna\u00eetre l'\u00e9tat de sant\u00e9 du v\u00e9hicule, etc...;<\/li><\/ul>\n\n\n\n<p>Ces quelques exemples nous permettent de conclure que la science des donn\u00e9es fait partie int\u00e9grante de notre avenir. <\/p>\n\n\n\n<blockquote class=\"wp-block-quote\"><p>Les donn\u00e9es sont importantes et pour les apprendre, nous devons conna\u00eetre les diff\u00e9rents types de donn\u00e9es dont nous disposons.<\/p><\/blockquote>\n\n\n\n<h2 class=\"wp-block-heading\">2. Types de donn\u00e9es<\/h2>\n\n\n\n<p>En science des donn\u00e9es, il existe de nombreux types de donn\u00e9es diff\u00e9rents\u00a0:<\/p>\n\n\n\n<ul><li>Donn\u00e9es structur\u00e9es;<\/li><li>Non structur\u00e9es\u00a0;<\/li><li>Donn\u00e9es en langage naturel;<\/li><li>Donn\u00e9es g\u00e9n\u00e9r\u00e9es par la machine\u00a0;<\/li><li>Donn\u00e9es bas\u00e9es sur des graphiques\u00a0;<\/li><li>Audio, vid\u00e9o et images\u00a0;<\/li><li>Streaming;<\/li><\/ul>\n\n\n\n<h4 class=\"wp-block-heading\">2.1 Structured data<\/h4>\n\n\n\n<p>Les donn\u00e9es structur\u00e9es sont des types de donn\u00e9es qui sont format\u00e9es et d\u00e9pendent d'un mod\u00e8le pr\u00e9d\u00e9fini. Ils sont facilement traitables et accessibles par les humains et les ordinateurs. Ils sont g\u00e9n\u00e9ralement stock\u00e9s dans une base de donn\u00e9es et le langage de requ\u00eate structur\u00e9 est le moyen privil\u00e9gi\u00e9 pour les g\u00e9rer.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\">2.2 Donn\u00e9es non structur\u00e9es<\/h4>\n\n\n\n<p>Les donn\u00e9es non structur\u00e9es sont des donn\u00e9es qui ne d\u00e9pendent d'aucun mod\u00e8le. Ils ne sont pas faciles \u00e0 int\u00e9grer dans un mod\u00e8le de donn\u00e9es car le contenu est sp\u00e9cifique au contexte ou variable. Ils n'ont pas de r\u00e8gles ni de format et ne peuvent pas \u00eatre facilement utilis\u00e9s par les programmes.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\">2.3 Donn\u00e9es en langage naturel;<\/h4>\n\n\n\n<p>Le langage naturel est un type particulier de donn\u00e9es non structur\u00e9es\u00a0; Elles concernent des donn\u00e9es qui sont utilis\u00e9es dans le NLP (Natural Language) qui est une branche de la science des donn\u00e9es. Il permet aux ordinateurs d'analyser, de comprendre le langage humain et de g\u00e9n\u00e9rer des interactions, transformant les donn\u00e9es brutes en conversation intelligente.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\">2.4 Donn\u00e9es g\u00e9n\u00e9r\u00e9es par la machine\u00a0;<\/h4>\n\n\n\n<p>Les donn\u00e9es g\u00e9n\u00e9r\u00e9es par la machine sont des informations cr\u00e9\u00e9es automatiquement par un ordinateur, un processus, une application ou une autre machine sans intervention humaine. Les donn\u00e9es g\u00e9n\u00e9r\u00e9es par la machine deviennent une ressource de donn\u00e9es majeure et continueront de le faire. Des exemples de donn\u00e9es machine sont les journaux de serveur Web, les enregistrements des d\u00e9tails des appels.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\">2.5 Donn\u00e9es bas\u00e9es sur des graphiques\u00a0;<\/h4>\n\n\n\n<p>Les donn\u00e9es de graphe ou de r\u00e9seau sont, en bref, des donn\u00e9es qui se concentrent sur la relation ou la contigu\u00eft\u00e9 des objets. Les structures de graphe utilisent des n\u0153uds, des ar\u00eates et des propri\u00e9t\u00e9s pour repr\u00e9senter et stocker des donn\u00e9es graphiques. Les donn\u00e9es bas\u00e9es sur des graphiques sont un moyen naturel de repr\u00e9senter les r\u00e9seaux sociaux, et leur structure vous permet de calculer des m\u00e9triques sp\u00e9cifiques telles que l'influence d'une personne et le chemin le plus court entre deux personnes.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\">2.6 Audio, vid\u00e9o et images\u00a0;<\/h4>\n\n\n\n<p>L'audio, l'image et la vid\u00e9o sont des types de donn\u00e9es qui posent des d\u00e9fis sp\u00e9cifiques \u00e0 un data scientist. Les t\u00e2ches qui sont triviales pour les humains, telles que la reconnaissance d'objets dans des images, s'av\u00e8rent difficiles pour les ordinateurs.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\">2.7 Donn\u00e9es en streaming (continu)<\/h4>\n\n\n\n<p>Bien que les donn\u00e9es en continu puissent prendre presque toutes les formes pr\u00e9c\u00e9dentes, elles ont une propri\u00e9t\u00e9 suppl\u00e9mentaire. Les donn\u00e9es circulent dans le syst\u00e8me lorsqu'un \u00e9v\u00e9nement se produit au lieu d'\u00eatre charg\u00e9es dans un magasin de donn\u00e9es dans un lot. Bien qu'il ne s'agisse pas vraiment d'un type de donn\u00e9es diff\u00e9rent, nous le traitons ici comme tel car vous devez adapter votre processus pour traiter ce type d'informations.<\/p>\n\n\n\n<p><\/p>\n\n\n\n<blockquote class=\"wp-block-quote\"><p>Nous connaissons donc maintenant les diff\u00e9rents types de donn\u00e9es et nous d\u00e9couvrirons ensuite les comp\u00e9tences dont nous avons besoin pour \u00eatre des data scientists<\/p><\/blockquote>\n\n\n\n<h2 class=\"wp-block-heading\">3. Comment \u00eatre un data scientist<\/h2>\n\n\n\n<p>De nos jours, certaines \u00e9coles proposent d\u00e9sormais des programmes sp\u00e9cialis\u00e9s adapt\u00e9s aux exigences p\u00e9dagogiques pour poursuivre une carri\u00e8re en data science, donnant aux \u00e9tudiants la possibilit\u00e9 de se concentrer sur le domaine d'\u00e9tudes qui les int\u00e9resse le plus, et dans un d\u00e9lai plus court. Certaines comp\u00e9tences sont n\u00e9cessaires pour devenir data scientist\u00a0:<\/p>\n\n\n\n<ul><li>Statistiques<\/li><li>Math\u00e9matiques<\/li><li>Programmation informatique<\/li><li>Apprentissage Automatique<\/li><li>Manipulation et analyse des donn\u00e9es<\/li><li>Data Visualization<\/li><li>L'apprentissage en Profondeur<\/li><li>Comp\u00e9tences en communication<\/li><li>Curiosit\u00e9<\/li><\/ul>\n\n\n\n<p>C'est bon pour l'instant, alors devenons data scientist\ud83d\ude09 <\/p>","protected":false},"excerpt":{"rendered":"<p>Introduction : Avec la num\u00e9risation, nous vivons une \u00e9poque passionnante o\u00f9 les donn\u00e9es affluent de partout (appareils mobiles, ordinateurs, etc.). Ces informations sont collect\u00e9es, stock\u00e9es et trait\u00e9es afin de leur donner un sens. C'est-\u00e0-dire que ces informations sont utilis\u00e9es pour prendre des d\u00e9cisions marketing, r\u00e9soudre des probl\u00e8mes complexes, r\u00e9agir plus rapidement au changement et [\u2026]<\/p>","protected":false},"author":3,"featured_media":3071,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_monsterinsights_skip_tracking":false,"_monsterinsights_sitenote_active":false,"_monsterinsights_sitenote_note":"","_monsterinsights_sitenote_category":0},"categories":[91],"tags":[95],"_links":{"self":[{"href":"https:\/\/akyalab.com\/fr\/wp-json\/wp\/v2\/posts\/2976"}],"collection":[{"href":"https:\/\/akyalab.com\/fr\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/akyalab.com\/fr\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/akyalab.com\/fr\/wp-json\/wp\/v2\/users\/3"}],"replies":[{"embeddable":true,"href":"https:\/\/akyalab.com\/fr\/wp-json\/wp\/v2\/comments?post=2976"}],"version-history":[{"count":11,"href":"https:\/\/akyalab.com\/fr\/wp-json\/wp\/v2\/posts\/2976\/revisions"}],"predecessor-version":[{"id":3175,"href":"https:\/\/akyalab.com\/fr\/wp-json\/wp\/v2\/posts\/2976\/revisions\/3175"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/akyalab.com\/fr\/wp-json\/wp\/v2\/media\/3071"}],"wp:attachment":[{"href":"https:\/\/akyalab.com\/fr\/wp-json\/wp\/v2\/media?parent=2976"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/akyalab.com\/fr\/wp-json\/wp\/v2\/categories?post=2976"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/akyalab.com\/fr\/wp-json\/wp\/v2\/tags?post=2976"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}