CodeGym /Cours Java /Python SELF FR /Introduction à CSS

Introduction à CSS

Python SELF FR
Niveau 30 , Leçon 0
Disponible

1. Concepts de base de CSS pour le web scraping

Pour réussir le web scraping, comprendre la structure HTML et les classes CSS sur une page est un facteur clé. En comprenant comment les éléments de la page sont stylisés et structurés avec CSS, tu peux sélectionner les données nécessaires plus précisément et les extraire. Examinons comment l'intégration de CSS dans HTML, l'utilisation des sélecteurs, ainsi que les attributs style, class, id et name aident à travailler avec la structure des pages web pour le scraping.

CSS est responsable de la stylisation des pages web, mais pour le web scraping, on peut considérer CSS comme un outil de compréhension de la structure et de sélection des éléments. Voici les concepts clés de CSS importants pour le scraping :

  • Sélecteurs — il s'agit de règles qui pointent sur des éléments HTML spécifiques. Les utiliser permet d'identifier précisément les données recherchées.
  • Attributs class, id, et name — ils sont des identifiants uniques qui aident à distinguer et différencier les éléments. Pour le scraping, ils sont particulièrement utiles car ils permettent d'isoler les éléments nécessaires, ce qui simplifie l'extraction des données.

2. Intégration de CSS dans un document HTML

CSS peut être intégré dans HTML de différentes manières. Il est important de comprendre ces méthodes pour naviguer à travers les éléments et identifier leurs styles et classes, car cela aide à isoler les données ciblées.

Fichier externe

CSS est souvent intégré sous forme de fichier externe, ce qui peut être visible dans un document HTML par une balise <link> dans la section <head>. Les fichiers CSS externes définissent les styles pour l'ensemble de la page, y compris les identifiants et les classes, ce qui facilite la navigation lors du scraping.

HTML

<head>
    <link rel="stylesheet" href="styles.css">
</head>
    

Styles internes

Parfois, les styles peuvent être définis à l'intérieur de la page en utilisant la balise <style>. Les styles internes peuvent être trouvés dans <head> de la page et être utilisés comme un indice pour comprendre les classes et identifiants selon lesquels tu peux sélectionner les éléments nécessaires.

HTML

<head>
<style>
  .price {
    color: red;
  }
</style>
</head>

Styles intégrés (attribut style)

Les styles intégrés se trouvent directement dans les balises HTML et affectent uniquement un élément particulier. L'attribut style contient souvent des propriétés uniques qui peuvent être utiles pour identifier les données ciblées.

HTML

<p style="color: red; font-size: 18px;">Texte avec style intégré</p>

3. Les sélecteurs dans CSS

Les sélecteurs dans CSS sont utilisés pour appliquer des styles aux éléments, mais pour le web scraping, leur principal usage est de sélectionner précisément les éléments qui contiennent les données nécessaires. Voici les principaux types de sélecteurs que tu peux utiliser dans le web scraping.

Principaux types de sélecteurs

Sélecteur par balise : Ce sélecteur sélectionne tous les éléments d'une balise spécifique (par exemple, <p> ou <div>). En web scraping, les sélecteurs par balise sont utiles pour extraire des informations à partir de balises pouvant contenir du texte, des images et d'autres informations.

CSS

p {
  color: blue;
}
    

Sélecteur par classe : Ce sélecteur sélectionne les éléments avec une valeur d'attribut class spécifique. La classe est désignée par un point (.) avant le nom. En web scraping, les classes sont particulièrement utiles, car elles permettent d'identifier des éléments ayant les mêmes styles, comme une liste de produits.

CSS
      
        .price {
            color: red;
          }
      
    
HTML
      
        <p class="price">Prix : $99</p>
      
    

Sélecteur par identifiant (ID) : Ce sélecteur sélectionne un élément avec un attribut id unique, représenté par le symbole #. En web scraping, id est particulièrement utile pour sélectionner des éléments uniques, tels qu'un titre ou un bouton sur une page.

HTML
  
    <h1 id="product-title">Nom du produit</h1>
  

Sélecteurs d'attributs : Ces sélecteurs choisissent des éléments selon des attributs spécifiques, comme name, type, et autres. En web scraping, les sélecteurs d'attributs sont utiles pour choisir des éléments de formulaire ou des champs spécifiques, par exemple les champs avec un certain name.

CSS

input[name="email"] {
  border: 2px solid blue;
}
    

Sélecteurs combinés : Ces sélecteurs permettent de choisir des éléments avec plus de précision en combinant plusieurs critères. Par exemple, .product-list .price sélectionne uniquement les prix des produits à l'intérieur du conteneur product-list.

Tu apprendras davantage sur les sélecteurs d'attributs et combinés dans les prochaines conférences.

4. Attributs style, class, id et name

Commentaires
TO VIEW ALL COMMENTS OR TO MAKE A COMMENT,
GO TO FULL VERSION