CodeGym /Cursos /Python SELF ES /Introducción a CSS

Introducción a CSS

Python SELF ES
Nivel 30 , Lección 0
Disponible

1. Conceptos básicos de CSS para web scraping

Para realizar un web scraping exitoso, entender la estructura de HTML y las clases CSS en una página es un factor clave. Entender cómo los elementos de las páginas están estilizados y estructurados con CSS permite seleccionar con mayor precisión los datos necesarios y extraerlos. Vamos a revisar cómo el enlace de CSS con HTML, el uso de selectores y los atributos style, class, id y name ayudan a trabajar con la estructura de las páginas web para el scraping.

CSS es responsable del estilo de las páginas web; sin embargo, para propósitos de web scraping, podemos considerar CSS como una herramienta para entender la estructura y seleccionar elementos. Vamos a ver los conceptos clave de CSS que son importantes para el scraping:

  • Selectores: son reglas que apuntan a elementos HTML específicos. Su uso permite identificar con precisión los datos necesarios.
  • Atributos class, id y name: son identificadores únicos que ayudan a distinguir entre elementos. Para el scraping son especialmente útiles, porque permiten aislar los elementos necesarios, lo que facilita la extracción de datos.

2. Cómo enlazar CSS a un documento HTML

CSS puede enlazarse a HTML de varias maneras. Es importante entender estas formas para navegar por los elementos y determinar sus estilos y clases, ya que esto ayudará a aislar los datos objetivos.

Archivo externo

CSS a menudo se enlaza como un archivo externo, lo que se puede ver en un documento HTML a través de la etiqueta <link> en la sección <head>. Los archivos CSS externos definen los estilos para toda la página, incluyendo identificadores y clases, lo que facilita la navegación en el scraping.

HTML

<head>
    <link rel="stylesheet" href="styles.css">
</head>
    

Estilos internos

A veces los estilos pueden definirse dentro de la página usando la etiqueta <style>. Los estilos internos se pueden encontrar en el <head> de la página y servir como una pista para entender las clases e identificadores mediante los cuales se pueden seleccionar los elementos necesarios.

HTML

<head>
<style>
  .price {
    color: red;
  }
</style>
</head>

Estilos en línea (atributo style)

Los estilos en línea se encuentran directamente en las etiquetas HTML y afectan únicamente al elemento específico. El atributo style también suele contener propiedades únicas que pueden resultar útiles para identificar los datos objetivos.

HTML

<p style="color: red; font-size: 18px;">Texto con estilo en línea</p>
HTML

<p style="color: red; font-size: 18px;">Texto con estilo en línea</p>

3. Selectores en CSS

Los selectores en CSS se usan para aplicar estilos a los elementos, pero para el web scraping su aplicación principal es seleccionar con precisión elementos que contienen los datos necesarios. Vamos a repasar los tipos principales de selectores que se pueden usar para el web scraping.

Tipos principales de selectores

Selector por etiqueta: Este selector selecciona todos los elementos de una etiqueta específica (por ejemplo, <p> o <div>). En el web scraping, los selectores por etiqueta son útiles para extraer información de etiquetas que pueden contener texto, imágenes y otra información.

CSS

p {
  color: blue;
}
    

Selector por clase: Este selector selecciona elementos con un valor específico en el atributo class. Se denota con un punto (.) antes del nombre. En el web scraping, las clases son especialmente útiles, ya que pueden identificar elementos con estilos similares, como una lista de productos.

CSS
      
        .price {
            color: red;
          }
      
    
CSS
      
        .price {
            color: red;
          }
      
    
HTML
      
        <p class="price">Precio: $99</p>
      
    

Selector por identificador (ID): Este selector selecciona un elemento con un atributo único id, denotado por el símbolo #. En el web scraping, id es especialmente útil para seleccionar elementos únicos, como un encabezado o botón en la página.

CSS

    #product-title {
        font-size: 24px;
      }
CSS

    #product-title {
        font-size: 24px;
      }
HTML
  
    <h1 id="product-title">Nombre del producto</h1>
  

Seleccionadores por atributo: Estos selectores seleccionan elementos basándose en atributos específicos, como name, type y otros. En el web scraping, los selectores por atributo son útiles para seleccionar elementos de formularios o campos específicos, como aquellos con un name concreto.

CSS

input[name="email"] {
  border: 2px solid blue;
}
    

Selectores combinados: Estos selectores permiten seleccionar elementos con mayor precisión al combinar varios criterios. Por ejemplo, .product-list .price seleccionará solo los precios de productos dentro del contenedor product-list.

Aprenderemos más sobre los selectores combinados y por atributos en las próximas clases.

4. Atributos style, class, id y name

Atributo style

El atributo style se usa para agregar estilos en línea a los elementos, lo que puede servir como una característica distintiva de elementos que son difíciles de identificar con otros atributos. En el web scraping, puede usarse como un filtro adicional para buscar elementos específicos en una página.

HTML

<p style="color: red; font-size: 18px;">Este texto tiene un estilo en línea</p>
    
Comentarios
TO VIEW ALL COMMENTS OR TO MAKE A COMMENT,
GO TO FULL VERSION