Iniciar prueba gratuita
Searching...
SoBrief
Español
EnglishEnglish
EspañolSpanish
简体中文Chinese
繁體中文Chinese (Traditional)
FrançaisFrench
DeutschGerman
日本語Japanese
PortuguêsPortuguese
ItalianoItalian
한국어Korean
РусскийRussian
NederlandsDutch
العربيةArabic
PolskiPolish
हिन्दीHindi
Tiếng ViệtVietnamese
SvenskaSwedish
ΕλληνικάGreek
TürkçeTurkish
ไทยThai
ČeštinaCzech
RomânăRomanian
MagyarHungarian
УкраїнськаUkrainian
Bahasa IndonesiaIndonesian
DanskDanish
SuomiFinnish
БългарскиBulgarian
עבריתHebrew
NorskNorwegian
HrvatskiCroatian
CatalàCatalan
SlovenčinaSlovak
LietuviųLithuanian
SlovenščinaSlovenian
СрпскиSerbian
EestiEstonian
LatviešuLatvian
فارسیPersian
മലയാളംMalayalam
தமிழ்Tamil
اردوUrdu
SQL práctico

SQL práctico

Guía para principiantes para contar historias con datos
por Anthony DeBarros 2022 427 páginas
4.26
239 valoraciones
Escuchar
Prueba el acceso completo por 3 días
¡Desbloquea la escucha y mucho más!
Continuar

Ideas clave

1. Fundamentos de SQL: Creación de bases de datos, tablas y consultas

SQL es mucho más que una herramienta para extraer conocimiento de los datos. También es un lenguaje para definir las estructuras que almacenan esos datos y así organizar las relaciones entre ellos.

Creación de bases de datos. Comienza creando una base de datos para agrupar tablas relacionadas. Utiliza la instrucción CREATE DATABASE seguida de un nombre descriptivo. Las tablas son los elementos esenciales de una base de datos y se crean con CREATE TABLE. Define las columnas con tipos de datos adecuados y establece las restricciones necesarias.

Consultas básicas. La instrucción SELECT es la herramienta principal de SQL para recuperar datos de las tablas. Domina lo esencial:

  • SELECT: Elige las columnas que quieres mostrar
  • FROM: Indica la tabla o tablas de origen
  • WHERE: Filtra filas según condiciones específicas
  • ORDER BY: Ordena los resultados
  • LIMIT: Limita la cantidad de filas devueltas

Practica combinando estas cláusulas para extraer información relevante. A medida que avances, explora funciones agregadas (COUNT, SUM, AVG) y el agrupamiento con GROUP BY para resumir datos de forma efectiva.

2. Manipulación avanzada de datos: Joins, subconsultas y expresiones de tabla comunes

Los joins te permiten manejar muchos de los conjuntos de datos más complejos que encontrarás.

Unión de tablas. Comprende los distintos tipos de joins:

  • INNER JOIN: Devuelve filas que coinciden en ambas tablas
  • LEFT/RIGHT JOIN: Devuelve todas las filas de una tabla y las que coinciden de la otra
  • FULL OUTER JOIN: Devuelve todas las filas cuando hay coincidencias en cualquiera de las tablas
  • CROSS JOIN: Devuelve el producto cartesiano de ambas tablas

Subconsultas y CTEs. Las subconsultas permiten anidar una consulta dentro de otra, comúnmente en cláusulas WHERE o como tablas derivadas. Las Expresiones de Tabla Comunes (CTEs) ofrecen una alternativa más legible para subconsultas complejas, permitiendo definir consultas nombradas que pueden referenciarse varias veces en la consulta principal.

Estas técnicas avanzadas te capacitan para trabajar con relaciones complejas, realizar cálculos en varios pasos y descomponer problemas complejos en partes manejables. Practica combinando joins con subconsultas y CTEs para aprovechar al máximo tus capacidades de análisis.

3. Trabajando con diferentes tipos de datos: Números, fechas y texto

Manejar fechas y horas en bases de datos SQL añade una dimensión fascinante a tu análisis, permitiéndote responder cuándo ocurrió un evento y otras cuestiones temporales.

Datos numéricos. Entiende las diferencias entre tipos enteros y decimales. Usa funciones matemáticas apropiadas para cálculos y agregaciones. Ten en cuenta posibles problemas con la aritmética de punto flotante y emplea tipos numéricos exactos (como DECIMAL) para cálculos financieros.

Datos de fecha y hora. Domina funciones para:

  • Extraer componentes (año, mes, día)
  • Calcular intervalos entre fechas
  • Formatear fechas para presentación
  • Trabajar con zonas horarias

Datos de texto. Utiliza funciones para manipular cadenas:

  • Concatenación
  • Extracción de subcadenas
  • Búsqueda por patrones con LIKE y expresiones regulares
  • Capacidades de búsqueda de texto completo

Cada tipo de dato requiere técnicas específicas. Las fechas suelen necesitar atención especial a zonas horarias y formatos. El texto puede requerir limpieza o estandarización. Los números pueden implicar redondeos o precisión. Practica con todos para convertirte en un analista SQL completo.

4. Análisis estadístico y agregación de datos en SQL

Las funciones estadísticas son igual de útiles cuando trabajas con tablas unidas.

Agregaciones básicas. Comienza con funciones agregadas fundamentales:

  • COUNT: Cuenta filas o valores no nulos
  • SUM: Calcula totales
  • AVG: Obtiene promedios
  • MIN/MAX: Identifica valores extremos

Estadísticas avanzadas. Explora funciones más sofisticadas:

  • Correlación: Mide relaciones entre variables
  • Regresión: Predice valores basados en otras variables
  • Percentiles: Comprende la distribución de datos

Funciones de ventana. Usa funciones de ventana para cálculos sobre un conjunto de filas relacionadas con la fila actual:

  • Totales acumulados
  • Promedios móviles
  • Clasificaciones

Combina estas técnicas con GROUP BY y HAVING para segmentar datos y obtener insights valiosos. Recuerda que, aunque SQL puede manejar muchas operaciones estadísticas, análisis complejos pueden requerir integración con software especializado o lenguajes como R o Python.

5. Análisis de datos geoespaciales con PostGIS

PostGIS incluye un potente motor de búsqueda de texto completo que añade capacidades para buscar grandes volúmenes de texto, similar a herramientas en línea y tecnologías que impulsan búsquedas en bases de datos de investigación como Factiva.

Tipos de datos espaciales. Conoce los tipos básicos:

  • Point: Ubicación única
  • LineString: Serie de puntos conectados
  • Polygon: Área cerrada
  • MultiPoint, MultiLineString, MultiPolygon: Colecciones de objetos espaciales

Funciones espaciales. Utiliza funciones de PostGIS para análisis:

  • ST_Distance: Calcula distancias entre objetos
  • ST_Within: Verifica si un objeto está dentro de otro
  • ST_Intersection: Encuentra áreas de superposición

Indexación espacial. Implementa índices espaciales (como GiST) para mejorar el rendimiento en consultas sobre grandes conjuntos de datos.

PostGIS amplía PostgreSQL para manejar datos geográficos eficientemente, permitiendo análisis espaciales complejos como encontrar puntos de interés en un radio determinado, calcular áreas o realizar joins espaciales. Combina datos espaciales con datos relacionales para análisis geoespaciales completos.

6. Manejo de datos JSON en PostgreSQL

La incorporación del soporte JSON en SQL ha permitido disfrutar lo mejor de ambos mundos al añadir datos JSON como columnas en tablas relacionales.

Tipos de datos JSON. PostgreSQL ofrece dos tipos:

  • json: Almacena una copia exacta del texto de entrada
  • jsonb: Almacena datos en formato binario descompuesto, permitiendo procesamiento e indexación más rápidos

Consultas sobre JSON. Usa operadores y funciones para extraer y manipular datos JSON:

  • -> : Extrae un campo JSON como JSON
  • ->> : Extrae un campo JSON como texto
  • #> : Extrae un objeto JSON en una ruta específica
  • jsonb_array_elements: Expande un arreglo JSON a un conjunto de valores JSON

Indexación JSON. Crea índices GIN (Generalized Inverted Index) en columnas jsonb para acelerar operadores de contención y existencia.

El soporte JSON en PostgreSQL permite diseños flexibles de esquemas e integración sencilla con APIs basadas en JSON. Sin embargo, evalúa las ventajas y desventajas entre JSON y estructuras relacionales tradicionales según tu caso y patrones de consulta.

7. Técnicas de limpieza, importación y exportación de datos

Tras importar un conjunto de datos, un primer paso sensato es verificar que la tabla contiene el número esperado de filas.

Importación de datos. Usa el comando COPY para cargar eficientemente grandes volúmenes desde archivos CSV. Ten en cuenta opciones para manejar encabezados, delimitadores y formatos de datos.

Limpieza de datos. Tareas comunes incluyen:

  • Manejo de valores faltantes
  • Estandarización de formatos (fechas, teléfonos, etc.)
  • Eliminación de duplicados
  • Corrección de errores ortográficos o categorías inconsistentes

Exportación de datos. Utiliza COPY TO para exportar datos a archivos. Considera opciones de formato para asegurar compatibilidad con sistemas destino.

Desarrolla un enfoque sistemático para limpieza y validación. Verifica siempre la integridad y precisión de los datos importados. Usa las capacidades de manipulación de cadenas y expresiones regulares de SQL para limpieza de texto. Para tareas complejas, considera herramientas ETL externas junto con SQL.

8. Optimización del rendimiento: Indexación y afinamiento de consultas

Para acelerar consultas, ¿qué columnas son candidatas ideales para índices?

Estrategias de indexación. Crea índices en columnas usadas frecuentemente en cláusulas WHERE, condiciones JOIN y ORDER BY. Considera:

  • Índices B-tree para consultas de igualdad y rango
  • Índices hash para comparaciones simples de igualdad
  • Índices GIN para búsqueda de texto completo y columnas jsonb

Optimización de consultas. Técnicas para mejorar el rendimiento:

  • Usa EXPLAIN ANALYZE para entender planes de ejecución
  • Reescribe consultas complejas con CTEs o tablas temporales
  • Evita funciones en cláusulas WHERE sobre columnas indexadas
  • Emplea tipos de joins y orden de joins adecuados

Mantenimiento de la base de datos. Tareas regulares:

  • VACUUM para recuperar espacio y actualizar estadísticas
  • ANALYZE para recopilar estadísticas sobre el contenido
  • Monitoreo y ajuste de parámetros de configuración del servidor

Recuerda que la optimización es un proceso iterativo. Monitorea continuamente el rendimiento y ajusta índices y consultas conforme evolucionan tus datos y patrones de uso. Equilibra los beneficios de los índices con la sobrecarga que generan en operaciones de escritura.

Última actualización:

Report Issue

Resumen de reseñas

4.26 de 5
Promedio de 239 valoraciones de Goodreads y Amazon.

Practical SQL ha recibido en su mayoría opiniones positivas, donde los lectores destacan sus explicaciones claras, ejemplos prácticos y una cobertura completa de los conceptos de SQL. Muchos lo consideran útil tanto para principiantes como para quienes desean refrescar sus conocimientos. Se valora especialmente su enfoque en conjuntos de datos reales y en la narración de datos. Algunos lectores mencionan que la dificultad aumenta en los capítulos finales, y unos pocos encuentran complicado instalar PostgreSQL. En conjunto, se reconoce como un recurso valioso para aprender SQL y la gestión de bases de datos, con una calificación promedio de 4.28 sobre 5 basada en 207 reseñas.

Your rating:
4.61
185 valoraciones
Want to read the full book?

Preguntas frecuentes

What's Practical SQL: A Beginner's Guide to Storytelling with Data about?

  • Focus on SQL Basics: Practical SQL introduces readers to SQL as a tool for data analysis, covering fundamental concepts and practical applications.
  • Storytelling with Data: The book emphasizes using SQL to uncover insights and tell stories, making it relevant for journalists, analysts, and data enthusiasts.
  • Hands-On Approach: Anthony DeBarros provides practical exercises and real-world examples, allowing readers to apply what they learn immediately.

Why should I read Practical SQL?

  • Beginner-Friendly: Designed for those new to programming and SQL, it guides readers step-by-step through the learning process.
  • Comprehensive Coverage: Covers a broad range of topics, including data types, importing/exporting data, and advanced querying techniques.
  • Real-World Applications: Uses real datasets to illustrate concepts, making the learning experience relevant and engaging.

What are the key takeaways of Practical SQL?

  • SQL Fundamentals: Learn the basics of SQL, including creating databases, tables, and performing queries.
  • Data Manipulation Techniques: Master techniques like aggregation, filtering, and joining tables for effective data analysis.
  • Best Practices: Emphasizes best practices in database design and data integrity, crucial for maintaining high-quality data.

What are the best quotes from Practical SQL and what do they mean?

  • "SQL has been useful to me ever since.": Highlights the enduring value of SQL skills in various professional contexts.
  • "Proper planning prevents poor performance.": Underscores the importance of setting up a solid foundation before diving into SQL coding.
  • "Interviewing the data is exciting because you discover truths.": Reflects the author's perspective on data analysis as a process of exploration and discovery.

What is SQL and why is it important?

  • Structured Query Language: SQL is used for managing and manipulating relational databases, allowing efficient data operations.
  • Data Management: Crucial for data analysis, enabling users to extract insights from large datasets.
  • Industry Standard: Widely used across industries, making it a valuable skill for job seekers in data-related fields.

How do I set up my coding environment for SQL?

  • Install PostgreSQL: The book guides readers through installing PostgreSQL, a popular open-source database system.
  • Use pgAdmin: Recommends using pgAdmin, a graphical interface for managing PostgreSQL databases, to simplify coding.
  • Download Example Data: Encourages downloading example datasets from GitHub for hands-on practice.

What are the different types of JOINs in SQL?

  • INNER JOIN: Returns only the rows where there is a match in both tables, useful for retrieving related data.
  • LEFT JOIN: Returns all rows from the left table and matched rows from the right table, with NULLs for unmatched rows.
  • FULL OUTER JOIN: Returns all rows from both tables, with NULLs where there is no match, useful for identifying discrepancies.

How do I import and export data using SQL?

  • COPY Command: Explains using the COPY command to import data from a CSV file into a PostgreSQL table.
  • Exporting Data: Learn to export data from a table to a CSV file using the COPY command.
  • Handling Delimited Files: Discusses understanding delimited text files, including handling header rows and quoting columns.

What are aggregate functions in SQL?

  • SUM and AVG: Perform calculations on a set of values in a column, essential for summarizing data.
  • COUNT and MODE: COUNT counts the number of rows, and MODE identifies the most frequently occurring value.
  • Using Percentile Functions: Introduces percentile functions like percentile_cont() for calculating medians and other quantiles.

How does Practical SQL approach data storytelling?

  • Identifying Trends: Emphasizes identifying trends in data to tell a compelling story.
  • Communicating Findings: Provides guidance on effectively communicating data findings to various audiences.
  • Real-World Examples: Uses examples to illustrate how data storytelling can impact decision-making.

How does Practical SQL help with database management?

  • Creating and Modifying Tables: Teaches how to create and modify database tables for effective management.
  • Using Indexes: Covers the importance of indexes in improving query performance.
  • Data Integrity: Discusses constraints and data validation techniques to ensure data integrity.

How can I apply the skills learned in Practical SQL to my job?

  • Data-Driven Decision Making: Helps analyze data relevant to your job, leading to more informed decisions.
  • Improving Efficiency: Mastering SQL can automate repetitive data tasks, saving time and reducing errors.
  • Enhanced Communication: Focus on storytelling with data equips you to present findings clearly and persuasively.

Sobre el autor

Anthony DeBarros es un periodista destacado, apasionado por el análisis de datos, la programación y la narración de historias. Actualmente trabaja como editor de datos en el Wall Street Journal, donde aborda temas como economía, comercio, política y el censo de Estados Unidos. DeBarros cuenta con una trayectoria diversa, habiendo ocupado cargos en USA TODAY, el Poughkeepsie Journal y el proyecto DocumentCloud para Reporteros de Investigación y Editores. Su habilidad para combinar el análisis de datos con el periodismo le ha valido premios y reconocimiento en su campo. El libro de DeBarros refleja su compromiso por hacer accesibles conceptos técnicos complejos a un público amplio.

Follow
Escuchar
Now playing
SQL práctico
0:00
-0:00
Now playing
SQL práctico
0:00
-0:00
1x
Queue
Home
Swipe
Library
Get App
Try Full Access for 3 Days
Listen, bookmark, and more
Compare Features Free Pro
📖 Read Summaries
Read unlimited summaries. Free users get 3 per month
🎧 Listen to Summaries
Listen to unlimited summaries in 40 languages
❤️ Unlimited Bookmarks
Free users are limited to 4
📜 Unlimited History
Free users are limited to 4
📥 Unlimited Downloads
Free users are limited to 1
Risk-Free Timeline
Hoy: Obtén acceso instantáneo
Escucha resúmenes completos de más de 26.000 libros. ¡Son más de 12.000 horas de audio!
Día 2: Recordatorio de prueba
Te enviaremos una notificación de que tu prueba está por terminar.
Día 3: Tu suscripción comienza
Se te cobrará el Jun 12,
cancela en cualquier momento antes.
Consume 2.8× More Books
2.8× more books Listening Reading
Our users love us
600,000+ readers
Trustpilot Rating
TrustPilot
4.6 Excellent
This site is a total game-changer. I've been flying through book summaries like never before. Highly, highly recommend.
— Dave G
Worth my money and time, and really well made. I've never seen this quality of summaries on other websites. Very helpful!
— Em
Highly recommended!! Fantastic service. Perfect for those that want a little more than a teaser but not all the intricate details of a full audio book.
— Greg M
Save 62%
Yearly
$119.88 $44.99/year/yr
$3.75/mo
Monthly
$9.99/mo
Start a 3-Day Free Trial
3 days free, then $44.99/year. Cancel anytime.
Unlock a world of fiction & nonfiction books
26,000+ books for the price of 2 books
Read any book in 10 minutes
Discover new books like Tinder
Request any book if it's not summarized
Read more books than anyone you know
#1 app for book lovers
Lifelike & immersive summaries
30-day money-back guarantee
Download summaries in EPUBs or PDFs
Cancel anytime in a few clicks
Scanner
Find a barcode to scan

We have a special gift for you
Open
38% OFF
DISCOUNT FOR YOU
$79.99
$49.99/year
only $4.16 per month
Continue
2 taps to start, super easy to cancel
Settings
General
Widget
Loading...
We have a special gift for you
Open
38% OFF
DISCOUNT FOR YOU
$79.99
$49.99/year
only $4.16 per month
Continue
2 taps to start, super easy to cancel