Diseño de Sistemas de Machine Learning

Name: Diseño de Sistemas de Machine Learning
Author: Huyen, Chip

Un Proceso Iterativo para Aplicaciones Listas para Funcionar

Huyen, Chip

Editorial:: Marcombo
Año de edición:: 2023
Materia:: Informática
ISBN:: 978-84-267-3695-6
Páginas:: 378
Encuadernación:: Rústica
Colección:: VARIAS

41,15 €

IVA incluido

Consigue 2 Puntos Añadir a favoritos

Sinopsis

Los sistemas de aprendizaje automático, en inglés Machine Learning, implican el uso de métodos, algoritmos y procesos complejos que constan de muchos componentes diferentes; además, dependen de datos que varían considerablemente de un caso a otro. Con este libro aprenderá un método integral para diseñar sistemas de aprendizaje automático fiables, escalables, fáciles de mantener y adaptables a los entornos dinámicos y a los requisitos empresariales. La autora Chip Huyen, cofundadora de Claypot AI, considera cada decisión de diseño en su contexto para determinar la manera como este puede ayudar a su sistema. Analiza desde cómo procesar y crear datos de formación, hasta qué atributos utilizar, con qué frecuencia volver a formar los modelos y qué elementos supervisar. En el marco iterativo de este libro se utilizan estudios de casos reales respaldados por referencias amplias que le ayudarán a alcanzar sus objetivos. Así pues, gracias a esta lectura conocerá: ' La ingeniería de datos y la elección de las métricas adecuadas para resolver un problema empresarial. ' La automatización del proceso de desarrollo, evaluación, instalación y actualización de los modelos. ' El desarrollo de un sistema de supervisión para detectar y resolver rápidamente los problemas que pueda encontrarse con sus modelos en funcionamiento. ' La arquitectura de una plataforma de aprendizaje automático que sirva para todos los casos. ' El desarrollo de sistemas de aprendizaje automático responsables. Chip Huyen es cofundadora de Claypot AI, una plataforma de aprendizaje automático en tiempo real. A través de su trabajo en NVIDIA, Netflix y Snorkel AI, ha ayudado a algunas de las organizaciones más grandes del mundo a desarrollar e implementar sus sistemas de aprendizaje automático. Chip basó este libro en sus apuntes para CS 329S: Diseño de Sistemas de Aprendizaje Automático, un curso que imparte en la Universidad de Stanford. 'Este es, sencillamente, el mejor libro que se puede leer sobre cómo construir, implementar y extender los modelos de aprendizaje automático en una empresa para lograr un impacto máximo'. -Josh Wills Ingeniero de software en WeaveGrid y exdirector de ingeniería de datos, Slack 'En un ecosistema floreciente pero caótico, esta visión de principios sobre el aprendizaje automático de principio a fin es tanto su mapa como su brújula: una lectura obligada para los profesionales dentro y fuera de los gigantes tecnológicos'. -Jacopo Tagliabue Director de IA, Coveo

Índice

Prefacio .................................................................................................................... ix
1. Panorama de los sistemas de aprendizaje automático ................................... 1
Cuándo utilizar el aprendizaje automático 3
Casos de uso del aprendizaje automático 9
Cómo entender los sistemas de aprendizaje automático 12
El aprendizaje automático en la investigación y en la práctica 12
Los sistemas de aprendizaje automático y el software tradicional 22
Resumen 24
2. Introducción al diseño de sistemas de aprendizaje automático. .................. 25
Objetivos empresariales y de AA 26
Requisitos para los sistemas de AA 29
Confiabilidad 29
Escalabilidad 30
Capacidad de mantenimiento 31
Adaptabilidad 32
Proceso iterativo 32
Planteamiento de problemas de AA 34
Tipos de tareas del AA 35
Funciones objetivo 39
El intelecto frente a los datos 42
Resumen 45
3. Fundamentos de la ingeniería de datos .......................................................... 47
Las fuentes de datos 48
Formatos de datos 51
JSON 52
Los formatos de orden por filas frente a los de orden por columnas 52
Texto frente a formato binario 55
Modelos de datos 56
Modelo relacional 57
NoSQL 61
Datos estructurados frente a datos no estructurados 64
Motores de almacenamiento de datos y procesamiento 65
Procesamiento transaccional y analítico 66
ETL: Extraer, transformar y leer 69
Modos de flujo de datos 71
Datos que pasan por bases de datos 71
Datos que pasan a través de los servicios 71
Transferencia de datos a través del transporte de datos al instante 73
El procesamiento por lotes frente al procesamiento continuo 76
Resumen 78
4. Datos de formación ........................................................................................... 81
Muestreo 82
Muestreo no probabilístico 83
Muestreo aleatorio simple 84
Muestreo estratificado 84
Muestreo ponderado 85
Muestreo de depósito 86
Muestreo de importancia 87
Etiquetado 88
Etiquetas manuales 88
Etiquetas naturales 91
Cómo afrontar la falta de etiquetas 94
Desequilibrio de clases 103
Desafíos del desequilibrio de clases 104
Cómo afrontar el desequilibrio de clases 106
Aumento de datos 115
Transformaciones simples que conservan la etiqueta 115
Perturbación 116
Síntesis de datos 118
Resumen 120
5. Creación de atributos ..................................................................................... 121
Los atributos aprendidos frente a los diseñados 121
Operaciones comunes de creación de atributos 124
Manejo de valores faltantes 125
Escalado 127
Discretización 129
Codificación de atributos categóricos 130
Cruce de atributos 133
Incrustaciones posicionales discretas y continuas 134
Fuga de datos 136
Causas comunes de la fuga de datos 138
Detección de la fuga de datos 141
Creación de atributos buenos 142
Importancia de los atributos 142
Generalización de los atributos 145
Resumen 146
6. Desarrollo de modelos y evaluación fuera de línea ..................................... 149
Desarrollo de modelos y formación 150
Evaluación de modelos de AA 150
Ensambles 156
Rastreo de experimentos y control de versiones 162
Formación distribuida 167
AutoML 172
Evaluación del modelo fuera de línea 178
Referencias 179
Métodos de evaluación 181
Resumen 188
7. Servicio de predicción y puesta en marcha de modelos ............................. 191
Mitos sobre la instalación del aprendizaje automático 193
Mito 1: solo se instalan uno o dos modelos de AA a la vez 194
Mito 2: si no hacemos algo, el rendimiento del modelo seguirá igual 195
Mito 3: no necesitará actualizar mucho los modelos 195
Mito 4: la mayoría de los ingenieros de AA no necesitan
preocuparse por la escala 196
La predicción por lotes frente a la predicción en línea 197
De la predicción por lotes a la predicción en línea 200
Unificación de la canalización por lotes y la canalización de flujo 203
Compresión del modelo 205
Factorización de bajo rango 206
Destilación del conocimiento 207
Poda 207
Cuantificación 208
AA en la nube y en el perímetro 211
Compilación y optimización de modelos para dispositivos
periféricos 213
El AA en los navegadores 221
Resumen 222
8. Cambios y monitoreo de la distribución de los datos ................................. 225
Causas de los fallos en los sistemas de AA 226
Fallos del sistema informático 227
Fallos específicos del AA 228
Cambios en la distribución de los datos 236
Tipos de cambios en la distribución de los datos 237
Cambios generales en la distribución de los datos 241
Detección de cambios en la distribución de los datos 242
Cómo afrontar los cambios en la distribución de los datos 248
Monitoreo y observabilidad 250
Métricas específicas del AA 252
Herramientas de monitoreo 256
Observabilidad 260
Resumen 262
9. Aprendizaje continuo y pruebas en producción .......................................... 265
Aprendizaje continuo 266
Reformación sin estado frente a formación con estado 267
El porqué del aprendizaje continuo 270
Desafíos del aprendizaje continuo 272
Las cuatro etapas del aprendizaje continuo 277
Frecuencia de actualización de los modelos 282
Pruebas en producción 285
Implementación en paralelo 286
Pruebas A/B 286
Versión canario 288
Experimentos intercalados 289
Bandidos 291
Resumen 295
10. Infraestructura y herramientas para MLOps ................................................. 297
El almacenamiento y los cálculos 301
Nube pública frente a centros de datos privados 304
Entorno de desarrollo 306
Configuración del entorno de desarrollo 307
Estandarización de los entornos de desarrollo 310
Del desarrollo a la producción: contenedores 312
Gestión de recursos 315
Cron, planificadores y orquestadores 316
Gestión del flujo de trabajo de la ciencia de datos 319
La plataforma del AA 324
Puesta en marcha de los modelos 325
Almacén de modelos 326
Almacén de atributos 330
Crear frente a comprar 332
Resumen 335
11. El lado humano del aprendizaje automático................................................. 337
Experiencia del usuario 337
Garantizar la coherencia de la experiencia del usuario 338
Cómo evitar las predicciones «casi correctas» 338
Fallo suave 340
Estructura de equipo 340
Colaboración en equipos multifuncionales 341
Científicos de datos de principio a fin 341
IA responsable 345
IA irresponsable: caso de estudio 346
Un entorno para la IA responsable 353
Resumen 359
12. Epílogo ............................................................................................................. 361

Comentarios

Sé el primero en comentar este libro

Artículos relacionados

Accesibilidad Digital. Curso Práctico

Fernández Casado, Pablo Enrique

Este libro constituye una guía actualizada sobre la accesibilidad digital, orientada tanto a la comprensión de la nueva Ley EAA como a su aplicación práctica en entornos reales. A lo largo de sus capítulos, el lector adquiere una visión global de la accesibilidad web y documental, entendida como un requisito técnico, legal y ético imprescindible para garantizar el acceso univer...

Nos queda 1 ejemplar

28,75 €

Competencias Digitales 360

Casas Martín, David

En un mundo cada vez más interconectado, dominar las competencias digitales no es solo una ventaja, sino una necesidad. Este manual ofrece una formación clara, práctica y actualizada para adquirir las habilidades tecnológicas que demanda la sociedad contemporánea. A lo largo de sus capítulos, el lector aprenderá a utilizar el sistema operativo, gestionar la información en la re...

Nos queda 1 ejemplar

19,13 €

Servicios en la Nube con Aws

Coronado García, Beatriz

Hoy en día, todo funciona desde la nube: guardamos fotos, trabajamos en remoto, vemos series en streaming o gestionamos empresas enteras sin saber exactamente cómo. Este libro viene a resolver esa incógnita. Diseñado con un enfoque práctico y didáctico, este libro es la guía perfecta para quienes desean entender cómo funciona el mundo cloud... sin necesidad de ser programadores...

Nos queda 1 ejemplar

26,83 €

Escalando Agilidad con Safe

Galan Carretero, Angel

Guía esencial para navegar por el complejo pero poderoso mundo del marco de trabajo ágil de Scaled Agile. Este libro no solo desglosa la teoría detrás de SAFe, sino que va más allá al proporcionar una visión práctica, rica en experiencias reales, técnicas y soluciones a los desafíos en las diferentes implementaciones que nos podemos encontrar.Comenzando con una sólida base teór...

Nos queda 1 ejemplar

20,67 €

Seo Tecnico. Aprende a Optimizar tu Web Como un Profesional

Level Communications, Human

Aunque el SEO es una disciplina del marketing digital adoptada ya masivamente por todas las empresas, son mayoría los perfiles profesionales que carecen de la base técnica necesaria para comprender y dominar los aspectos más técnicos relacionados con el posicionamiento de un sitio Web. Las crecientes exigencias de los buscadores en relación con la estructura de los contenidos, ...

Nos queda 1 ejemplar

26,44 €

Microsoft Power Bi. Transformación de Datos en Conocimiento

Arnold, Jeremey

Microsoft Power BI es una herramienta de visualización y análisis de datos de elevada potencia para los científicos de datos más exigentes, pero es también lo bastante accesible como para permitir su manejo cotidiano por parte de cualquier persona que necesite sacarles más partido a los datos. El mercado ofrece muchos libros diseñados para formar a analistas de datos profesiona...

Nos queda 1 ejemplar

35,53 €

¿Que son las Cookies?

Una cookie es un fichero que se descarga en tu ordenador al acceder a determinadas páginas web. Las cookies permiten a una página web, entre otras cosas, almacenar y recuperar información sobre los hábitos de navegación de un usuario o de su equipo, gestionar el acceso de usuarios a zonas restringidas de la web, etc. Tipo de cookies utiliza esta página web.

Cookies Técnicas

Este tipo de cookies permiten al usuario la navegación a través de una página web, plataforma o aplicación y la utilización de las diferentes opciones o servicios que en ella existan como, por ejemplo, controlar el tráfico y la comunicación de datos, identificar la sesión, acceder a partes de acceso restringido, seleccionar el idioma, o compartir contenidos a través de redes sociales.

Cookies de Análisis

Son aquéllas que posibilitan el seguimiento y análisis del comportamiento de los usuarios en nuestra página. La información recogida se utiliza para la medición de la actividad de los usuarios en la web y la elaboración de perfiles de navegación de los usuarios, con la finalidad de mejorar la web, así como los productos y servicios ofertados.

Cookies de Personalización

Estas cookies pueden ser establecidas a través de nuestro sitio por nuestros socios publicitarios. Pueden ser utilizadas por esas empresas para crear un perfil de sus intereses y mostrarle anuncios relevantes en otros sitios. No almacenan directamente información personal, sino que se basan en la identificación única de su navegador y dispositivo de Internet. Si no permite utilizar estas cookies, verá menos publicidad dirigida.