pentaho-esp
det2562x_oct18

Preparación de datos analíticos

Imagine poder acceder a la información analítica desde cualquier lugar del proceso de transformación de datos, no solo después de que los datos se hayan preparado y exportado a una herramienta de análisis de negocio. Saque ventaja de la única plataforma en el mercado que tiene análisis en preparación de datos sin necesidad de cambiar de una a otra herramienta, permitiendo acortar el ciclo de los datos a los conocimientos.

  • Incorporando análisis a la preparación de datos: Los desarrolladores de ETL y el personal de preparación de datos pueden ver el análisis mientras hacen cuadros, gráficos, visualizaciones o análisis libre en cualquier paso del proceso de preparación de datos.
  • Comparta análisis durante la preparación de datos: Publique fuentes de datos para el negocio mientras prepara los datos con la habilidad de compartir fuentes de datos inmediatamente; el departamento de tecnología puede colaborar mejor con el negocio para una rápida e interactiva forma de llegar al análisis correcto.

Nueva funcionalidades SPARK

Las organizaciones están adoptando Spark para dar una solución rápida, flexible al procesamiento y análisis de Big Data, pero dado la escases de desarrolladores puede ser difícil maximizar el valor de Spark en producción.

Estas actualizaciones ayudan a extender los beneficios de Spark a una audiencia más grande, al mismo tiempo que permite a los grupos de trabajo utilizar Spark en un rango mayor de posibilidades de negocio.

  • Spark a través de SQL: Acceda a SQL en Spark como fuente de datos dentro de Pentaho Data Integrator, facilitando a los desarrolladores de ETL y analistas consultar los datos de Spark e integrarlos con otros datos para su preparación y análisis.
  • Orquestación Spark extendida: Coordine y programe las aplicaciones de Spark que usan una variedad más amplia de librerías incluyendo Spark Streaming y Spark SQL, así como SparkML y Spark MLlib para el aprendizaje automático. Además Pentaho ahora incluye la orquestación de Spark para aplicaciones escritas en Python.
7-0-lp-spark-image-2
hadoop-slide

Seguridad Hadoop expandida

Las herramientas de desarrollo visual para Big Data deben estar de acuerdo a los esquemas de seguridad para proteger datos claves de las corporaciones de intrusos. Facilitar el gobierno de grandes datos y reducir el riesgo con integración ampliada de Pentaho bajo tecnologías de seguridad Hadoop.

  • Integración de Kerberos expandido: Promueva la integración de datos seguros para más usuarios con capacidad actualizada que permite que múltiples usuarios de Pentaho acceder a clústeres Cloudera habilitados para Kerberos como múltiples usuarios de Hadoop.
  • Integración Sentry: PDI trabaja con Sentry para acceso en base a roles a específicos sets de datos de Hadoop permitiendo trazabilidad granular y aplicación de reglas de autorización de roles de los datos de la corporación.

Inyección mejorada de los metadatos

Los equipos de TI pasan innumerables horas de trabajo de codificación de la ingesta y el procesamiento para incorporar una amplia variedad de grandes fuentes de datos. Aumente la productividad de TI al crear muchos procesos de migración de datos y de integración automatizando y escalando fuentes de grandes datos con inyección de metadatos.

  • La inyección de metadatos se amplía a más pasos: Permite a los equipos de TI generar automáticamente una variedad más amplia de transformaciones de datos en tiempo de ejecución con soporte de inyección de metadatos para más de 30 pasos PDI adicionales. Los nuevos pasos para la inyección incluyen operaciones relacionadas con Hadoop, Hbase, JSON, XML, Vertica, Greenplum y otras fuentes de grandes datos.
7-0-lp-metadata-image-2
7-0-lp-enhancements-2_0

Mejoras adicionales

Pentaho 7.0 incluye una serie de mejoras adicionales para garantizar su inversión en el futuro y soportar un mundo de grandes datos combinados.

  • Soporte para Kafka: Envía datos y recibe datos de Kafka, la popular tecnología de colas de mensajería aprovechada en grandes datos y IoT.
  • Soporte para Avro y Parquet: Archivos de salida en Avro y Parquet, dos formatos para almacenar datos en Hadoop en grandes casos de uso de datos.
  • Configuración, implementación y administración simplificadas: configuración, implementación y administración más sencilla y rápida de un servidor unificado de integración de datos y análisis de negocios para dar soporte a los entornos de desarrollo y producción de Pentaho.

Contacto por Pentaho