Premios Bossies 2017: Bases de datos y análisis

Seguimos con la lista de elegidos por los editores de Infoworld como los mejores proyectos Opensource. Dentro de la categoría de desarrollo de software sorprendió la presencia de productos creados por empresas que no ganan dinero desarrollando tecnología sino utilizándola y la importante participación de Microsoft, en la de machine learning vimos como Python, está dejando de ser considerado un lenguaje para principiantes y convirtiéndose en una herramienta para usos más complejos. Aquí llama la atención la cantidad de software cobijado por la Fundación Apache.

CockroachDB

Permite crear bases de datos en la nube del tamaño que necesites y hacer copias de la información usando tecnología P2P.
Enlace

MapD

Herramienta para el procesamiento de datos usando el poder de la tarjeta gráfica. Permite el procesamiento y visualización de grandes cantidades de registros en segundos.
Enlace

CrateDB

Es una base de datos SQL distribuida construida sobre una base NoSQL. Combina la familiaridad de SQL con la escalabilidad y la flexibilidad de datos de NoSQL,
Enlace

Greenplum

Es la primera plataforma de código abierto para el procesamiento paralelo de grandes cantidades de datos. Era software privativo pero ahora está apoyada por la Fundación Apache.
Enlace

Apache Spark

Motor para el procesamiento de grandes cantidades de datos usando Python, Scala, Java o R
Enlace

Apache Soir

Herramienta para crear buscadores.
Enlace

Apache Arrow

Lo que sigue es una traducción textual ya que no logro entender para que sirve este software. Se agradecen sugerencias y correcciones
“Apache Arrow es una capa de análisis en memoria columnar diseñada para acelerar grandes datos. Alberga un conjunto de representaciones canónicas en memoria de datos planos y jerárquicos junto con múltiples encuadernaciones lingüísticas para la manipulación de estructuras. También proporciona implementaciones de IPC y algoritmos comunes.”
Enlace

Apache Kudu

Permite el análisis de grandes cantidades de datos actualizadas frecuentemente.
Enlace

Apache Zeppelin

Posibilita el compartir datos entre diferentes tecnologías de análisis
Enlace

R Project

Lenguaje de programación para computación estadística y graficación.
Enlace

Apache Kafka

Aplicación para compartir datos en tiempo real.
Enlace

Cruise control

Permite gestionar mejor las características de Apache Kafka.
Enlace

JanusGraph

Es una base de datos gráfica escalable optimizada para almacenar y consultar gráficos que contienen cientos de miles de millones de vértices y bordes distribuidos en un cluster multimáquina.
Enlace

Apache TinkerPop

Framework para base de datos gráficas y análisis grafico.
Enlace

Anuncios

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s