Los límites del big data en la resolución de problemas

En Planeta Diego hemos hablado varias veces sobre el Big Data (análisis de grandes colecciones de datos para extraer información) y sobre los programas de código abierto que pueden utilizarse. Pero como toda herramienta de moda el Big Data corre el riesgo de utilizarse mal.
Leer más “Los límites del big data en la resolución de problemas”

Anuncios

R y Python, dos lenguajes de código abierto líderes en el campo de la Ciencia de Datos

¿Hace ruido un árbol que cae en el bosque si no hay nadie ahí para escuchar su caída?. La pregunta de ese proverbio sufí fue adaptada por los científicos quienes llegaron a la conclusión que no sirve de nada poder recopilar y almacenar una gran cantidad de datos si no hay una forma capaz de analizarlos e interpretarlos en tiempo real. Es por eso que surgieron campos como el Big Data y el aprendizaje automático y la utilización como lenguajes de programación para motorizarlos de dos históricos proyectos de código abierto. Python y R
Leer más “R y Python, dos lenguajes de código abierto líderes en el campo de la Ciencia de Datos”

Data Analysis with Open Source Tools A hands-on guide for programmers and data scientists por Philipp K. Janert. O’Reilly. (Reseña)

catMillones de dólares y una enorme capacidad de procesamiento  se dedican diariamente a la obtención y procesamiento de datos, sin embargo uno podría preguntarse cuando de todo ese esfuerzo obtiene los resultados adecuados.

Philipp K. Janert, físico e ingeniero de software por formación y consultor de profesión, demuestra en este libro que con un poco de inteligencia, una sólida comprensión de los instrumentos estadísticos y de las necesidades de las empresas es posible obtener la información que se necesita.

El libro no trata de la utilización de sofisticados programas solo disponibles para grandes empresas, cualquier computadora normal con Ubuntu, cualquier otra distribución linux o Windows con un intérprete Python puede ejecutarlos.

Entre los temas tocados podemos encontrar información sobre como realizar distintos tipos de gráficos y utilizar herramientas como estimaciones, regresiones y simulaciones Monte Carlo con explicaciones sobre la lógica matemática de cada una y el contexto en el que resultan útiles

No es una obra fácil para un profano, pero cualquier programador o incluso una persona con buena formación en estadística y conocimientos básicos de Python podrá sacarle provecho

Data Analysis with Open Source Tools
A hands-on guide for programmers and data scientists

por Philipp K. Janert
Editorial: O’Reilly Media
Fecha de publicación: November 2010
Páginas: 540
Precio
Ebook: $31.99
Impreso & Ebook: $43.99
Impreso: $39.99

Más información
Data Analysis with Open Source Tools
O
Página del libro en Amazon