SCIO: como instalar la consola en Mac OSX

Si hay una herramienta que ha mejorado mi productividad en los últimos 10 años han sido las consolas interactivas (REPL). La primera vez que use esta tecnología y le saqué mucho provecho qué cuando empecé a desarrollar sitios webs con ruby on rails.

La consola me vino genial no solo en mejorar mi curva de aprendizaje, si no con el desarrollo día a día.

La gente de spotify ha creado una consola REPL para poder usar interactivamente Scio y desarrollar más rápidamente proyectos que usen apache beam.

Las instrucciones para instalar la REPL en tu mac son muy sencillas si usas homebrew:

brew tap spotify/public
brew install scio
scio-repl

La primera linea instala el tap de spotify con las herramientas para mac/homebrew la gente de spotify y con la segunda se instala la versión compilada de scio REPL.

Podéis encontrar algunos ejemplos de uso de Scio/REPL en la página de GitHub del proyecto Scio.

 

 

Social Share Counters

Comments

Google libera el embedding Projector

Esta herramienta de google para tensorflow es fundamental para poder entender la información que se genera en los distintos procesos. Nos ayuda a comprender que está pasando dentro de nuestras arquitecturas deep learning.

Además embedding projector se ofrece como servicio online y no te fuerza a que se tenga que instalar en tu máquina local.

Merece la pena echarle un vistazo.

 

 

 

Social Share Counters

Comments

Mis proyectos favoritos para el 2017

Como ya sabéis en los últimos tiempos he estado promocionando la arquitectura kappa y prácticamente todos los proyectos en los que he estado implicado, se han desarrollado usando esta arquitectura.

Apache Beam

Apache Beam

Desde hace un tiempo he empezado a estudiar y usar Apache Beam. El punto de inflexión ha sido las charlas que vi durante la apachecon big data europe que se celebró en Sevilla y en la que di una charla sobre arquitectura kappa. La conversación que tuve con Sergio Fernandez (@wikier) fue decisiva. Cuando un crack como Sergio te cuenta como está trabajando con Apache Beam y por es una tecnología es killer es muy difícil no investigar más 😉

En resumen, Apache Beam es un framework para crear arquitecturas que trabajen con datos muy al estilo de la arquitectura kappa. Si hubiera que definir una sola característica por la que es interesante sería la capacidad de abstracción en la definición de la arquitectura con un DAG que se puede ejecutar contra distintos frameworks: Apache Spark, Storm, Flink, Google Dataflow o con un Local Runner en tu máquina.

Ahora mismo está en el incubator de la fundación apache y debe estar a punto de ser aprobado para que se convierta en un proyecto oficial. Ya hay empresas usándolo en producción y las pruebas que he hecho no me han dado ningún problema.

También hay una mala y una buena noticia. La mala es que apache beam esta escrito en java y se programa en java. No soy un fan de java y menos de como resuelven las API/SDKs. La buena noticia es que la gente de spotify que usa a tope Apache Beam se ha programado un binding para scala. Además son unos cracks y se nota en lo bien que han resuelto el binding. Han conseguido DSL funcional, bello y casi un clon de spark/cascading. Vamos que no pienso usar java y si scala con el proyecto Scio que es como se llama el proyecto de spotify. Que por cierto tiene licencia apache y está en proceso de merging con Apache Beam.

No son los únicos dos proyectos que incluyo para el 2017,  ya os contaré más en otros posts 😉

 

Social Share Counters

Comments

Research Blog: Zero-Shot Translation with Google’s Multilingual Neural Machine Translation System

https://research.googleblog.com/2016/11/zero-shot-translation-with-googles.html?m=1
¿Ha aprendido Google translate a traducir lenguajes en los que no estaba entrenado? 

Social Share Counters

Comments

Ya está anunciado el siguiente meetup de machine learning spain

Machine Learning Spain XV

Auditorio Google Campus Madrid
Calle de Manzanares, 1, Madrid (edit map)

¡Hola! Ya tenemos fecha para el siguiente meetup, será el día 14 de noviembre (lunes) a las 18:30h en Campus Madrid. Esa semana habrá bastantes eventos relacionados con los datos en Madrid y Barcelona, esperamos que sean muy útiles.

La agenda será variada y completa.

18:30 – Acceso al auditorio. Calle de Manzanares, 1.

18:35 – “Programación Paralela en Big Data: Una aplicación sobre Series Temporales”.

Con la generación de más cantidad de datos cada día se hace necesaria la programación de los algoritmos de una forma paralelizable para reducir el tiempo de proceso de los mismos. Así, la presentación incluirá la base de cómo paralelizar sobre distintas plataformas y librerías como Spark y Dask.

Ponente:
Juan Luis Rivero. Profesional de la consultoría, desarrollo e integración de soluciones con más de 25 años de experiencia en multinacionales. Ha dedicado parte de su carrera al diseño e implantación de algoritmos y analítica de datos en el sector de Telecom.

19:15 – “Aprendizaje de comportamientos”.

Uno de los principales problemas de las aplicaciones modernas es conocer de forma precisa cómo usan los usuarios nuestra aplicación. Es decir, saber a que horas se utilizan unas funcionalidades o incluso conocer cómo un usuario ha sido capaz de llegar a una de nuestras nuevas funcionalidades. En esta charla describiremos una posible manera de obtener las políticas de comportamiento de nuestros usuarios y conocer cómo se mueven por nuestra aplicación. Describiremos cómo podemos obtener esta información (Colas de mensajes), almacenarla y utilizarla con el fin de intentar aprender o definir comportamientos comunes entre nuestros usuarios. Esta información puede servir para mejorar nuestra aplicación, su funcionalidad o para construir sistemas automáticos que realicen ciertas tareas por ellos.
Ponente:
Moisés Martínez. PhD en Inteligencia Artificial por la Universidad Carlos III de Madrid (especializado en Planificación automática, Aprendizaje automático y Sistemas de control). Investigador, mentor, orgulloso organizador de T3chFest y amante de la tecnología. Actualmente trabaja como Lead Data Scientist en beBee – affinity networking.

20:00 – “Convirtiendo Machine Learning en Negocio (Desde el BigData hasta la generación de servicios en el Real Estate)”.

El sector inmobiliario está a punto de sufrir un cambio disruptivo derivado del nuevo contexto económico, social y tecnológico que otros sectores ya han sufrido. En esta sesión se realizará un recorrido por la aplicación del Machine Learning a este sector y su aporte en los diferentes fragmentos de la cadena de valor del mismo.
Ponente:
Carlos Olmos de Frutos.Es fundador y director de uDA. Ha desarrollado su carrera en el sector del Real Estate donde ha planificado y liderado proyectos de desarrollo e inversión de hasta 14M €. Desde el 2011 lidera diversos proyectos que integran las Smart Cities y el BigData en soluciones de inversión inmobiliaria, integrando equipos multidisciplanares para la creación de productos y servicios con modelos de negocio asociados viables desde las primeras fases. Es arquitecto urbanista por la UPM y por la universidad Paris Val-de-Marne.

20:45 – ¡Cervezas y networking!

Tomaremos unas cervezas y podremos seguir charlando sobre los temas de interés que salgan en esta jornada.

Nos vemos pronto, el 14 de noviembre en Campus Madrid.

Social Share Counters

Comments

Nuevo curso online de Scala

He encontrado vía @almo este curso de scala que está muy bien.

Si quieres empezar con scala o quieres reforzar algunos temas es muy recomendable.

 

 

 

 

Social Share Counters

Comments

El próximo Machine Learning Meetup Spain será el 5 de octubre

Tendremos un par de charlas muy interesantes:
* La primera de como Kaggle te puede cambiar la vida. Si a estas alturas todavía no conoces Kaggle te está faltando tiempo para hacerlo!!!

* La segunda una de las mejores introducciones a TensorFlow que he visto de la mano de Gema Parreño (que por cierto ya forma parte del equipo de científicos de datos de Open sistemas).

Y como siempre habrá cervezas antes, durante y después del evento. Patrocinadas por Open Sistemas 😉

Nos vemos el día 5 de octubre en las instalaciones de liferay que en este caso nos ceden las instalaciones.

Más información en la Página oficial de Machine Learning Spain Meetup

 

 

Social Share Counters

Comments

MThe Scala Effect: por que aprender scala

Este artículo de Chris mckinlay me parece una lectura obligada

http://flip.it/zrPYW

Social Share Counters

Comments

Strategic Scala Style: Practical Type Safety

Strategic Scala Style: uso práctico de los tipos seguros de scala

http://flip.it/hESkG

Social Share Counters

Comments

Why I Chose Scala Over Java – DZone Java

Lo repito en todas mis charlas
Estas son las razones por que escoger Scala en este caso contra Java

https://dzone.com/articles/why-i-chose-scala-over-java

Social Share Counters

Comments

« Previous entries