1000 (millones) de gracias

Hola, ¡¡¡Héroes del Dato!!!

En apenas un año desde que lancé mi primer curso, ¡¡¡no hemos parado de crecer!!! Somos a día de hoy 1.042 alumnos de 29 países.

Para celebrarlo, he sacado un nuevo cupón, 1KGRACIAS, que bien podrían ser un millón de gracias, en el que os ofrezco mis cursos al mínimo posible que me permite Udemy.

Además, podrás aprovechar los nuevos contenidos (la App de reconocimiento de números) que hay en dos de mis cursos:

  • Aplicaciones Big Data para Data Scientist con R y Shiny.
  • Iniciación a Computer Vision con Machine y Deep Learning en R

Y atentos, porque voy a lanzar un concurso en el que podréis ganar un pack de libros de Ciencias de los Datos.

Mis cursos son:

  • Aplicaciones Big Data para Data Scientist con R y Shiny: Para ser un buen Data Scientist, experto en Big Data o Ingeniero de Machine Learning, hay que ser capaz de comunicar bien la información y los resultados obtenidos. En este curso aprenderás a utilizar Shiny, una librería de R que te permite realizar aplicaciones web de una forma rápida y sencilla, integrando R de forma nativa. Veremos los principales elementos y haremos una aplicación completa desde cero paso a paso.
Aplicaciones Big Data para Data Scientist con R y Shiny
Aplicaciones Big Data para Data Scientist con R y Shiny

El enlace del cupón:

https://www.udemy.com/aplicaciones-big-data-para-data-scientist-con-r-y-shiny/?couponCode=1KGRACIAS

  • Introducción a Data Scientist programando en R: La profesión del futuro, ya está de moda en el presente. Con este curso aprenderás los fundamentos de R y conocerás todos los aspectos de esta profesión: adquisición, exploración, tratamiento y visualización de resultados. Y para terminar el curso, una aplicación de análisis de sentimientos de los tweets de películas que podrás ver en formato web.

Introducción a Data Scientist programando en R
Introducción a Data Scientist programando en R

El enlace del cupón:

https://www.udemy.com/introduccion-a-data-scientist-programando-en-r/?couponCode=1KGRACIAS

  • Introducción a Computer Vision con Machine y Deep Learning con R: Un completo curso para ver como funciona la visión por computador. Utilizando el famoso set de datos MNIST, que contiene imágenes de números del 0 al 9 escritos a mano, realizaremos diversos sistemas de clasificación, para comprobar su funcionamiento, y ver cómo se comportan. Utilizaremos un montón de algoritmos de Machine Learning, como Support Vector Machine, K Nearest Neighbours, Naïve Bayes, etc. Varias formas de reducir la dimensionalidad, y probaremos dos plataformas para aprendizaje electrónico, H2O y el famoso TensorFlow de Google. Todo con explicaciones de cada método y algoritmo, y explicación práctica en R.
Introducción a Computer Vision con Machine y Deep Learning con R
Introducción a Computer Vision con Machine y Deep Learning con R

El enlace del cupón:

https://www.udemy.com/iniciacion-a-computer-vision-con-machine-deep-learning-en-r/?couponCode=1KGRACIAS

¡Regálatelo a ti mismo!  Siéntete libre para compartirlo con tus amistades, familiares o con quien creas que le pueda interesar o convenir. Muchas gracias por apoyar mis cursos. ¡¡¡Juntos hacemos una gran comunidad! ¡Nos vemos en las clases!!!

Héroes del Dato en el Congreso Investiga con Datos

Hola, ¡Héroes del Dato!

Me llena de orgullo y satisfacción 🙂 anunciaros que soy uno de los ponentes del Cogreso ​Investiga con Datos 2018.

Durante 3 días enteros, grandes expertos en análisis de datos, investigación y desarrollo profesional van a compartir contigo ejemplos de análisis de datos, tutoriales de herramientas, estrategias para investigar mejor y estrategias para aumentar tu impacto como científico. Este congreso es diferente a lo que estás acostumbrado. El formato son charlas con un tono cercano y riguroso. Encontrarás ejemplos, experiencias en investigación, consejos para aprender y desarrollarte profesional en el mundo de la Ciencia de los Datos. Desde el 16 y hasta el 18 de julio, podrás disfrutar de las charlas de +20 expertos y compartan contigo un montón de conocimiento para que te ayuden a avanzar.

Cartel Congreso Investiga con Datos
Cartel Congreso Investiga con Datos

Las 4 temáticas del congreso son:

  • Ejemplos reales de análisis de datos – verás ejemplos de aplicación explicados por expertos
  • Consejos de aprendizaje – los mimos ponentes de darán sus trucos para aprender y avanzar en sus proyectos
  • Herramientas de análisis de datos – tutoriales y consejos de herramientas (softwares)
  • Desarrollo profesional – estrategias y tácticas para avanzar en tu carrera científica e investigadora

​Mi charla trata sobre la visualización de datos y la realización de aplicaciones para el reporte de datos. Se publicará el miércoles 18-julio a las 10:00.

Selección de libros para Data Scientist ¡con descuentos!
[amazon_link asins=’2409008380,1491952962,1633430278,0692434879,1548871125,B011YT2G6Q,0134116542,B00M3JJP2A’ template=’ProductCarousel’ store=’heroesdeldato-21′ marketplace=’ES’ link_id=’a252d0e9-7eca-11e8-9c04-9f6c94bb2a4b’]

En ella damos un paseo por diversas aplicaciones realizadas para distintos proyecto, y hablamos sobre la importancia de la visualización de datos en 2 momentos dentro del flujo de un análisis de datos:

  • El análisis exploratorio de los datos
  • El análisis de los resultados y la presentación de los mismos.
Héroes del Dato en Investiga con Datos

Por si todo esto fuera poco, el summit terminará con un workshop práctico para poner en marcha en tu propio proyecto un método de aprendizaje y aplicación del análisis de datos en tus proyectos. De esta manera tendrás mucho más claro cómo aprender a transformar los datos en conocimiento para que puedas presentar proyectos a la comunidad científica con mayor impacto.

Selección de los mejores ordenadores para Data Scientist ¡con descuentos!
[amazon_link asins=’B071JYGB16,B072K5VPNF,B0721BNGW7,B079NMN6CR,B06ZXZH1NC,B01N8QXK5J,B0711W1ZJQ,B016AUUZEY,B072K5Q1YK,B01MT5HVUL’ template=’ProductCarousel’ store=’heroesdeldato-21′ marketplace=’ES’ link_id=’4ba1e09e-7ecf-11e8-817b-6b66ad8c8f84′]

Lo mejor de todo es que este congreso es TOTALMENTE GRATIS. Sólo tienes que registrarte en:

InvestigaconDatos.com

Las charlas se irán publicando durante los días 16 a 18 de julio. Si no puedes estar para verlas en directo, dispones de 24 horas para ver esa charla a partir del momento de su publicación.

Si no vas a estar en ese momento disponible, o durante esos días, o quieres poder acceder en otro momento a los contenidos, puedes adquirir un acceso permanente.

El precio de este pase es de 54€, pero lo puedes conseguir por un precio especial (17€) hasta el inicio del congreso:

Pase Completo

Muchas gracias a Jordi Ollé, de conceptosclaros.com por crear este Congreso y por invitarme a participar.

Veranito, veranito, sol, playa y un cursito.

Veranito Cursos

¡Muchísimas gracias por la gran acogida que ha tenido mi nuevo curso de aplicaciones Big Data Science con Shiny!!!

La verdad es que da gusto trabajar en un curso y meterle tantas horas con este tipo de respuesta. Espero que los que ya lo tenéis, lo estéis disfrutando tanto o más de lo que lo disfruté yo al realizarlo.

Selección de los mejores ordenadores para Data Scientist ¡con descuentos!
[amazon_link asins=’B071JYGB16,B072K5VPNF,B0721BNGW7,B079NMN6CR,B06ZXZH1NC,B01N8QXK5J,B0711W1ZJQ,B016AUUZEY,B072K5Q1YK,B01MT5HVUL’ template=’ProductCarousel’ store=’heroesdeldato-21′ marketplace=’ES’ link_id=’4ba1e09e-7ecf-11e8-817b-6b66ad8c8f84′]

Me estoy dando unos días de descanso pero en seguida salto a preparar mi siguiente curso: Una aplicación completa para predecir apuestas deportivas, centradas en el fútbol y tomando como ejemplo la Liga Española de Fútbol analizando los resultados obtenidos en jornadas anteriores y en la aparición de las cuentas oficiales de los equipos en Twitter.

En este nuevo curso aprenderemos:

  • Cómo hacer scrapping de una web (para tener las clasificaciones y los partidos pendientes)
  • Cómo funciona y desarrollar la descarga continua de tweets utilizando la API pública de Twitter
  • Cómo almacenar esa información en nuestro disco duro o en S3 de Amazon
  • Aprenderemos a montar un servidor RStudio con ShinyServer integrado en un servidor de Amazon (gratuito el primer año) donde podremos correr nuestra aplicación sin tener nuestro ordenador continuamente funcionando.
  • Probaremos diferentes modelos de predicción para encontrar el mejor resultado con todos los datos que obtendremos.
  • Automatizaremos la recogida de datos y los cálculos de las predicciones mediante la librería cronR de R.
  • Y realizaremos una aplicación en Shiny para visualizar los resultados desde una web.
Selección de libros para Data Scientist ¡con descuentos!
[amazon_link asins=’2409008380,1491952962,1633430278,0692434879,1548871125,B011YT2G6Q,0134116542,B00M3JJP2A’ template=’ProductCarousel’ store=’heroesdeldato-21′ marketplace=’ES’ link_id=’a252d0e9-7eca-11e8-9c04-9f6c94bb2a4b’]

Estoy muy emocionado con este curso, y espero tenerlo preparado hacia el final del verano. ¿Qué os parece?

Escribirme vuestros comentarios a través de mis contactos sociales.

Y seguimos con las promociones de mis cursos. Aprovechando el lanzamiento del nuevo curso, os ofrezco mis 3 cursos a un precio especial, el mínimo que me permite Udemy, para que aprendáis sin gastar mucho.

Si cogéis los 3 cursos con esta oferta, por menos de un tercio del valor de un único curso, os llevaríais 3. Casi 50 horas de cursos de Data Science y Machine Learning.

Estos cursos son:

  • Aplicaciones Big Data para Data Scientist con R y Shiny: Para ser un buen Data Scientist, experto en Big Data o Ingeniero de Machine Learning, hay que ser capaz de comunicar bien la información y los resultados obtenidos. En este curso aprenderás a utilizar Shiny, una librería de R que te permite realizar aplicaciones web de una forma rápida y sencilla, integrando R de forma nativa. Veremos los principales elementos y haremos una aplicación completa desde cero paso a paso.
Aplicaciones Big Data para Data Scientist con R y Shiny
Aplicaciones Big Data para Data Scientist con R y Shiny

El enlace del cupón:

https://www.udemy.com/aplicaciones-big-data-para-data-scientist-con-r-y-shiny/?couponCode=LANZAMIENTO

  • Introducción a Data Scientist programando en R: La profesión del futuro, ya está de moda en el presente. Con este curso aprenderás los fundamentos de R y conocerás todos los aspectos de esta profesión: adquisición, exploración, tratamiento y visualización de resultados. Y para terminar el curso, una aplicación de análisis de sentimientos de los tweets de películas que podrás ver en formato web.
Introducción a Data Scientist programando en R

El enlace del cupón:

https://www.udemy.com/introduccion-a-data-scientist-programando-en-r/?couponCode=LANZAMIENTO_SHINY

  • Introducción a Computer Vision con Machine y Deep Learning con R: Un completo curso para ver como funciona la visión por computador. Utilizando el famoso set de datos MNIST, que contiene imágenes de números del 0 al 9 escritos a mano, realizaremos diversos sistemas de clasificación, para comprobar su funcionamiento, y ver cómo se comportan. Utilizaremos un montón de algoritmos de Machine Learning, como Support Vector Machine, K Nearest Neighbours, Naïve Bayes, etc. Varias formas de reducir la dimensionalidad, y probaremos dos plataformas para aprendizaje electrónico, H2O y el famoso TensorFlow de Google. Todo con explicaciones de cada método y algoritmo, y explicación práctica en R.
Iniciación a Computer Vision con Machine y Deep Learning en R

El enlace del cupón:

https://www.udemy.com/iniciacion-a-computer-vision-con-machine-deep-learning-en-r/?couponCode=LANZAMIENTO

¡Regálatelo a ti mismo!  Siéntete libre para compartirlo con tus amistades, familiares o con quien creas que le pueda interesar o convenir. Muchas gracias por apoyar mis cursos. ¡¡¡Juntos hacemos una gran comunidad! ¡Nos vemos en las clases!

¿Qué es la Ciencia de los Datos?

Una pregunta que me hace mucho es ¿Qué es la Ciencia de los Datos? Intentemos resolver esta pregunta con varios conceptos.

QUÉ ES:

El término se utiliza mucho últimamente, es la palabra de moda que se utilizara para describirlo todo.

La descripción de Wikipedia es:  La ciencia de datos es un campo interdisciplinario que involucra métodos científicos, procesos y sistemas para extraer conocimiento o un mejor entendimiento de datos en sus diferentes formas, ya sea estructurados o no estructurados,​ lo cual es una continuación de algunos campos de análisis de datos como la estadística, la minería de datos, el aprendizaje automático y la analítica predictiva.

Esta definición, aunque formalmente correcta, no nos da mucha información sobre lo que es realmente la Ciencia de los Datos.

Uno de los grandes errores que se encuentra uno tratando de definir la Ciencia de los Datos es relacionarla directamente con el Big Data. Realmente no es necesario tratar mucha información para realizar Data Science, aunque se pueda. La Ciencia de los Datos puede tratar cien, un millón o billones de registros.

Small Data

Ya que tiene la palabra ciencia en su nombre, habrá que considerar la definición de Ciencia y de Método Científico. De acuerdo con esto, Data Science no se trata solo de los métodos prácticos o empíricos, sino que necesita fundamentos científicos.

Método Científico

Para definir la Ciencia de los Datos es interesante diferenciar los conceptos datos e información. Los datos son un conjunto sin procesar o sin organizar de cosas que necesitan procesarse para tener un significado.
La información es cuando los datos han sido procesados, organizados, estructurados o presentados en un contexto dado para hacerlo útil
En base a esto, tendríamos ciencia de datos y ciencia de la información. En este momento, las personas tienen un prejuicio para hablar sobre ciencia de datos, incluida la ciencia de la información.

Datos vs Información

El término se está usando en muchos campos o mercados que hasta ahora usaban otros términos, como Análisis de Datos, Business Intellgence, etc:

  • Estadística / Matemáticas
  • Análisis de negocio
  • Inteligencia de mercado
  • Consultoría estratégica
  • Muchos otros…
  • La parte más loca es que ves profesionales de estas áreas actualizando sus hojas de vida con algo así como «trabajé con Data Science …»
Viejos Científicos de Datos?

La creación de ciencia de datos de una manera simple. Dos lados que no estaban totalmente conectados, pero que, con el nuevo mundo acelerado y tecnológico, tendrán que fusionarse:

  1. Estadísticas / Matemáticas: formule modelos adecuados para generar ideas.
  2. Informática: haga el puente entre los modelos y los datos en un tiempo factible para llegar con el resultado.

Temas / herramientas que una persona necesita comprender o tener algún conocimiento cuando trabaja con Data Science:

  • Álgebra lineal
  • Sistemas no lineales
  • Geometría analítica
  • Mejoramiento
  • Cálculo
  • Estadística
  • Lenguaje de programación (R, Python, SAS)
  • Softwares: Excel, SPSS de IBM
  • Plataformas generales: Watson Anlytics de IBM, Azure Machine Learning,
  • Google Cloud machine learning,
  • Visualización de datos: Power BI, Tableau, R / Python usando plotly / ggplot
  • Aprendizaje automático (aprendizaje supervisado, no supervisado y de refuerzo)
  • Big Data
  • Big Data Frameworks (Hadoop y Spark)
  • Hardware (CPU, GPU, TPU, FPGA, ASIC)
Caja de Herramientas

Una imagen vale más que mil palabras: Diagrama de Venn de Data Science de Drew ConwayLa experiencia sustantiva (o conocimiento del dominio) es el conocimiento específico del área en la que está aplicando Data Science. Para saber más acerca de la falta de experiencia sustantiva en la ciencia de datos ver el siguiente enlace.

Diagrama Venn Data Science

QUÉ NO ES:

Machine Learning no es una rama de la ciencia de datos. El aprendizaje automático se originó a partir de la Inteligencia Artificial. La ciencia de datos solo utiliza el Machine Learning como una herramienta. La razón es que produce resultados asombrosos y autónomos para tareas específicas

Machine Learning

No es la salvación de las empresas que nunca midieron nada y ahora quieren obtener información de sus datos. «Basura adentro, basura afuera» La ciencia de datos será tan buena como los datos generados en los años siguientes.

Basura dentro = Basura fuera

Desde luego, Ciencia de los Datos no es presentar datos usando algunos gráficos de Excel sin ninguna información sobre los datos.

No Excel

 

Desde Héroes del Dato esperamos que este artículo haya arrojado luz a la complicada tarea de definir la Ciencia de los Datos.

 

Ciencia de los Datos
Ciencia de los Datos