Data Science

Meslex empieza su preparación para aplicar la Ciencia de los Datos en Ecuador.

* Big data frameworks (Hadoop, Spark)

Empezamos una serie de artículos para explicar a nuestros lectores que es la ciencia de los datos, su aplicación, y los requerimientos para ser un verdadero científico de datos. Wikipedia nos dice lo siguiente: “la ciencia de datos es un campo interdisciplinario que involucra métodos científicos, procesos y sistemas para extraer conocimiento o un mejor entendimiento de datos en sus diferentes formas, ya sea estructurados o no estructurados, lo cual es una continuación de algunos campos de análisis de datos como la estadística, la minería de datos, el aprendizaje automático y la analítica predictiva”.

Ya que tiene la palabra ciencia en su nombre, habrá que considerar la definición de ciencia y de método científico. De acuerdo con esto, data science no se trata solo de los métodos prácticos o empíricos, sino que necesita verdaderos fundamentos científicos.

Para definir la ciencia de los datos es interesante diferenciar los conceptos datos e información. Los datos son un conjunto sin procesar o sin organizar de cosas que necesitan procesarse para tener un significado. Mientras que hablamos de información cuando estos datos han sido procesados, organizados, estructurados o presentados en un contexto, para generar alguna utilidad. En base a esto, podemos definir a la ciencia de los datos, y junto a ella, a la ciencia de la información.

En la ciencia de datos, visto desde una óptica simple podemos encontrar dos lados que no estaban totalmente conectados, pero, en este nuevo mundo acelerado y rebosando de tecnología, tienen que fusionarse:

La Estadística y las Matemáticas: Nos sirve para formular modelos adecuados.

La Informática: es quien realiza la conexión entre modelos y datos, con el fin de conseguir un resultado.

Uno de los grandes errores que se encuentra uno tratando de definir la ciencia de los datos es relacionarla directamente con el big data. Realmente no es necesario tratar mucha información para realizar data science. La ciencia de los datos puede tratar cien, un millón o billones de registros.

Para considerarse un Científico de Datos, es necesario comprender o tener algún conocimiento sobre varios tópicos y herramientas, como los siguientes:

* Álgebra lineal

* Sistemas no lineales

* Geometría analítica

* Mejoramiento

* Cálculo

* Estadística

* Lenguajes de programación (R, Python, otros)

* Software: Excel, SPSS, etc.

* Plataformas generales como Azure machine learning,

* Google cloud machine learning,

* Visualización de datos: Power Bi, Tableau, R / Python

* Aprendizaje automático (aprendizaje supervisado, no supervisado y de refuerzo)

* Big data

* Conocimiento de Hardware


Article Number: 224
Read. 1958 Time.
Rate this article.
Thank you for your vote.

This article was written by:

Meslex Business Solutions

Contact Me.

  • Email
  • Email
View More. Close.

article.Autor.author_review

Other articles written by this Author.