En las empresas para implementar modelos de Ciencia de Datos SE USAN ECOSISTEMAS PROFESIONALES, por ejemplo, el de AWS.
Si quieres usar la I.A. en escenarios reales empresariales, PRIMERO TIENES QUE ENTENDER EL MACHINE LEARNING, en particular los modelos de Linear Regression, Decision Trees, Random Forests, XGBoost y K-Means, esto te ayudará a entender cómo funcionan los algoritmos iterativos, estadísticos y basados en ecuaciones.
Una vez que entiendas el Machine Learning, tendrás la capacidad de entender modelos más avanzados que están especializados en descubrir patrones mucho más complejos, deberás CONSTRUIR REDES NEURONALES de predicción numérica, binarias y categóricas con métodos de Deep Learning, validación cruzada e hiper-parametrización. También entender cómo se define la arquitectura de una red neuronal, cómo se construye capa a capa y cómo se utilizan las funciones de activación dependiendo de la necesidad de negocio.
En la empresa se utilizan los modelos de Machine Learning para hacer un análsis rápido en 2 ó 3 días, mientras que se usan los modelos de DEEP LEARNING PARA HACER ANÁLISIS MÁS DETALLADOS, pero en 2 ó 3 semanas, ya que computacionalmente son más pesados.
Es fundamental que sepas cómo construir Redes Neuronales, ya que SON LA BASE DE LA INTELIGENCIA ARTIFICIAL, de ellas se derivan las Redes Convolucionales y las Redes Recurrentes, que te permiten implementar modelos de Visión Computacional y Procesamiento del Lenguaje Natural. Claro que en las empresas no crean modelos de I.A. desde cero, sino que se usan Inteligencias Artificiales creadas por grandes empresas como Amazon, aquí es donde las empresas usan ECOSISTEMAS PROFESIONALES COMO EL DE AWS, la nube de mayor crecimiento en el mundo.
Por último, debes aprender a usar modelos más avanzados de I.A. generativa tipo ChatGPT, como lo es TITAN TEXT, el equivalente de ChatGPT en AWS, cómo funcionan las arquitectura Transformers sobre infraestructura de Big Data y cómo implementar la arquitectura RAG para LLMs con Langchain.
Si sabes como implementar todo esto en la empresa, puedes considerarte un perfil top en la Ciencia de Datos al día de hoy, si quieres comenzar este camino el ÚNICO REQUISITO es conocer la sintaxis básica de cualquier lenguaje de programación.
¿CÓMO PUEDES APRENDER TODO ESTO?