4 Proyectos IA Opensource que deberías mirar ¡Y probar!
No te quedes abajo de este viaje. Revisa estos proyectos de IA opensource y empieza a programar con ejemplos en Google Colab
Las inteligencias artificiales están acá para quedarse, y están viajando a una velocidad que nadie esperaba. Yo aún me sorprendo cuando pienso que ChatGPT y con su interfaz llevan menos de un año con nosotros.
Para que no te quedes fuera, te compartimos 4 repositorios de proyectos de IA Opensource con ejemplos en Google Colab para que los pruebes y los uses en tu siguiente proyecto.
Esta publicación es para ti si:
- Usas Python y quieres entrar al mundo de las IA
- Tienes un proyecto basado en IA en mente y necesitas herramientas
- Tienes ansiedad por el futuro que traen las IA y no te quieres quedar fuera
🦙 Llama 2
Llama 2 es la alternativa Opensource a GPT y ChatGPT. Es un Large Language Model (LLM) de uso gratuito para investigación y uso comercial desarrollado por Meta.
Este modelo lo liberaron con una licencia Opensource con una cláusula especial. Si eres una empresa con más de 700 millones de usuarios activos, tienes que pedirle permiso a Meta para usarlo.
Meta quiere que proteger sus intereses frente a grandes empresas.
¿Es mejor que ChatGPT? La verdad es que es comparable a GPT3, pero no alcanza el nivel de GPT4. Sobretodo tiene un bajo rendimiento en tareas de generación de código.
El modelo Llama 2 tiene una ventana de contexto de 4096 tokens, y viene en 3 tamaños:
- El pequeño de 7 billones de parámetros que puedes ejecutar localmente en GPU
- El intermedio de 13 billones de parámetros
- El grande, con mejores resultados, de 70 billones de parámetros
Recursos útiles:
- Website del proyecto Llama 2
- Documentación en Huggin Face
- Google Colab con prueba Llama 2 7B + Fine tuning
💬 Whisper
Esta herramienta, impulsada por un transformer encoder-decoder, transcribe voces a texto hasta en 90 idiomas.
Según la página del proyecto, "Whisper es un sistema de reconocimiento automático de voz (ASR) entrenado en 680,000 horas de datos supervisados multilingües y multitárea recopilados de la web".
El programa no solo es capaz de convertir a texto lo que escucha, sino también traducirlo con resultados bastante buenos, incluso reconociendo puntuación.
Recursos útiles:
- Presentación de whisper en el blog de OpenAI
- Documentación en Hugging Face
- Google Colab con prueba de whisper en audios de LibriSpeech
- Repositorio de WhisperX, 70 veces más rápido que Whisper!!
- Google Colab con ejemplo de uso de WhisperX
🐶 Bark
Bark es el inverso de Whisper.
Es un modelo de generación de audio a partir de texto que, considerando que puedes ejecutarlo en tu computador, produce unas voces increíblemente realistas.
No solo genera voces nuevas, también puede clonarlas con un audio de pocos segundos, como la solución text-to-speech de pago, Eleven Labs.
Bark puede generar audio multilingüe muy realista, así como otros tipos de audios, como música, ruido de fondo y efectos de sonido simples.
El modelo también puede producir comunicaciones no verbales como reír, suspirar, cantar y llorar.
Recursos útiles:
- Documentación en Hugging Face
- Google Colab con ejemplo de uso de Bark
🦜 LangChain
Si quieres integrar los modelos de LLM como Llama 2 o GPT4 a un proyecto, lo más probable es que vas a usar APIs.
Esto suena sencillo, pero si quieres integrarlo con información de otros archivos, páginas web u otros servicios, LangChain es la herramienta para ti.
Esta herramienta nos ayuda a armar flujos y sistemas mas complejos alrededor de los modelos de lenguajes.
Puedes crear agentes que podrán utilizar herramientas para comunicarse con el mundo exterior y utilizar los modelos de lenguaje para interactuar con tus usuarios.
Recursos útiles:
- Documentación del proyecto LangChain
- Repositorio con Notebooks de Google Colab con distintos usos de LangChain