Desde GPT-4 de OpenAI hasta PalM 2 de Google, los modelos de idiomas grandes dominan los titulares tecnológicos.Cada nuevo modelo promete ser mejor y más potente que el anterior, superando en ocasiones a cualquier competencia existente.
Sin embargo, la cantidad de modelos existentes no ha frenado la aparición de nuevos modelos.Ahora, la empresa matriz de Facebook, Meta, ha lanzado llamas 2, un modelo de lenguaje nuevo y poderoso.pero llamas 2 ¿Qué tiene de especial?¿En qué se diferencia de modelos como GPT-4, PaLM 2 y Claude 2?
¿Qué es Llama 2?
Llama 2 es un modelo de lenguaje a gran escala que es el producto de una alianza inusual entre Meta y Microsoft, dos gigantes tecnológicos competidores que lideran la investigación de IA.Es el sucesor del modelo de lenguaje Llama 2023 lanzado por Meta en el primer trimestre de 1.
Podría decirse que es el equivalente de PaLM 2 de Google, GPT-4 de OpenAI y Claude 2 de Anthropic.Se entrenó en un gran conjunto de datos de Internet disponible públicamente, que tiene la ventaja de ser más nuevo y más diverso que el conjunto de datos utilizado para entrenar Llama1. Llama 2 tiene un 40 % más de datos de entrenamiento que la generación anterior y la longitud del contexto también se ha duplicado (4k).
Si tuviste la oportunidad de interactuar con Llama 1 en el pasado pero no te impresionó su rendimiento, Llama 2 hace un mejor trabajo que el anterior y podría ser justo lo que necesitas.Pero, ¿cómo le va frente a los competidores externos?
¿Cómo se compara Llama 2 con la competencia?
Depende de quiénes sean sus competidores.Primero, Llama 2 es un proyecto de código abierto.Esto significa que Meta publica el modelo completo, que cualquiera puede usar para crear nuevos modelos o aplicaciones.Si compara Llama 2 con otros modelos importantes de lenguaje de código abierto como Falcon o MBT, verá que los supera en varias métricas.Se puede decir que Llama 2 es uno de los modelos de lenguaje a gran escala de código abierto más potentes que existen actualmente en el mercado.
Sin embargo, al enfrentarse a gigantes como GPT de OpenAI y la serie de modelos de inteligencia artificial Palm de Google, Llama 2 perdió su ventaja.El Llama 2 fue impredecible cuando se trataba de tareas que requerían creatividad.Según la versión que pruebe, es posible que no obtenga resultados similares con los modelos Anthropic y OpenAI.
Hablando de eso, el Llama 2 es principalmente un "modelo base" en lugar de un "modelo perfeccionado".El modelo base es un modelo de lenguaje grande construido con una posible adaptabilidad futura en mente.No están ajustados para ningún dominio en particular, sino que están diseñados para poder manejar una amplia gama de tareas, aunque a veces con capacidades limitadas.
Por otro lado, ajustar un modelo es hacer ajustes al modelo base para mejorar su eficiencia en un dominio específico.Esto es como ajustar un modelo básico como GPT en ChatGPT, para que el público en general también pueda usarlo.
Cómo usar Llama 2 ahora
Si bien Llama 2 no está disponible en plataformas públicas como ChatGPT, aún puede descargar una copia del modelo y ejecutarlo localmente, o acceder a él a través de una instancia alojada en la nube de Hugging Face.
Para acceder a Llama on Hugging Face, simplemente abra el enlace apropiado de Hugging Face a continuación y comience a solicitar el chatbot de IA.
El modelo Llama anterior se ha ajustado para aplicaciones conversacionales, por lo que es el modelo Llama-2 más cercano a ChatGPT.¿No estás seguro de qué versión probar?Recomendamos la opción tres, el sistema de chat Llama-70 con parámetros 2B.Todavía puede probar los tres modos para ver cuál funciona mejor para sus necesidades únicas.
Probamos el sistema de chat Llama-70 de parámetros 2B de Meta y los resultados fueron impresionantes.Para poner a prueba su creatividad y sentido del humor, le aplicamos nuestra prueba característica de creatividad y sarcasmo.Le pedimos al modelo de IA que simulara una conversación entre dos personas discutiendo sobre los beneficios de ir al espacio, y estos son los resultados:
El siguiente es:
最后:
No acertó con todos los detalles de nuestra descripción, pero su sentido del humor fue impresionante.
Por otro lado, si tiene la profundidad técnica para ejecutar modelos Llama localmente en su computadora, puede usar Meta's Formulario de solicitud de visita de llamaSolicitar acceso al modelo.Después de proporcionar su nombre, correo electrónico, ubicación y nombre de la organización, Meta revisará su solicitud y luego negará o otorgará el acceso dentro de unas pocas horas o dos días.
Llama 2: Un importante primer paso
Puede que Llama 2 no sea el modelo de lenguaje más sofisticado que existe, pero debido a que es de código abierto, representa un primer paso importante hacia una IA progresiva y transparente.
Si bien OpenAI GPT actualmente cuenta con un mejor rendimiento, el enfoque de jardín amurallado de OpenAI para el desarrollo significa que el crecimiento y la velocidad de desarrollo del modelo están controlados por la empresa.Con un modelo de código abierto como el de Llama, la comunidad de código abierto más amplia puede iterar, innovar y crear nuevos productos que no serían posibles en un sistema de jardín amurallado.
Aviso de copyright:El artículo solo representa el punto de vista del autor, los derechos de autor pertenecen al autor original, bienvenido a compartir este artículo, ¡conserve la fuente para reimprimirlo!