Facebooktwitterlinkedin

Meta, la empresa propiedad de Mark Zuckerberg, ha liberado su modelo de lenguaje de inteligencia artificial, el OPT-175B (Open Preteained Transformer). Meta quiere poner esta nueva tecnología a disposición de la comunidad científica para impulsar sus investigaciones con la ayuda de la IA.

OPT-175B cuenta con 175.000 millones de parámetros y ha sido cargado con un volumen monumental de información pública, lo que permite generar texto creativo de cualquier tipo, resolver problemas matemáticos básicos o responder a preguntas de comprensión lectora, entre otras funciones.

Un modelo de lenguaje gratuito 

El objetivo de Meta ha sido lanzar un modelo gratuito que sea aprovechado por la comunidad en general. También ha compartido sus modelos previos y un libro de registro de su desarrollo, el cual incluye información relativa a su proceso de creación, a fin de permitir estudiar y comprender el funcionamiento de OPT-175B a todo el que quiera.

Meta toma precauciones para evitar el uso indebido de OPT-175B

Como era de esperarse, la liberación de una herramienta tan potente ha traído grandes preocupaciones a Meta, pues OPT-175B puede ser usado en actividades indebidas. Ante esto, la compañía dará acceso al modelo de lenguaje utilizando una licencia no comercial destinada a investigadores académicos, organizaciones gubernamentales y laboratorios de investigación de todo el mundo.

Sin embargo, para aquellos ingenieros interesados en tomar el control total de sus propias soluciones de IA, Meta ha publicado varios modelos de referencia a menor escala, los cuales cuentan con un número menor de parámetros en comparación con el modelo estándar (125 millones, 350 millones, 1.300 millones, 2.700 millones, 6.700 millones, 13.000 millones y 30.000 millones), pero igualmente entrenados con todos los datos y con los ajustes presentes en OPT-175B.

Según el comunicado oficial de Meta, «un segmento mucho más amplio de la comunidad necesita acceso a estos modelos para realizar investigaciones e impulsar colectivamente el campo. Con el lanzamiento de OPT-175B, esperamos aumentar la diversidad de voces que definen las consideraciones éticas de tales tecnologías».

Otros modelos de lenguaje

OPT-175B, no es el primer modelo de lenguaje natural que se ha creado. Sin embargo, para acceder a ellos es necesario realizar una gran inversión de dinero. «Este acceso restringido ha limitado la capacidad de los investigadores para comprender cómo y por qué funcionan estos modelos de lenguaje, lo que dificulta el progreso de los esfuerzos para mejorar su solidez y mitigar problemas conocidos como el sesgo y la toxicidad», han declarado desde Meta.

Durante el 2020, la compañía Open AI, anunció la salida de su modelo GPT-3 el cual trabaja con 175.000 millones de parámetros, al igual que OPT-175B, y su conocimiento se basa en 400.000 millones de textos de internet.

En noviembre de 2021, la API de GPT-3 fue liberada para que los desarrolladores pudieran acceder al modelo e implementarlo, pero la empresa hizo modificaciones importantes en sus políticas para evitar que el GPT-3 pudiera usarse en contenidos violentos, políticos, de odio o de adultos, entre otros. Esta medida fue tomada ya que la API está basada en textos y materiales creados por personas a lo largo de la historia de internet, por lo que esta podría imitar conductas y responder de manera racista o con prejuicios sexistas.

Para desarrollar OPT-175B, se tomó en cuenta la eficiencia energética, por lo que fue posible entrenar un modelo de gran tamaño usando solo séptima parte de la huella de carbono que utilizó GPT-3, gracias a la combinación de código abierto de Meta.

Otra rama de la empresa Open AI incluye el desarrollo de Dalle-2, un sistema que puede generar imágenes realistas e ilustraciones partiendo de un texto descriptivo. Desafortunadamente, por el momento, esta tecnología solamente está disponible para unas pocas personas.

Imagen: Depositphotos

Mantente informado de las noticias más relevantes en nuestro canal de Telegram

Escribir comentario

¡Mantente al día!