domingo, 21 julio, 2024

Google lanza su herramienta de inteligencia artificial generadora de fotos, textos y correos

La multinacional estadounidense abrió este miércoles a 180 países su herramienta gratuita de generación de datos. Por ahora solo se encuentra en inglés, coreano y japonés, pero se espera la inclusión de 40 idiomas más en los próximos meses. Podrá generar imágenes únicas al igual que escritos profesionales y estará ligada a herramientas como Gmail y Google Docs.

En su presentación durante el evento anual de desarrolladores de Google, Google I/O 2023 Sundar Pichai, director ejecutivo de Google y Alphabet, dijo que quiere hacer que la nueva inteligencia artificial (IA) de la empresa sea una herramienta de ayuda para todos.

Google continúa así en su competencia con Microsoft, empresa que la semana pasada abrió a todo el mundo su herramienta gratuita de inteligencia artificial, Bing, que es capaz de generar textos e imágenes.

Por su parte, Sissie Hsiao, vicepresidenta de Google y directora general de Google Assistant y Bard, dijo que “muy pronto” Bard estará disponible en “los 40 idiomas principales” del mundo.

Otra novedad es que los usuarios podrán exportar las respuestas obtenidas por Bard a Gmail y Google Docs. “Ya que las personas a menudo piden ayuda a Bard para redactar correos electrónicos y documentos”, dijo Hsiao.

Respuestas multimodales

Al igual que Microsoft anunció la semana pasada, el chatbot de Google “pronto” dará respuestas multimodales, es decir, no solo responderá con texto, sino también con imágenes.

Esta nueva función operará de dos maneras: por un lado, incorporará imágenes en las respuestas, pero por otra serán los propios usuarios los que les podrán hacer preguntas a Bard con fotos.

Un ejemplo de este último caso es que un usuario podrá subir una foto -con reconocimiento de imágenes Google Lens- de un cajón lleno de materiales de arte y preguntar al chatbot que prepare una lista de actividades que se pueden practicar con niños con los materiales que tiene delante.

“En los próximos meses, integraremos Adobe Firefly -que permite generar imágenes mediante texto- en Bard. Así, las personas podrán generar nuevas imágenes”, anotó.

La semana pasada Microsoft integró la tecnología de DALL-E 2 de Open AI (creadores de ChatGPT y DALL-E) para permitir que sus usuarios creen imágenes mediante un texto también.

Por otra parte, a partir de la semana que viene habrá más transparencia en la fuente de la información en la respuesta de Bard, prometió la empresa.  “En estos días, haremos que las secciones de código sean aún más precisas al mostrar los bloques de código específicos que se obtienen junto con cualquier información de licencia relevante. Y esto también se aplicará a la cita de contenido narrativo de toda la web”.

Además, las extensiones de Bard se aplicarán a muchas de las aplicaciones y servicios que las personas ya usan en Google, como mapas, hojas de cálculo, Gmail, documentos y más. No obstante, la empresa no dio fecha para este último paso.

PaLM 2, el nuevo modelo de lenguaje de Google

Otro gran anuncio de la jornada en la sede de Google fue el lanzamiento de PaLM 2, el nuevo modelo de lenguaje (LLM) de Google, que también está detrás de Bard.

Esta es una actualización que permitirá muchas mejoras, como habilidades mejoradas de matemáticas, lógica y razonamiento, y más recientemente, capacidades de programación, según Pichai. PaLM 2 incluye más de 100 idiomas y ha sido entrenado en 20 lenguajes de programación.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *