Sábado – Pense por si

Ciência & Saúde

A nova versão do ChatGPT é gratuita e mais rápida, mas até na apresentação falhou

Diogo Barreto 20 de maio de 2024 às 07:00

As mais lidas

Jorge Corrula: "Desejo que André Ventura seja eleito Presidente"

Sónia Bento

"Apresentei a demissão em plena discussão do orçamento"

Sarah Ferguson não tem para onde ir

Sónia Bento

Como Marques Mendes ganhou meio milhão num ano (e as finanças dos outros candidatos a Belém)

Bruno Faria Lopes

Quem é o responsável por o IRA passar a usar as luzes de marcha urgente? Ninguém se acusa

Diogo Barreto

Uma versão mais avançada vai ser lançada pela OpenAI e promete tornar-se cada vez mais acessível. A nova versão consegue analizar imagens e áudios de forma mais eficaz do que as anteriores.

A apresentação do iPhone 4 tornou-se infame na Apple já que, durante a sua apresentação, Steve Jobs teve dificuldades em mostrar como funcionava o browserdeste telemóvel. Quando se faz uma apresentação que será vista por milhões e milhões de pessoas, as empresas tentam sempre controlar ao máximo o que vão mostrar de forma a que não aconteçam incidentes que possam prejudicar a marca, ao mesmo tempo que tentam mostrar inovação e as características mais interessantes dos seus produtos. Uma situação semelhante aconteceu na semana passada durante a apresentação do novo ChatGPT: em pelo menos duas situações a inteligência artificial mostrou o quão falível ainda é. Mas mesmo por entre as falhas, a nova versão do ChatGPT promete grandes avanços aos seus utilizadores.

REUTERS/Dado Ruvic/Illustration/File Photo

A OpenAI parece continuar a liderar a corrida no que diz respeito à inteligência artificial (IA). A empresa responsável pelo ChatGPT lançou uma nova versão do seu programa. É mais rápido, com maior capacidade de processamento e produção de texto e consegue até já processar dados visuais. A nova versão continua gratuita e chama-se GPT-4o.

A mais recente versão dolarge language model(LLM) da OpenAI é capaz de oferecer respostas de uma forma mais célere e mais completa do que os seus predecessores, incluindo aqueles que faziam parte do serviço pago, como o GPT-4. O GPT-4o é capaz de processar conteúdo a partir de texto, imagens e áudio e gerar resultados em linguagem e voz mais "corrente", tornando-se menos óbvio que as respostas foram criadas por um modelo de inteligência artificial e não por um humano, refere a OpenAI emcomunicado.

"O GPT-4o é um passo em direção a uma interação humano-computador muito mais natural. Ele aceita como entrada qualquer combinação de texto, áudio e imagem e gera qualquer combinação de saídas de texto, áudio e imagem. Pode responder a entradas de áudio em apenas 232 milissegundos, com uma média de 320 milissegundos, o que é o semelhante ao tempo de resposta humano numa conversa",lê-se ainda no comunicado.

Durante a apresentação deste novo modelo, numa cerimónia conduzida por Mira Murati, a diretora tecnológica da OpenAI, e que decorreu nos escritórios da empresa em São Francisco, nos Estados Unidos, Mark Chen, investigador da Open AI, pediu conselhos ao ChatGPT para conseguir falar com menos constrangimentos durante aquela apresentação. Como parte do teatro, o investigador fingiu até estar a hiperventilar, ao que o robô respondeu, em tom de graça, que Chen não era um aspirador para fazer aquele barulho.

Durante o exercício, Chen pediu ao modelo que contasse uma história ao público, com diferentes níveis de dramatismo na voz, missão cumprida pelo programa, apresentando tanto uma voz mais "mecanizada" e que associamos a um robô e depois de uma forma mais "humana". Houve um momento em que o investigador interrompeu momentaneamente o ChatGPT e este "calou-se", mostrando que começa a ser capaz de interpretar e processar interrupções e outros momentos que existem em diálogos.

Mas não é só informação áudio e textual que o programa consegue interpretar. A OpenAi escreveu código para que o programa consiga, através da câmara do telefone ou do computador, analisar o ambiente à frente da lente e processar o que lhe é exposto, incluindo resolver uma equação matemática que lhe seja mostrada. Foi aqui que a apresentação começou a correr menos bem. Instada - o programa utilizava uma voz feminina com um sotaque norte-americano - a analisar uma fotografia de um homem a sorrir para dizer o que via, o programa confundiu a pessoa com um bocado de madeira. E resolveu até uma equação que não lhe foi apresentada, mostrando que estes modelos continuam a ter várias falhas de interpretação.

Outra habilidade que o ChatGPT demonstrou foi a de conseguir fazer tradução (neste caso de italiano para inglês e vice-versa), ferramenta que já possuía mas que, segundo a OpenAi, foi imensamente melhorada nesta nova versão.

Utilização generalizada

"Uma parte muito importante da nossa missão passa por fazer com que as nossas ferramentas avançadas de IA estejam disponíveis para todos", referiu Murati, explicando que ao contrário do que acontece com o GPT-4, que está disponível apenas para os utilizadores com subscrição, o GPT-4o ficará disponível gratuitamente. Atualmente, quem usa o ChatGPT sem uma subscrição está limitado ao modelo GPT-3.5, que tem capacidades mais limitadas.

Apesar desta liberalização dos serviços, quem compra uma subscrição do ChatGPT vai continuar a ter benesses como limites de interações cinco vezes maiores e acesso antecipado a novas funcionalidades no serviço, tranquilizou a empresa.

Neste passo em busca de uma maior acessibilidade e consequente maior utilização, a empresa anunciou ainda que vai lançar uma aplicação que pode vir a ser usada no computador, deixando de ser necessário recorrer a um site para utilizar a ferramenta.

Anteriormente já era possível falar com o ChatGPT através de áudio, mas para isso era preciso transcrever o áudio para texto. Depois o GPT-3.5 ou o GPT-4 interpretava o conteúdo e criava uma resposta. Por fim, o material era convertido em áudio. Segundo a OpenAI, este processo fazia com que houvesse perda de muita informação e não era possível analisar "o tom, ruídos de fundo, produzir risadas, cantar ou expressar emoções".

“Isto é uma loucura”. OpenAI anuncia novo modelo de IA e preocupa internautas

OpenAI suspende voz do ChatGPT apontada como semelhante a Scarlett Johansson

Tópicos Inteligência artificial OpenAI São Francisco

Artigo Anterior Próximo Artigo

Opinião Ver mais

Maria Henrique Espada

Salazar ainda vai ter de esperar

O regresso de Ventura ao modo agressivo não é um episódio. É pensado e planeado e é o trilho de sobrevivência e eventual crescimento numa travessia que pode ser mais longa do que o antecipado. E que o desejado. Por isso, vai invocar muitos salazares até lá.

Eduardo Dâmaso

Caderno de Significados

Que perguntas são essas?

O incómodo de alguns ministros com as perguntas dos jornalistas revela uma incapacidade de lidar com as exigências da própria democracia.

Leonor Caldeira

No país emerso

A crise na Guiné-Bissau e o dever da CPLP

O espaço lusófono não se pode resignar a ver uma das suas democracias ser corroída perante a total desatenção da opinião pública e inação da classe política.

Gonçalo M. Tavares

Breves notas - norte, sul, este, oeste

Eu não concordo com o facto de a Terra ser redonda

É muito evidente que hoje, em 2025, há mais terraplanistas, sim, pessoas que acreditam que a Terra é plana e não redonda, do que em 1925, por exemplo, ou bem lá para trás. O que os terraplanistas estão a fazer é basicamente dizer: eu não concordo com o facto de a terra ser redonda.