A IA mais poderosa de sempre chega ao público, mas com travões à mistura
A Newsletter Na Revista no seu e-mail
Conheça em primeira mão os destaques da revista que irá sair em banca.
(Enviada semanalmente)
Para quem lida com a natureza de duplo uso destas ferramentas, o raciocínio é familiar e incómodo: as mesmas perguntas que são valiosas nas mãos de um profissional de cibersegurança ou de um investigador em biologia podem ser perigosas nas mãos de um agente malicioso.
No passado dia 9 de junho, a Anthropic fez algo que, há poucos meses, dizia não tencionar fazer: colocou nas mãos de qualquer utilizador um modelo da sua classe mais avançada. Chama-se Claude Fable 5, é a quinta geração da família Claude e inaugura um patamar de capacidade que a empresa designa por classe Mythos, situado acima da anterior gama Opus. A novidade não está apenas na potência. Está na forma como a Anthropic decidiu que um modelo desta força só pode circular livremente se vier acompanhado de mecanismos que, deliberadamente, o tornam mais fraco em certas áreas. É essa tensão, entre capacidade de fronteira e controlo, que torna este lançamento mais interessante do que mais um anúncio de desempenho.
O que muda em termos de capacidade
A própria Anthropic descreve o Fable 5 como o seu modelo mais capaz alguma vez disponibilizado de forma generalizada, com desempenho de topo em quase todos os testes de referência de engenharia de software, trabalho de conhecimento, visão e investigação científica. O traço distintivo é a autonomia em tarefas longas: quanto mais extensa e complexa a tarefa, maior a vantagem do Fable 5 sobre os modelos anteriores, conseguindo trabalhar durante dias seguidos dentro de um agente como o Claude Code.
Os exemplos avançados pela empresa ajudam a calibrar a escala. A Stripe terá testado o modelo numa base de código em Ruby com cinquenta milhões de linhas e descreveu uma migração que o Fable 5 concluiu num dia e que, à mão, ocuparia uma equipa inteira durante mais de dois meses. Na vertente de visão, a Anthropic destaca que o modelo passou a interpretar gráficos, tabelas e figuras científicas com precisão suficiente para, por exemplo, reconstruir o código-fonte de uma aplicação web a partir apenas de capturas de ecrã. O preço fixou-se em dez dólares por milhão de tokens de entrada e cinquenta por milhão de tokens de saída, menos de metade do que custava o anterior Mythos Preview, sinal claro de que a empresa quer escala.
A inversão que importa: salvaguardas que rebaixam o modelo
Aqui reside o ponto que distingue este lançamento de tudo o que o precedeu, e que devia interessar a quem trabalha em cibersegurança e governação de IA. A Anthropic reconhece abertamente que, sem salvaguardas, as capacidades do Fable 5 em domínios como a cibersegurança poderiam ser usadas para causar danos sérios. A solução não foi a recusa pura e simples. Foi a criação de classificadores, sistemas de IA separados que detetam pedidos potencialmente perigosos e desviam a resposta para o modelo seguinte na hierarquia, o Opus 4.8, menos capaz mas considerado seguro.
Os domínios cobertos por estes filtros são três: cibersegurança ofensiva, biologia e química, e tentativas de destilação, ou seja, extração das capacidades do modelo para treinar concorrentes. Sempre que um pedido cai nestas categorias, o utilizador é informado de que está a falar com o Opus 4.8 e não com o Fable 5. Segundo a Anthropic, mais de 95 por cento das sessões não envolvem qualquer desvio, e os filtros disparam, em média, em menos de 5 por cento das sessões. A própria empresa admite que afinou estes mecanismos de forma conservadora, ao ponto de por vezes bloquearem pedidos perfeitamente legítimos, e assume o compromisso de reduzir os falsos positivos após o lançamento.
Para quem lida com a natureza de duplo uso destas ferramentas, o raciocínio é familiar e incómodo: as mesmas perguntas que são valiosas nas mãos de um profissional de cibersegurança ou de um investigador em biologia podem ser perigosas nas mãos de um agente malicioso. A Anthropic afirma ter submetido os classificadores a mais de mil horas de testes externos de intrusão sem que surgisse um jailbreak universal, embora reconheça que o instituto britânico de segurança em IA, o UK AISI, já progrediu nessa direção numa primeira janela de testes. É uma honestidade rara, e sublinha que a barreira é probabilística, não absoluta.
Mythos 5, o gémeo sem coleira
O Fable 5 tem um gémeo. Chama-se Claude Mythos 5 e é, nas palavras da Anthropic, exatamente o mesmo modelo subjacente, mas com as salvaguardas de cibersegurança levantadas. Não está disponível ao público. Destina-se a um grupo restrito de defensores de infraestruturas críticas, no âmbito do programa Project Glasswing, montado em articulação com o governo dos Estados Unidos, e a empresa descreve-o como o modelo com as mais fortes capacidades de cibersegurança do mundo. Há ainda a intenção de abrir um programa de acesso de confiança para a biologia, dirigido a investigadores biomédicos, que daria acesso ao Fable 5 sem os filtros de biologia e química, mantendo os de cibersegurança.
Por outras palavras, a mesma tecnologia existe em duas versões: uma travada para o cidadão comum, outra solta para um clube fechado de entidades validadas pelo Estado. Esta arquitetura de acesso diferenciado é, em si, uma declaração política sobre quem deve poder usar capacidades de fronteira sem amarras, e merece escrutínio para lá do entusiasmo técnico.
O detalhe que um jurista de proteção de dados não deixa passar
Acompanhando o lançamento, a Anthropic introduziu uma nova política de retenção de dados para todos os modelos da classe Mythos. Todo o tráfego, incluindo o de clientes empresariais e o que passa por plataformas de terceiros, fica sujeito a uma retenção obrigatória de trinta dias, justificada pela necessidade de detetar ataques complexos e novos jailbreaks. A empresa garante que estes dados não serão usados para treinar modelos nem para fins alheios à segurança, que todos os acessos humanos ficam registados e que a eliminação ocorre ao fim de trinta dias na quase totalidade dos casos. Para qualquer organização europeia sujeita ao RGPD, esta obrigatoriedade de retenção, mesmo limitada no tempo e com finalidade de segurança, é um ponto que exige leitura atenta antes de qualquer adoção institucional, sobretudo em contextos de informação sensível ou classificada.
O timing diz quase tudo
O contexto em que este lançamento acontece é talvez o mais revelador. Como notou a TechCrunch, o Fable 5 surge poucos dias depois de a Anthropic ter apelado aos principais laboratórios mundiais de IA para que estabelecessem um travão coordenado ao desenvolvimento de modelos de fronteira, alertando que os sistemas avançam tão depressa que se aproximam da auto-melhoria recursiva, a capacidade de um modelo se aperfeiçoar a si próprio sem intervenção humana. Tudo isto enquanto a empresa se prepara para uma entrada em bolsa potencialmente avultada, ainda este ano, num movimento que partilha com a OpenAI.
A leitura é desconfortável e instrutiva. Uma empresa que avisa publicamente para os perigos da corrida tecnológica é a mesma que coloca no mercado o modelo mais poderoso de sempre, com salvaguadas que ela própria classifica como excessivamente cautelosas e provisórias. Não é necessariamente contradição. Pode ser a tradução prática de uma filosofia que defende libertar capacidade ao máximo possível, o mais depressa e com a maior segurança que se consiga, três objetivos que vivem em tensão permanente. Mas é precisamente essa tensão que define o estado atual da inteligência artificial: o problema deixou de ser conseguir construir modelos poderosos e passou a ser decidir quem os pode usar sem limites, sob que regras e com que mecanismos de responsabilização. Numa Europa que está a transpor a NIS2 e a aplicar o Regulamento de IA, a forma como a Anthropic resolveu este dilema deixa de ser uma curiosidade do Silicon Valley e passa a ser um caso de estudo para o nosso próprio quadro regulatório.
A IA mais poderosa de sempre chega ao público, mas com travões à mistura
Para quem lida com a natureza de duplo uso destas ferramentas, o raciocínio é familiar e incómodo: as mesmas perguntas que são valiosas nas mãos de um profissional de cibersegurança ou de um investigador em biologia podem ser perigosas nas mãos de um agente malicioso.
O ministério que tritura ministros encontrou, finalmente, alguém que conhece a casa por dentro. Os primeiros meses de Luís Neves no MAI confirmam o instinto certo de Montenegro e devolvem ao cargo a competência técnica que vinha em falta.
Para poder adicionar esta notícia aos seus favoritos deverá efectuar login.
Caso não esteja registado no site da Sábado, efectue o seu registo gratuito.
Para poder votar newste inquérito deverá efectuar login.
Caso não esteja registado no site da Sábado, efectue o seu registo gratuito.