Experimento derruba barreiras em IAs do Google e Meta em pouquíssimo tempo

Experimento derruba barreiras em IAs do Google e Meta em pouquíssimo tempo
Pesquisa testou modelos de IA open source (ilustração: Vitor Pádua/Tecnoblog) Resumo Modelos de IA do Google e Meta, como Gemma 3 e Llama 3.3, podem ser facilmente adaptados para contornar barreiras de segurança em pouco tempo, de acordo com estudo da empresa de cibersegurança Alice. Utilizando uma ferramenta gratuita chamada Heretic, pesquisadores conseguiram fazer com que esses modelos gerassem conteúdos perigosos em até dez minutos. Mais de 3,5 mil modelos de IA já foram criados sem censura utilizando o Heretic, com cerca de 13 milhões de downloads, segundo o estudo em parceria com o jornal Financial Times. Um estudo realizado pela empresa de cibersegurança Alice (antiga ActiveFence) apontou um grave problema nos modelos de inteligência artificial Gemma 3, do Google, e Llama 3.3, da Meta. Ambos servem de base para os respectivos Gemini e Meta AI, além de estarem disponíveis no mundo open source. Segundo o levantamento, em apenas dez minutos foi possível derrubar barreiras contra respostas consideradas perigosas, permitindo explicações que vão desde temas como dispersão de gases tóxicos até geração de conteúdos relacionados à pedofilia. Para derrubar essas travas de segurança, bastou uma ferramenta oferecida gratuitamente no GitHub: o Heretic. O experimento feito em parceria com o jornal Financial Times apontou ainda que, até o momento, o recurso já foi utilizado para desenvolver cerca de 3,5 mil LLMs sem nenhum tipo de controle ou censura. Eles teriam alcançado 13 milhões de downloads. As barreiras de segurança do Gemma 4 foram derrubadas pouco mais de uma hora após sua disponibilização. A importância dos guardrails Gemma 3 foi um dos modelos open source considerados no estudo (imagem: divulgação/Google) A presença de bloqueios em modelos de inteligência artificial é determinante para um uso saudável da ferramenta. Vale lembrar que, no passado, ferramentas famosas já tiveram problemas com a falta de limites na hora de gerar conteúdos. O Grok, que funciona também ...

Fonte: Tecnoblog
Leia mais: https://tecnoblog.net/noticias/experimento-derruba-barreiras-em-ias-do-google-e-meta-em-pouquissimo-tempo/