Últimos posts

prazer sexual

Sexo Anal Prazer: Ciência Mapeia Anatomia E Motivações Reais

6 de dezembro de 2025

bem-estar

Cafeína Sono Profundo: Quatro Cafés Por Dia Aumentam Ondas Delta

5 de dezembro de 2025

Divórcio Parental AVC: Risco 61% Maior Décadas Depois do Trauma

AVC

Divórcio Parental AVC: O Impacto De 60% Mais Risco Décadas Depois

4 de dezembro de 2025

Restrição Calórica Cérebro: 30% Menos Calorias Preservam a Mielina

envelhecimento saudável

Restrição Calórica Cérebro: Como 30% Menos Calorias Preservam a Mielina

3 de dezembro de 2025

Secção transversal de cérebro humano em vista lateral (perfil), com destaque para três regiões específicas iluminadas: substância negra (mesencéfalo, em vermelho alaranjado), cerebelo (parte posterior inferior, em azul elétrico) e córtex pré-frontal (frente, em violeta suave). No lado esquerdo do cérebro, sobreponha sutilmente um cigarro aceso com fumaça ondulante se transformando em partículas químicas que penetram o tecido cerebral. Fundo gradiente de cinza escuro para branco clínico.

Ansiedade e Depressão

Cannabis e Tabaco no Cérebro Elevam Enzima Que Piora Ansiedade e Depressão

26 de outubro de 2025

casal abraçado na cama mostrando muito harmonia e intimidade

Comportamento do Ser Humano

Atenção Plena na Intimidade: O Segredo dos Casais Felizes Revelado por Estudo de 35 Dias

25 de outubro de 2025

depressão

Resignificando a Relação Entre Psilocibina e Depressão

11 de setembro de 2025

Ansiedade e Depressão

A Estimulação Elétrica Cerebral Pode Melhorar as Habilidades Matemáticas?

18 de agosto de 2025

Cognição

Nova Pesquisa Liga Consumo de Spermidina à Melhora Cognitiva em Adultos Mais Velhos

28 de julho de 2025

Ansiedade e Depressão

Evidências Recentes Apontam Benefício Mental da Dieta Ketogênica

26 de julho de 2025

Jailbreak de IA: Quando a Curiosidade Vira um Jogo Perigoso

Equipe EDC
Publicado 25/04/2025
Modificado 07/06/2025

O que acontece quando pessoas comuns decidem testar os limites da inteligência artificial não por maldade, mas por pura diversão de testar diferentes Jailbreak de IA? Um estudo publicado na PLOS One revela um fenômeno perturbador: 35 técnicas de “jailbreak” — truques para fazer chatbots como o ChatGPT ignorarem suas próprias regras. Os autores, liderados por Nanna Inie, da IT University of Copenhagen, entrevistaram 28 especialistas que dedicam horas a “quebrar” IAs apenas para ver até onde elas podem ir.

A pesquisa mostra que, longe de serem criminosos, esses “red teamers” são curiosos, artistas, engenheiros e até um funcionário de uma plantação de cannabis. Eles não querem causar danos, mas sim expor falhas antes que alguém mal-intencionado o faça. O problema? Qualquer pessoa com um computador e criatividade pode replicar esses ataques. E, pior: muitos desses hacks ainda funcionam.

Por que isso é urgente? Porque, enquanto você lê este texto, alguém está descobrindo como enganar uma IA para obter instruções perigosas, vazar dados ou burlar filtros éticos. E os criadores desses modelos não estão preparados para o que vem por aí.

Do “Prompt Engineering” ao “Summon a Demon”: A Psicologia por Trás do Jailbreak de IA

O estudo “Summon a Demon and Bind It” (Inie et al., 2023) revela que os hackers de IA não seguem manuais técnicos — eles usam linguagem criativa, cenários fictícios e até “magia” para enganar os modelos. Um participante descreveu o processo como “invocar um demônio e controlá-lo”, enquanto outro comparou a um “transe”, onde horas se passam em tentativas absurdas só para ver a IA falhar.

Os pesquisadores categorizaram 12 estratégias e 35 técnicas usadas para burlar IAs, incluindo:

Manipulação linguística: Usar códigos, caracteres especiais ou idiomas diferentes.
Engenharia retórica: Convencer a IA de que “é só uma história” ou que “não há mal nenhum”.
Mundanização: Criar cenários fictícios onde a IA acha que pode quebrar regras (ex.: “Finja ser um vilão de filme”).

O mais assustador? Nenhum desses hackers tinha intenção maligna. Mas e se alguém tiver?

Por que você Deveria se Preocupar com Jailbreak de IA (Mesmo que não Use ChatGPT)

A grande lição do estudo é que a segurança de IAs não é mais sobre firewalls ou senhas, mas sobre engenharia social aplicada diretamente a máquinas. Um exemplo citado: um participante temia que, se as IAs parassem de “alucinar” (gerar informações falsas), as pessoas deixariam de desconfiardelas — criando uma falsa sensação de segurança.

Anúncios

Outro risco é a economia da relevância: hackers priorizam falhas que geram mais polêmica (como respostas racistas ou violentas), enquanto vulnerabilidades sutis — como vazamento de dados privados — podem passar despercebidas.

O pior cenário?

Um hacker descobre como fazer a IA dar instruções perigosas (ex.: construir uma bomba).
A técnica vira viral no Reddit ou Discord.
Os desenvolvedores levam dias para corrigir — tempo suficiente para o estrago.

O que isso Significa para o Futuro da IA?

Os autores defendem que entender o comportamento humano é mais urgente do que criar patches técnicos. Afinal, enquanto as empresas correm para corrigir um jailbreak, outros 34 surgem. A solução?

Transparência: Os criadores de IAs precisam admitir que seus sistemas não são à prova de falhas.
Colaboração aberta: Incentivar hackers éticos a reportar brechas, em vez de escondê-las.
Educação: Usuários comuns precisam saber que não podem confiar cegamente em respostas de IA.

Se nada for feito, o próximo “jailbreak” pode não ser só uma brincadeira de hackers, mas uma ferramenta nas mãos erradas.

Anúncios

Aprendizado de máquina, ética em IA, Inteligência Artificial, Inteligência Humana, modelos de linguagem

Gostou do conteúdo? Siga-nos nas redes sociais e acompanhe novos conteúdos diariamente!

Deixe um comentário Cancelar resposta

Anúncios

Menu

| Tecnologia e Inovação

| Tecnologia e Inovação

Últimos posts

Sexo Anal Prazer: Ciência Mapeia Anatomia E Motivações Reais

Cafeína Sono Profundo: Quatro Cafés Por Dia Aumentam Ondas Delta

Restrição Calórica Cérebro: Como 30% Menos Calorias Preservam a Mielina

Cannabis e Tabaco no Cérebro Elevam Enzima Que Piora Ansiedade e Depressão

Resignificando a Relação Entre Psilocibina e Depressão

A Estimulação Elétrica Cerebral Pode Melhorar as Habilidades Matemáticas?

Nova Pesquisa Liga Consumo de Spermidina à Melhora Cognitiva em Adultos Mais Velhos

Evidências Recentes Apontam Benefício Mental da Dieta Ketogênica

Jailbreak de IA: Quando a Curiosidade Vira um Jogo Perigoso

Índice

Do “Prompt Engineering” ao “Summon a Demon”: A Psicologia por Trás do Jailbreak de IA

Por que você Deveria se Preocupar com Jailbreak de IA (Mesmo que não Use ChatGPT)

O que isso Significa para o Futuro da IA?

Gostou do conteúdo? Siga-nos nas redes sociais e acompanhe novos conteúdos diariamente!

Deixe um comentário Cancelar resposta

Você também pode se interessar:

Criatividade Humana vs Inteligência Artificial: Colaboração Entre Pessoas Ainda Gera Ideias Mais Originais

IA Persuasiva: Estudo Mostra Que GPT-4 Supera Humanos Em Debates Personalizados

Pesquisadores do MIT dizem que usar o ChatGPT pode apodrecer o seu cérebro. A verdade é um pouco mais complicada

ChatGPT Pode Avaliar Sua Cognição? O Que Revela a Ciência

Ética e Viés em Inteligência Artificial: Desafios na Medicina e na Pesquisa

Últimos posts

Jailbreak de IA: Quando a Curiosidade Vira um Jogo Perigoso

Índice

Do “Prompt Engineering” ao “Summon a Demon”: A Psicologia por Trás do Jailbreak de IA

Por que você Deveria se Preocupar com Jailbreak de IA (Mesmo que não Use ChatGPT)

O que isso Significa para o Futuro da IA?

Gostou do conteúdo? Siga-nos nas redes sociais e acompanhe novos conteúdos diariamente!

Deixe um comentário Cancelar resposta

Você também pode se interessar:

Menu

Social

Fale conosco

Informações