Pular para o conteúdo principal

Estudo identifica três tipos de plágios produzidos pelo ChatGPT

Estudos mostram como modelos de linguagem natural podem ser fonte de má conduta acadêmica e indicam formas de prevenir o problema

FABRÍCIO MARQUES | revista Pesquisa FAPESP
jornalista

Pesquisadores da Universidade do Estado da Pensilvânia (Penn State), nos Estados Unidos, investigaram até que ponto modelos de linguagem natural como o ChatGPT, que usam inteligência artificial para formular uma prosa realista e articulada em resposta a perguntas de usuários, conseguem gerar conteúdo que não se caracterize como plágio. Isso porque esses sistemas processam, memorizam e reproduzem informações preexistentes, baseadas em gigantescos volumes de dados disponíveis na internet, tais como livros, artigos científicos, páginas da Wikipédia e notícias.

O grupo analisou 210 mil textos gerados pelo programa GPT-2, da startup OpenAI, criadora do ChatGPT, em busca de indícios de três diferentes tipos de plágio: a transcrição literal, obtida copiando e colando trechos; a paráfrase, que troca palavras por sinônimos a fim de obter resultados ligeiramente diferentes; e o uso de uma ideia elaborada por outra pessoa sem mencionar sua autoria, mesmo que formulada de maneira diferente.

A conclusão do estudo foi de que todos os três tipos de cópia estão presentes. E, quanto maior é o conjunto de parâmetros usados para treinar os modelos, mais frequentemente a má conduta foi registrada.

 
A análise utilizou dois tipos de modelos — os pré-treinados, baseados em um amplo espectro de dados, e os de ajuste fino, aprimorados pela equipe da PennState a fim de concentrar e refinar a análise em um conjunto menor de documentos científicos e jurídicos, artigos acadêmicos relacionados à Covid-19 e solicitações de patentes. 

A escolha desse tipo de conteúdo não foi ocasional — nesses textos, a prática de plágio é considerada muito problemática e não costuma ser tolerada.

No material gerado pelos pré-treinados, a ocorrência mais prevalente foi de transcrições literais, enquanto nos de ajuste fino eram mais comuns paráfrases e apropriação de ideias sem referência à fonte. 

“Constatamos que o plágio aparece com diferentes sabores”, disse um dos autores do trabalho, Dongwon Lee, cientista da computação da Faculdade de Tecnologia e Ciências da Informação da Penn State, conforme o serviço de notícias Eurekalert.

Inteligência
artificial
eleva o
patamar
do plágio

O ChatGPT é um entre vários sistemas baseados em inteligência artificial e ganhou grande notoriedade porque foi disponibilizado para uso público. Desde novembro, já foi testado por mais de 100 milhões de pessoas e impressionou por sua capacidade de gerar textos coerentes que mimetizam a escrita dos seres humanos. Uma das polêmicas que levantou envolveu justamente a originalidade de suas respostas e o receio de que se transforme em uma fonte de má conduta acadêmica.

“As pessoas perseguem grandes modelos de linguagem porque, quanto maior um modelo fica, mais suas habilidades aumentam”, disse o autor principal do trabalho, Jooyoung Lee, estudante de doutorado na Faculdade de Ciências e Tecnologia da Informação da Penn State. 

Ferramentas de escrita de inteligência artificial conseguem criar respostas únicas e individualizadas a perguntas apresentadas por usuários, mesmo extraindo as informações de um banco de dados. Essa habilidade, contudo, não livra a ferramenta de ser uma fonte de plágio, mesmo em formatos mais difíceis de detectar. “Ensinamos os modelos a imitar a escrita humana, mas não os ensinamos a não plagiar”, afirmou Lee.

Várias ferramentas estão sendo desenvolvidas para detectar conteúdo gerado por softwares de inteligência artificial. A própria OpenAI desenvolveu um programa capaz de apontar textos feitos por robôs, (disponível em openai-openai-detector.hf.space/). Há outras do gênero na internet, como o Writer AI Content Detector (writer.com/ai-content-detector/) e o Content at Scale (contentatscale.ai/ai-content-detector/).

Como os sistemas de linguagem natural estão em desenvolvimento, também será necessário atualizar continuamente a tecnologia para rastrear sua produção.

Uma equipe da Escola de Engenharias e Ciências Aplicadas da mesma PennState mostrou ser possível treinar as pessoas para identificar esses textos, sem precisar depender exclusivamente de programas detectores. 

Apresentado em fevereiro em um congresso da Associação para o Avanço da Inteligência Artificial realizado em Washington, Estados Unidos, o estudo liderado pelo cientista da computação Chris Callison-Burch mostrou que essas ferramentas já são muito eficientes em produzir prosa fluente e seguir as regras gramaticais. “Mas eles cometem tipos distintos de erros que podemos aprender a identificar”, disse ao blog Penn Engineering Today o cientista da computação Liam Dugan, aluno de doutorado da Penn State e um dos autores do artigo.

> Com informação da Universidade do Estado da Pensilvânia.

• ChatGPT não estimula o pensamento crítico dos estudantes

• ChatGPT se recusa a gerar pedido de dízimo. É enganação, afirma

• O que o ChatGPT diz sobre o ateísmo no Brasil? Veja


Comentários

Post mais lidos nos últimos 7 dias

90 trechos da Bíblia que são exemplos de ódio e atrocidade

Veja 14 proibições das Testemunhas de Jeová a seus seguidores

Dawkins é criticado por ter 'esperança' de que Musk não seja tão estúpido como Trump

Seleção de vôlei sequestrou palco olímpico para expor crença cristã

Título original: Oração da vitória por Daniel Sottomaior (foto) para Folha de S.Paulo Um hipotético sujeito poderoso o suficiente para fraudar uma competição olímpica merece ser enaltecido publicamente? A se julgar pela ostensiva prece de agradecimento da seleção brasileira de vôlei pela medalha de ouro nas Olimpíadas, a resposta é um entusiástico sim! Sagrado é o direito de se crer em qualquer mitologia e dá-la como verdadeira. Professar uma religião em público também não é crime nenhum, embora costume ser desagradável para quem está em volta. Os problemas começam quando a prática religiosa se torna coercitiva, como é a tradição das religiões abraâmicas. Os membros da seleção de vôlei poderiam ter realizado seus rituais em local mais apropriado. É de se imaginar que uma entidade infinita e onibenevolente não se importaria em esperar 15 minutos até que o time saísse da quadra. Mas uma crescente parcela dos cristãos brasileiros não se contenta com a prática privada: para

TJs perdem subsídios na Noruega por ostracismo a ex-fiéis. Duro golpe na intolerância religiosa

Veja os 10 trechos mais cruéis da Bíblia

Condenado por estupro, pastor Sardinha diz estar feliz na cadeia

Pastor foi condenado  a 21 anos de prisão “Estou vivendo o melhor momento de minha vida”, diz José Leonardo Sardinha (foto) no site da Igreja Assembleia de Deus Ministério Plenitude, seita evangélica da qual é o fundador. Em novembro de 2008 ele foi condenado a 21 anos de prisão em regime fechado por estupro e atentado violento ao pudor. Sua vítima foi uma adolescente que, com a família, frequentava os cultos da Plenitude. A jovem gostava de um dos filhos do pastor, mas o rapaz não queria saber dela. Sardinha então disse à adolescente que tinha tido um sonho divino: ela deveria ter relações sexuais com ele para conseguir o amor do filho, e a levou para o motel várias vezes. Mas a ‘profecia’ não se realizou. O Sardinha Jr. continuou não gostando da ingênua adolescente. No texto publicado no site, Sardinha se diz injustiçado pela justiça dos homens, mas em contrapartida, afirma, Deus lhe deu a oportunidade de levar a palavra Dele à prisão. Diz estar batizando muita gen

Proibido o livro do padre que liga a umbanda ao demônio

Padre Jonas Abib foi  acusado da prática de  intolerância religiosa O Ministério Público pediu e a Justiça da Bahia atendeu: o livro “Sim, Sim! Não, Não! Reflexões de Cura e Libertação”, do padre Jonas Abib (foto), terá de ser recolhido das livrarias por, nas palavras do promotor Almiro Sena, conter “afirmações inverídicas e preconceituosas à religião espírita e às religiões de matriz africana, como a umbanda e o candomblé, além de flagrante incitação à destruição e ao desrespeito aos seus objetos de culto”. O padre Abib é ligado à Renovação Carismática, uma das alas mais conservadoras da Igreja Católica. Ele é o fundador da comunidade Canção Nova, cuja editora publicou o livro “Sim, Sim!...”, que em 2007 vendeu cerca de 400 mil exemplares, ao preço de R$ 12,00 cada um, em média. Manuela Martinez, da Folha, reproduz um trecho do livro: "O demônio, dizem muitos, "não é nada criativo". (...) Ele, que no passado se escondia por trás dos ídolos, hoje se esconde no

Santuário Nossa Senhora Aparecida fatura R$ 100 milhões por ano

Basílica atrai 10 milhões de fiéis anualmente O Santuário de Nossa Senhora de Aparecida é uma empresa da Igreja Católica – tem CNPJ (Cadastro Nacional de Pessoa Jurídica) – que fatura R$ 100 milhões por ano. Tudo começou em 1717, quando três pescadores acharam uma imagem de Nossa Senhora no rio Paraíba do Sul, formando-se no local uma vila que se tornou na cidade de Aparecida, a 168 km de São Paulo. Em 1984, a CNBB (Conferência Nacional dos Bispos do Brasil) concedeu à nova basílica de Aparecida o status de santuário, que hoje é uma empresa em franca expansão, beneficiando-se do embalo da economia e do fortalecimento do poder aquisitivo da população dos extratos B e C. O produto dessa empresa é o “acolhimento”, disse o padre Darci José Nicioli, reitor do santuário, ao repórter Carlos Prieto, do jornal Valor Econômico. Para acolher cerca de 10 milhões de fiéis por ano, a empresa está investindo R$ 60 milhões na construção da Cidade do Romeiro, que será constituída por trê

Psicóloga defende Feliciano e afirma que monstro é a Xuxa

Marisa Lobo fez referência ao filme de Xuxa com garoto de 12 anos A “psicóloga cristã” Marisa Lobo (foto) gravou um vídeo [ver abaixo] de 2 minutos para defender o pastor e deputado Marco Feliciano (PSC-SP) da crítica da Xuxa segundo a qual ele é um “monstro” por propagar que a África é amaldiçoada e a Aids é uma “doença gay”. A apresentadora, em sua página no Facebook, pediu mobilização de seus fãs para que Feliciano seja destituído da presidência da Comissão de Direitos Humanos e das Minorias da Câmara. Lobo disse que “monstro é quem faz filme pornô com criança de 12 anos”. Foi uma referência ao filme “Amor Estranho Amor”, lançado em 1982, no qual Xuxa faz o papel de uma prostituta. Há uma cena em que a personagem, nua, seduz um garoto, filho de outra mulher do bordel. A psicóloga evangélica disse ter ficado “a-pa-vo-ra-da” por ter visto nas redes sociais que Xuxa, uma personalidade, ter incitado ódio contra um pastor. Ela disse que as filhas (adolescentes) do pastor são fãs