Estudo identifica três tipos de plágios produzidos pelo ChatGPT

Estudos mostram como modelos de linguagem natural podem ser fonte de má conduta acadêmica e indicam formas de prevenir o problema

FABRÍCIO MARQUES | revista Pesquisa FAPESP
jornalista

Pesquisadores da Universidade do Estado da Pensilvânia (Penn State), nos Estados Unidos, investigaram até que ponto modelos de linguagem natural como o ChatGPT, que usam inteligência artificial para formular uma prosa realista e articulada em resposta a perguntas de usuários, conseguem gerar conteúdo que não se caracterize como plágio. Isso porque esses sistemas processam, memorizam e reproduzem informações preexistentes, baseadas em gigantescos volumes de dados disponíveis na internet, tais como livros, artigos científicos, páginas da Wikipédia e notícias.

O grupo analisou 210 mil textos gerados pelo programa GPT-2, da startup OpenAI, criadora do ChatGPT, em busca de indícios de três diferentes tipos de plágio: a transcrição literal, obtida copiando e colando trechos; a paráfrase, que troca palavras por sinônimos a fim de obter resultados ligeiramente diferentes; e o uso de uma ideia elaborada por outra pessoa sem mencionar sua autoria, mesmo que formulada de maneira diferente.

A conclusão do estudo foi de que todos os três tipos de cópia estão presentes. E, quanto maior é o conjunto de parâmetros usados para treinar os modelos, mais frequentemente a má conduta foi registrada.

A análise utilizou dois tipos de modelos — os pré-treinados, baseados em um amplo espectro de dados, e os de ajuste fino, aprimorados pela equipe da PennState a fim de concentrar e refinar a análise em um conjunto menor de documentos científicos e jurídicos, artigos acadêmicos relacionados à Covid-19 e solicitações de patentes.

A escolha desse tipo de conteúdo não foi ocasional — nesses textos, a prática de plágio é considerada muito problemática e não costuma ser tolerada.

No material gerado pelos pré-treinados, a ocorrência mais prevalente foi de transcrições literais, enquanto nos de ajuste fino eram mais comuns paráfrases e apropriação de ideias sem referência à fonte.

“Constatamos que o plágio aparece com diferentes sabores”, disse um dos autores do trabalho, Dongwon Lee, cientista da computação da Faculdade de Tecnologia e Ciências da Informação da Penn State, conforme o serviço de notícias Eurekalert.

Inteligência
artificial
eleva o
patamar
do plágio

O ChatGPT é um entre vários sistemas baseados em inteligência artificial e ganhou grande notoriedade porque foi disponibilizado para uso público. Desde novembro, já foi testado por mais de 100 milhões de pessoas e impressionou por sua capacidade de gerar textos coerentes que mimetizam a escrita dos seres humanos. Uma das polêmicas que levantou envolveu justamente a originalidade de suas respostas e o receio de que se transforme em uma fonte de má conduta acadêmica.

“As pessoas perseguem grandes modelos de linguagem porque, quanto maior um modelo fica, mais suas habilidades aumentam”, disse o autor principal do trabalho, Jooyoung Lee, estudante de doutorado na Faculdade de Ciências e Tecnologia da Informação da Penn State.

Ferramentas de escrita de inteligência artificial conseguem criar respostas únicas e individualizadas a perguntas apresentadas por usuários, mesmo extraindo as informações de um banco de dados. Essa habilidade, contudo, não livra a ferramenta de ser uma fonte de plágio, mesmo em formatos mais difíceis de detectar. “Ensinamos os modelos a imitar a escrita humana, mas não os ensinamos a não plagiar”, afirmou Lee.

Várias ferramentas estão sendo desenvolvidas para detectar conteúdo gerado por softwares de inteligência artificial. A própria OpenAI desenvolveu um programa capaz de apontar textos feitos por robôs, (disponível em openai-openai-detector.hf.space/). Há outras do gênero na internet, como o Writer AI Content Detector (writer.com/ai-content-detector/) e o Content at Scale (contentatscale.ai/ai-content-detector/).

Como os sistemas de linguagem natural estão em desenvolvimento, também será necessário atualizar continuamente a tecnologia para rastrear sua produção.

Uma equipe da Escola de Engenharias e Ciências Aplicadas da mesma PennState mostrou ser possível treinar as pessoas para identificar esses textos, sem precisar depender exclusivamente de programas detectores.

Apresentado em fevereiro em um congresso da Associação para o Avanço da Inteligência Artificial realizado em Washington, Estados Unidos, o estudo liderado pelo cientista da computação Chris Callison-Burch mostrou que essas ferramentas já são muito eficientes em produzir prosa fluente e seguir as regras gramaticais. “Mas eles cometem tipos distintos de erros que podemos aprender a identificar”, disse ao blog Penn Engineering Today o cientista da computação Liam Dugan, aluno de doutorado da Penn State e um dos autores do artigo.

> Com informação da Universidade do Estado da Pensilvânia.

• ChatGPT não estimula o pensamento crítico dos estudantes

• ChatGPT se recusa a gerar pedido de dízimo. É enganação, afirma

• O que o ChatGPT diz sobre o ateísmo no Brasil? Veja

Comentários

Post mais lidos nos últimos 7 dias

90 trechos da Bíblia que são exemplos de ódio e atrocidade

Reação de aluno ateu a bullying acaba com pai-nosso na escola

O estudante já vinha sendo intimidado O estudante Ciel Vieira (foto), 17, de Miraí (MG), não se conformava com a atitude da professora de geografia Lila Jane de Paula de iniciar a aula com um pai-nosso. Um dia, ele se manteve em silêncio, o que levou a professora a dizer: “Jovem que não tem Deus no coração nunca vai ser nada na vida”. Era um recado para ele. Na classe, todos sabem que ele é ateu. A escola se chama Santo Antônio e é do ensino estadual de Minas. Miraí é uma cidade pequena. Tem cerca de 14 mil habitantes e fica a 300 km de Belo Horizonte. Quando houve outra aula, Ciel disse para a professora que ela estava desrespeitando a Constituição que determina a laicidade do Estado. Lila afirmou não existir nenhuma lei que a impeça de rezar, o que ela faz havia 25 anos e que não ia parar, mesmo se ele levasse um juiz à sala de aula. Na aula seguinte, Ciel chegou atrasado, quando a oração estava começando, e percebeu ele tinha sido incluído no pai-nosso. Aparentemen...

Veja 14 proibições das Testemunhas de Jeová a seus seguidores

Eleição de Haddad significará vitória contra religião, diz Chaui

Marilena Chaui criticou o apoio de Malafaia a Serra A seis dias das eleições do segundo turno, a filósofa e professora Marilena Chaui (foto), da USP, disse ontem (23) que a eleição em São Paulo do petista Fernando Haddad representará a vitória da “política contra a religião”. Na pesquisa mais recente do Datafolha sobre intenção de votos, divulgada no dia 19, Haddad estava com 49% contra 32% do tucano José Serra. Ao participar de um encontro de professores pró-Haddad, Chaui afirmou que o poder vem da política, e não da “escolha divina” de governantes. Ela criticou o apoio do pastor Silas Malafaia, da Assembleia de Deus do Rio, a Serra. Malafaia tem feito campanha para o tucano pelo fato de o Haddad, quando esteve no Ministério da Educação, foi o mentor do frustrado programa escolar de combate à homofobia, o chamado kit gay. Na campanha do primeiro turno, Haddad criticou a intromissão de pastores na política-partidária, mas agora ele tem procurado obter o apoio dos religi...

Conar cede a religiosos e veta Jesus de anúncio da Red Bull

Mostrar Jesus andando no rio é uma 'ofensa ' O Conar (Conselho Nacional de Autorregulamentação Publicitária) se curvou diante da censura religiosa e suspendeu o anúncio da Red Bull que apresenta uma versão bem humorada de um dos milagres de Jesus. Ao analisar cerca de 200 reclamações, o órgão concluiu que o anúncio “desrespeita um objeto da fé religiosa”. O “desrespeito” foi Jesus ter dito que, na verdade, ele não andou sobre as águas, mas sobre as pedras que estavam no rio. Religiosos creem em milagres, mas impor essa crença a um anúncio é atentar contra a liberdade de expressão de uma sociedade constituída pela diversidade cultural e religiosa. O pior é que, pela decisão do Conar, a censura se estende aos futuros anúncios da Red Bull, os quais não poderão “seguir a mesma linha criativa”. Ou seja, a censura religiosa adotada pelo Conar “matou”, nesse caso, a criatividade antes mesmo de sua concepção — medida típica de regimes teocráticos. "Jesus...

Verdades absolutas da religião são incompatíveis com a política

por Marcelo Semer para o Terra Magazine Dogmas religiosos não estão sob o escrutínio popular No afã de defender Marco Feliciano das críticas recebidas por amplos setores da sociedade, o blogueiro de Veja, Reinaldo Azevedo, disse que era puro preconceito o fato de ele ser constantemente chamado de pastor. Infelizmente não é. Pastor Marco Feliciano é o nome regimental do deputado, como está inscrito na Câmara e com o qual disputou as últimas eleições. Há vários casos de candidatos que acrescentam a sua profissão como forma de maior identificação com o eleitorado, como o Professor Luizinho ou ainda a Juíza Denise Frossard. Marco Feliciano não está na mesma situação –sua evocação é um claro chamado para o ingresso da religião na política, que arrepia a quem quer que ainda guarde a esperança de manter intacta a noção de estado laico. A religião pode até ser um veículo para a celebração do bem comum, mas seu espaço é nitidamente diverso. Na democracia, ...

Caso Roger Abdelmassih

Violência contra a mulher Liminar concede transferência a Abelmassih para hospital penitenciário 23 de novembro de 2021 Justiça determina que o ex-médico Roger Abdelmassih retorne ao presídio 29 de julho de 2021 Justiça concede prisão domiciliar ao ex-médico condenado por 49 estupros 5 de maio de 2021 Lewandowski nega pedido de prisão domiciliar ao ex-médico Abdelmassih 26 de fevereiro de 2021 Corte de Direitos Humanos vai julgar Brasil por omissão no caso de Abdelmassih 6 de janeiro de 2021 Detento ataca ex-médico Roger Abdelmassih em hospital penitenciário 21 de outubro de 2020 Tribunal determina que Abdelmassih volte a cumprir pena em prisão fechada 29 de agosto de 2020 Abdelmassih obtém prisão domicililar por causa do coronavírus 14 de abril de 2020 Vicente Abdelmassih entra na Justiça para penhorar bens de seu pai 20 de dezembro de 2019 Lewandowski nega pedido de prisão domiciliar ao ex-médico estuprador 19 de novembro de 2019 Justiça cancela prisão domi...

1º Encontro Nacional de Ateus obtém adesão de 25 cidades

Lakatos: "Queremos mostrar a nossa cara " O 1º Encontro Nacional de Ateus será realizado no dia 12 de fevereiro com participantes de 25 cidades em 23 Estados (incluindo o Distrito Federal). A expectativa é de que ele reúna cerca de 5.000 pessoas. A mobilização para realizar o encontro – independentemente do resultado que possa ter – mostra que os ateus brasileiros, principalmente os mais jovens, começam a se articular em todo o país a partir da internet. A ideia da reunião surgiu no Facebook. Pelo IBGE, os ateus e agnósticos são 2% da população. O que representa 3,8 milhões de pessoas, se o censo de 2010, que apurou uma população de 190,7 milhões, mantiver esse índice. “Queremos mostrar a nossa cara”, disse Diego Lakatos (foto), 23, que é o vice-presidente da entidade organizadora do evento, a SR (Sociedade Racionalista). “Queremos mostrar que defendemos um Brasil laico, com direitos igualitários a todas as minorias, independentemente de crença ou da inexis...

Bolsonaro quer que hospitais identifiquem sangue de doador gay

Deputado disse que gays correm mais risco de ter doenças O deputado Jair Bolsonaro (foto), do PP-RJ, informou que apresentará um projeto de lei que, se aprovado, obrigará os hospitais a identificar nas bolsas de sangue a opção sexual do doador, de modo que o paciente possa recusá-lo quando for de gay, se assim ele quiser. Ele justificou o projeto de lei com a informação do Ministério da Saúde segundo a qual os homossexuais correm o risco de contrair doenças de transmissíveis pelo sangue 17 vezes a mais do que os heterossexuais -- a mais grave delas é a síndrome causada pelo vírus HIV. Até o mês passado, homossexuais estavam proibidos de doar sangue. Agora, de acordo com novas regras do ministério, gays com parceiro estável ou que não tenham tido nenhuma relação sexual nos últimos doze meses estão liberados para a doação. Bolsonaro afirmou que os hospitais deixam “tudo misturado” no banco de sangue, não distinguindo os doadores homossexuais, o que, segun...

Jornalista que critica Estado laico desconhece história

de um leitor a propósito de Defensores do Estado laico são ‘intolerantes’, diz apresentadora As aulas de história passaram bem longe de Rachel Sheherazade Que a apresentadora Rachel Sheherazade metida a Boris Casoy é péssima, isso já é sabido. Os comentários dela são, em sua gigantesca maioria, infelizes, sem nenhum conteúdo ou profundidade. E agora está se mostrando uma Malafaia de saia! Primeiro, é mentira que “laicistas” (como se fosse um grupo formado) perseguem o cristianismo. Não há uma única evidência disso. Ela alega isso para se fazer falsamente de vítima. Pura tática fundada na falácia ad terrorem . Segundo, as aulas de história passaram longe dela. Mas bem longe mesmo! O cristianismo não deu base nenhuma de respeito, liberdade, honestidade e justiça. Durante a idade média, era justamente o contrário que acontecia na maioria das vezes. A separação entre Estado e religião quem deu base para a maioria das liberdades, inclusive de jornalismo e profis...

Paulopes