Opinião

ChatGPT: primeiras impressões para uso na prática forense

Autor

  • Vilian Bollmann

    é juiz federal mestre em Ciência Jurídica pela Universidade do Vale do Itajaí (Univali). É autor dos livros Novo código civil: princípios inovações na parte geral e direito intertemporal; Juizados Especiais Federais: comentários à legislação de regência; Hipótese de Incidência Previdenciária e temas conexos; e Justiça e Previdência.

21 de fevereiro de 2023, 13h22

Este artigo não é "AI free". Partes (pequenas) dele foram escritas diretamente pelo objeto de estudo: ChatGPT. E esse é um alerta intencionalmente colocado no início do texto para suscitar o interesse no debate do tema, pois é possível imaginar que, em futuro muito próximo, será impossível distinguir textos criados por humanos ou robôs.

O ChatGPT é uma tecnologia de processamento de linguagem natural desenvolvida pela OpenAI (empresa estadunidense fundada em 2015 para desenvolver ferramentas em inteligência artificial), que permite a interação em linguagem natural com humanos através de texto. É uma das mais avançadas tecnologias de inteligência artificial na área de linguagem e poder ser usada em uma variedade de aplicações, incluindo assistentes virtuais, chatbots e sistemas de busca.

O usuário digita uma pergunta e o sistema responde buscando na sua base de dados o texto que seja estatisticamente mais lógico. À pergunta com frases "A", "B" e "C", ele sabe (a partir do treinamento dado anteriormente) que a resposta estatística mais próxima seria "D" e "E".  O diferencial desta ferramenta em relação às demais é justamente o tamanho da base de dados utilizada para treinar a sua rede neural [1], com bilhões de palavras.

A OpenAI não revela quantos livros especificamente foram usados para formar a base de dados do ChatGPT, mas é sabido que o modelo foi treinado em uma enorme quantidade de textos de diversas fontes, incluindo livros, artigos, notícias, conversas e muito mais [2]. Além disso, a base de dados do ChatGPT não é composta apenas por livros, mas também por outras fontes de texto. O objetivo é treinar o modelo para ser capaz de compreender e gerar uma ampla gama de línguas e conteúdos.

Isso permite, por exemplo, ao usuário pedir que ele "faça um soneto sobre o amor no tempo das redes sociais que seja nostálgico" [3], para depois mandar que ele seja reelaborado no estilo de Camões [4] ou mesmo gótico [5].

Num exemplo do mundo jurídico, ao escrever "redija uma cláusula contratual num contrato de locação para rescisão se o locatário que hospedar pessoas que não são da família e outra para multar em vinte por cento do contrato total de locação no caso de ele ter cachorro, gato ou outro animal doméstico", o chatGPT responde:

"Cláusula de rescisão:
O locatário concorda em não alojar pessoas que não sejam da sua família imediata no imóvel alugado, sem o prévio consentimento por escrito do locador. Se o locatário violar esta cláusula, o locador terá o direito de rescindir imediatamente este contrato de locação, sem obrigação de quaisquer indenizações ou reembolsos ao locatário.
Cláusula de multa:
O locatário concorda em não manter cachorros, gatos ou outros animais domésticos no imóvel alugado, sem o prévio consentimento por escrito do locador. Se o locatário violar esta cláusula, ele será multado em vinte por cento (20%) do valor total do contrato de locação, devendo esta multa ser paga ao locador imediatamente."

É possível pedir que o ChatGPT resuma uma peça jurídica explicando-a com linguagem própria para um estudante do ensino médio (exemplo: resuma e explique para um estudante do ensino médio o seguinte: "nononon" — em que foi inserido o texto de uma sentença que abordava preliminar de inadequação da via eleita) [6].

Contudo, é necessário fazer pelo menos quatro ressalvas importantes.

A primeira é que, ainda que se apresente com uma aparente certeza, a resposta dada pelo ChatGPT deve ser conferida com cuidado, pois o sistema não é isento de erros ou imprecisões. Ao perguntar sobre os marcos temporais da decadência em matéria tributária na legislação brasileira e seus dispositivos legais, ele traz resposta que pode parecer correta [7], mas omite a diferença entre lançamento por homologação dos casos de lançamento de ofício ou por declaração. Ou, em caso pior, perguntado como o CPC de 2015 prevê a seleção de casos representativos para julgamento de repetitivos, ele traz resposta visivelmente equivocada [8]. Logo, (ainda) é necessária uma supervisão sobre o conteúdo produzido e suas respostas não podem ser tomados como um produto final correto e acabado, mas sim de necessária submissão a apreciação crítica pelo responsável pela sua adoção a cada caso.

A segunda ressalva se refere à ausência de criação e atualidade, ou seja, a ferramenta trabalha com textos é limitada até o ano de 2021 e somente reelabora conteúdo a partir do que existia até então. Apesar de permitir correlacionar itens [9] e gerar novas perspectivas diferentes sobre o conhecimento, ele não está atualizado e nem gera novo conhecimento.

A terceira advertência se refere ao problema já conhecido do risco de que as ferramentas de inteligência artificial reproduzam vieses cognitivos e, pior, preconceitos racistas que já estão presentes nos dados utilizados para treinar os modelos de aprendizado. Há a necessidade de crítica para evitar que o uso da ferramenta perpetue resultados injustos ou discriminatórios.

Por fim, o quarto alerta se refere à ausência da citação das fontes. Isso porque as respostas dadas pelo ChatGPT não permitem visualizar a fonte do conhecimento usado para a formulação da resposta. Aliás, indagado sobre o motivo de não permitir isso, o próprio aplicativo responde que "como modelo de linguagem baseado em treinamento de dados, o OpenAI GPT não tem a capacidade de rastrear fontes específicas ou fornecer referências bibliográficas para as informações que fornece. Em vez disso, ele foi treinado com uma grande quantidade de texto da internet e outras fontes, e produz respostas com base em padrões encontrados nestes dados. No entanto, o objetivo do OpenAI GPT é fornecer informações precisas e confiáveis, e as respostas são geradas com base em informações encontradas em fontes confiáveis. Se você precisar de fontes ou referências específicas para uma resposta, recomendo fazer uma pesquisa adicional utilizando ferramentas de busca na internet ou consultar fontes confiáveis como livros, revistas científicas e sites de notícias respeitáveis".

De qualquer forma, é possível vislumbrar diversas utilidades para essa biblioteca, seja quando usada manualmente via internet, seja inserida em sistemas informatizados como PJe ou eProc via API [10], para funções como:

– identificação de teses jurídicas em petições, esquematizando-as;
– redação preliminar de peças jurídicas a partir da linguagem natural;
– "tradução" de peças jurídicas para públicos diversos, como as partes, jornalistas, etc;
– geração de respostas freqüentes para usuários dos sistemas judiciais;
– simplificação de peças jurídicas selecionando os principais fatos (por exemplo, apresentando-os em quesitos) e argumentos jurídicos;
– seleção de casos para remessa ao STF ou STJ como representativos da controvérsia (CPC, artigo 1036, §2º), identificando os casos que tenham teses originais não contidas nos outros representativos (o que ampliaria o debate da questão);
– apresentação de "overrulings" ou "distinguishings" do caso concreto em relação a temas representativos já julgados (CPC, artigo 489, §1º, VI, 966, §5º; 1037, §9º).

Assim, ainda que em perspectiva de uso inicial, essa ferramenta de inteligência artificial, se usada com o cuidado necessário, pode representar uma modificação profunda na produção jurídica.


[1] Redes Neurais em Inteligência Artificial são um tipo de algoritmo de aprendizado de máquina que se baseiam na estrutura e na função de redes neurais biológicas. Ela é composta por camadas de "neurônios" conectados que trabalham juntos para resolver problemas complexos. Cada um deles é projetado para realizar cálculos simples e cada camada de neurônios pode realizar cálculos mais complexos com base nos resultados da camada anterior. A rede aprende a partir de exemplos de treinamento, ajustando os pesos das conexões entre os neurônios para produzir resultados corretos.

[2]  A wikipedia estima que o modelo GPT-3 foi treinado em seis conjuntos de dados, dos quais o Common Crawl representa 60% (410 bilhões de tokens), o WebText2 22% (19 bilhões de tokens), o Livros1 8% (12 bilhões de tokens), o Livros2 8% (55 bilhões de tokens) e a Wikipédia 3% (3 bilhões de tokens). (https://pt.wikipedia.org/wiki/GPT-3).

[3] Oh amor, que em tempos passados era tão real,
Com cartas e poemas, se declarava.
Hoje em dia, em teclas virtuais, se revela,
Mas falta-lhe o calor e o toque final.
As redes sociais, tão frias e sem alma,
Substituem as cartas, os olhares e os beijos.
E o amor, que antes ardia como uma chama,
Agora é apenas uma curtida ou um emoji.
Mas ainda assim, guardo saudades do passado,
Dos tempos em que o amor era verdadeiro.
E sonho com dias em que ele será revivido,
Com cartas, poemas e um amor sincero.
Por isso, meu bem, guardemos a paixão,
E não permitamos que a tecnologia a apague.

[4] Amado amor, que antigamente florescia
Com cartas escritas e corações ardentes.
Mas agora, nas redes sociais, se esconde,
Sem toque humano, sem vida e calor.

A tecnologia, fria e sem alma,
Substitui o toque da mão, o olhar e o beijo.
Onde o amor antes ardia como uma chama,
Hoje é apenas uma curtida ou um emoji.

Mas eu ainda guardo saudades do passado,
Dos tempos em que o amor era verdadeiro.
E sonho com um dia em que renasça,
Com cartas, poemas e amor sincero.

Por isso, meu bem, deixemos a paixão ardente,
E não permitamos que a tecnologia a apague.
Assim, o amor florescerá mais uma vez,
Como nas épocas de Camões, verdadeiro e sincero.

[5] Oh amor sombrio, com cartas escritas a luz de velas,
Mas agora nas redes sociais se esconde,
Sem toque humano, sem vida e sem calor,
A tecnologia fria, sem alma, governa.

Curtidas e emojis, sombras frias e vazias,
Onde o amor antes ardeu como uma chama,
Mas eu guardo saudades do passado,
Com cartas escritas sob a luz da lua cheia.

Permitamos que a tecnologia não apague,
A paixão sombria, o amor triste e verdadeiro.

Assim, brilhará eternamente,
Nas noites escuras, como uma alma penada.

[6] "A 'restituição administrativa' é uma forma de devolução de valores pagos a maior, indevidamente, ao governo. Essa devolução pode ser solicitada por meio de um processo administrativo, sem precisar de ação judicial. No entanto, a via adequada para a cobrança de valores patrimoniais (como impostos) não é o mandado de segurança, já que esse tipo de processo não possui natureza condenatória e não pode ser utilizado para cobrar valores de forma judicial. Portanto, se o contribuinte deseja solicitar a restituição de tributos indevidamente pagos, ele deve fazê-lo através da via administrativa ou por meio de uma ação judicial própria. Essa é a posição do Supremo Tribunal Federal (STF) e do Superior Tribunal de Justiça (STJ), que já decidiram que é necessário utilizar a via adequada para a cobrança de valores patrimoniais. Em outras palavras, o mandado de segurança não é a forma correta de solicitar a restituição administrativa de tributos indevidamente pagos".

[7] Na legislação brasileira, os marcos temporais da decadência em matéria tributária incluem a data da ocorrência do fato gerador, a data em que o crédito tributário prescreve e a data em que a autoridade fiscal teve conhecimento da obrigação tributária. O prazo de decadência para a cobrança de tributos no Brasil é estabelecido no artigo 173 do Código Tributário Nacional (CTN), que estipula que a cobrança dos tributos deve ser feita dentro de cinco anos a partir da data da ocorrência do fato gerador. A prescrição do crédito tributário é regulamentada pelo artigo 174 do CTN, que estabelece que o crédito tributário prescreve em cinco anos a partir da data em que o sujeito passivo passou a ser exigível. O conhecimento da autoridade fiscal sobre a obrigação tributária é regulamentado pelo artigo 175 do CTN, que estabelece que a cobrança do tributo pode ser feita a partir da data em que a autoridade fiscal teve conhecimento da obrigação tributária, mas não pode ultrapassar o prazo de 5 anos a partir da ocorrência do fato gerador.

[7] "No Código de Processo Civil de 2015, a seleção dos casos representativos para julgamento de temas repetitivos é feita através do instituto da ação declaratória incidental de recuperação judicial (ADI).  De acordo com o Código de Processo Civil, a ação declaratória incidental de recuperação judicial é uma ação que permite ao juiz decidir questões incidentalmente suscitadas no curso de uma recuperação judicial que tenham relevância para a solução de outras demandas idênticas pendentes na Justiça.  Em outras palavras, a ADI permite que questões repetitivas sejam julgadas em um único processo, para fins de segurança jurídica e celeridade processual. O objetivo é evitar decisões divergentes sobre questões similares em processos distintos. Assim, a seleção dos casos representativos para julgamento de temas repetitivos é feita através da escolha de uma ação específica como ação principal, na qual será decidido o tema repetitivo e cujo julgamento terá efeito vinculante para todos os outros processos que tratam do mesmo assunto".

[9] Por exemplo, pedir as diferenças e convergências entre o pensamento de Sócrates, Platão e Aristóteles — ele trará aspectos relevantes dos filósofos (talvez até despercebidos), mas não será informação nova.

[10] OpenAI oferece uma API paga chamada OpenAI GPT-3 API, que permite que terceiros integrem o modelo GPT-3 em seus aplicativos e sistemas. A API oferece acesso a recursos avançados de linguagem natural, incluindo geração de texto, tradução automática, respostas a perguntas etc.

Autores

  • é juiz federal, mestre em Ciência Jurídica pela Universidade do Vale do Itajaí (Univali). É autor dos livros Novo código civil: princípios, inovações na parte geral e direito intertemporal; Juizados Especiais Federais: comentários à legislação de regência; Hipótese de Incidência Previdenciária e temas conexos; e Justiça e Previdência.

Tags:

Encontrou um erro? Avise nossa equipe!