LLM: os Large Language Models na prática jurídica corporativa

Palavras, parágrafos e algoritmos que trazem mais eficiência ao cotidiano

Por Daniel Becker e Paulo Samico

“O fim dos advogados”, “A inteligência artificial está atrás do seu trabalho”, “Conheça o primeiro robô-advogado”. Tais manchetes inundaram feeds desde meados da última década. A coisa ficou pior quando surgiu um metaverso repleto de possibilidades – o mundo jurídico observou de perto o seu apogeu e perigeu em tão pouco tempo.

Em dez anos, vimos muitas promessas e poucos resultados. Muitos inclusive desacreditaram o uso da inteligência artificial (IA) como ferramenta de valor para a prática jurídica. O hype, quando é um fim em si mesmo, geralmente tem efeitos deletérios. Contudo, a partir de novembro do ano passado, o termo “inteligência artificial” voltou com tudo, desta vez impulsionado pelas IAs generativas, entre elas o ChatGPT. Neste breve texto, pretendemos discutir, com o pé no chão, essas novas aplicações sob a perspectiva de Departamentos Jurídicos. Como ser pragmático e, ao mesmo tempo, se permitir seguir adiante?

O ChatGPT, assim como o Bard e o LLaMA^[1], é um Large Language Model (LLM), isto é, grandes modelos de linguagem na área de aprendizado de máquina (machine learning) que têm a capacidade de prever palavras em um texto com base nas anteriores. Esses modelos utilizam a arquitetura Transformer, inspirada em ideias de tradução automática.

O diferencial dos LLMs está em sua capacidade de processar e entender grandes quantidades de dados de treinamento, o que os torna altamente proficientes em diversas tarefas, como classificação de documentos, resumos de texto, perguntas e respostas (Q&As) e geração de texto. Eles são treinados com vastos corpos de texto, como a Wikipedia, o Book Corpus e o Common Crawl, possibilitando que absorvam conhecimento a partir de grandes volumes de informações não rotuladas.

No universo jurídico, os modelos de linguagem despertam especial interesse. Tarefas rotineiras constituem muitas vezes uma necessidade pesada, um ritual que drena tempo e energia. Nesse palco, os LLMs surgem como um recurso vital, liberando advogados dessas tarefas repetitivas para se focarem em desafios intelectuais mais profundos.

Como poderiam ser utilizadas? Alguns exemplos:

Pesquisa jurídica: campo frequentemente entulhado de montanhas de dados e textos. Aqui, os LLMs agem como uma bússola, apontando para precedentes relevantes e sintetizando informações, tornando a pesquisa não apenas mais ágil, mas também mais precisa.

Simplificação: sabemos que quando se trata de textos jurídicos, a complexidade é intrínseca à sua natureza, posto que são repletos de jargões e nuances. Os LLMs são inestimáveis aqui. Eles têm a habilidade de processar e analisar essa linguagem natural, descobrindo insights e detalhes que poderiam ser decisivos para um caso ou negociação.

Estratégia: aqui, os LLMs oferecem uma perspectiva adicional na estratégia jurídica ao analisar dados históricos e jurisprudências, proporcionando estimativas informadas sobre os resultados de casos futuros. Embora não sejam um substituto para o discernimento humano, atuam como uma ferramenta auxiliar valiosa na tomada de decisões.

Antes de seguirmos nos exemplos, um texto interessante publicado na Law.com chama a atenção para uma nova necessidade envolvendo LLMs: uma apólice de seguro que faça a cobertura de eventuais danos gerados pela inteligência artificial. Se a IA é generativa, ela é capaz não só de gerar soluções, mas também novos problemas. Interrompemos os tópicos justamente para provocar uma reflexão: seus fornecedores de tecnologia se responsabilizam sobre os riscos gerados pela IA utilizada em suas atividades, incluindo os danos reputacionais? Ou ele limita a responsabilidade? E se for proibida a sua utilização em contrato, como é feito o tracking do processo para identificação do uso em caso de auditoria?

O ideal aqui não é proibir. É liberar, com restrições e responsabilidades. E em que pese as reflexões sobre o alerta feito acima, sabemos que as vantagens são inúmeras. No ambiente corporativo, por exemplo, a barreira linguística que muitas vezes existe entre os Departamentos Jurídicos e o resto da empresa também pode ser mitigada por LLMs. Veja a seguir mais benefícios:

Democracia do conhecimento: os LLMs podem decodificar o jargão legal, tornando-o compreensível para aqueles sem formação jurídica, o que auxilia na tomada de decisões mais informadas em toda a organização.

Lifelong learning: no desenvolvimento profissional, que é essencial em qualquer carreira e particularmente no Direito, os LLMs também encontram sua utilidade. Eles podem ser usados para desenvolver material de treinamento prático, como simulações e testes, aprimorando não só as habilidades do time jurídico de forma contínua, mas também viabilizando melhores rotinas de governança. Pensar em perguntas para avaliação do conhecimento? O LLM pode ajudar.

Gerência de riscos e conformidade: nestes dois pilares da atuação jurídica, os LLMs se mostram uma adição benéfica. Eles podem ser programados para sinalizar termos e ações em documentos que possam representar riscos legais, adicionando uma camada de segurança ao processo. Para lidar com o fluxo constante de consultas e questões que um Jurídico enfrenta, LLMs servem como um primeiro filtro eficaz. Eles podem tratar de perguntas mais simples, encaminhando casos mais complexos para intervenção humana especializada.

ESG: em uma sociedade que roga práticas sustentáveis a todos os participantes da cadeia de negócios, ter um apoio para controle dos prazos, metas e gestão dos indicadores para dar conforto ao acionista ao consumidor fará toda a diferença. Inclusive, será útil esses subsídios à mão caso seja necessário.

Contencioso de volume: já é possível pensar nos LLMs como ferramenta fundamental na gestão de contencioso de volume. É, na verdade, o caso ideal para o potencial da tecnologia, no estado da arte em que ela se encontra. Estamos falando de cenários em que dezenas, centenas ou até milhares de pessoas ou entes ajuízam ações semelhantes contra um único réu. Agora, imagine que você está do lado receptor dessas reivindicações, atolado em documentos legais e dados que crescem a cada minuto.

Ainda sobre o contencioso, é aqui que a beleza do aprendizado de máquina se revela. Por quê? Primeiro, o volume de dados disponíveis é vasto. Segundo, apenas algumas métricas-chave precisam ser extraídas desses documentos para informar os próximos passos. Por último, o tratamento desse mar de dados, incluindo a análise de documentos e a formulação de estratégias baseadas em exposições de risco, é praticamente impossível sem algum nível de análise de dados estruturada.

Então, como isso funcionaria na prática?

Um modelo pré-treinado reconhece o tipo de documento através de sua página principal.

Em seguida, a digitalização ótica de caracteres (OCR) é aplicada para extrair o texto.

Um algoritmo busca as métricas-chave (KPIs); e

Finalmente, cada dado extraído é validado.

Esta validação não é apenas um capricho tecnológico. Ela é essencial para garantir que cada KPI esteja 100% correto. Uma vez validados, esses dados são importados para um sistema de gestão de casos, onde são usados para calcular exposições financeiras e riscos, entre outros indicadores críticos que auxiliam na tomada de decisão, isto é, prosseguir com defesa, formular acordo etc.

Em suma, a gestão de reclamações em massa é uma área onde o aprendizado de máquina não apenas faz sentido, mas é quase um pré-requisito para uma atuação eficaz e eficiente.

Entretanto, a despeito disso, o setor jurídico demonstra resistência singular a essa invasão tecnológica, suscitando preocupações que vão além de mera relutância à mudança. Questionamentos e reflexões sobre à sua utilização são válidos. Proibições infundadas, não.

O campo da intersecção entre direito e engenharia de dados está repleto de desafios complexos que afetam ambas as profissões. Diferente de setores onde informações fluem livremente, o ambiente jurídico sofre de uma falta crônica de dados acessíveis. Essa escassez se deve a múltiplas barreiras, desde obrigações de confidencialidade até a falta de uma cultura de compartilhamento de informações. Mesmo quando se supera o obstáculo da disponibilidade de dados, o desafio subsequente é a complexidade semântica. Enquanto é fácil para advogados etiquetar nomes de empresas ou endereços, a rotulagem de cláusulas contratuais e petições judiciais com estruturas gramaticais complexas se torna uma tarefa monumental.

Além desses problemas, há também considerações adicionais que complicam ainda mais a situação. Por exemplo, os LLMs (Modelos de Linguagem Jurídica, em tradução livre) são geralmente treinados em dados em inglês, limitando sua eficácia em contextos que utilizam o português. Essa barreira linguística pode diminuir a eficiência da automatização de tarefas legais em países lusófonos e introduzir erros ou vieses. Por último, mas não menos importante, a implementação dessas tecnologias requer uma infraestrutura tecnológica robusta e um certo grau de tolerância ao risco, recursos que nem todas as instituições possuem. Isso torna os custos difíceis de prever e acrescenta preocupações adicionais sobre a segurança da informação.

LLMs não são um deus ex machina pronto para solucionar todas as contendas jurídicas. Há uma tendência de antever a tecnologia como uma panaceia ou relegá-la ao plano do inútil por não ser infalível. A chave é a moderação, um equilíbrio entre expectativa e ceticismo. Lançar-se à tarefa de incorporá-la na organização de modo indiscriminado seria o equivalente a querer ler todos os livros da biblioteca em uma única tarde: um delírio.

Ao invés disso, deve ser considerada sabedoria milenar da experimentação controlada. Casos de uso isolados, neste momento, são recomendáveis, sem o peso de prazos exíguos ou uma busca irracional pela perfeição. Desenvolvimento e teste devem se alternar em um diálogo epistemológico, que também forneça as coordenadas para um processo manual de validação. Assim, ao compreender as limitações inerentes ao machine learning e os requisitos para sua validação, estaremos aptos a desenhar processos para soluções mais complexas, à medida que avançamos nos corredores dos LLMs. Em suma, o mercado jurídico se confronta com um labirinto de complexidades que exige não apenas algoritmos, mas também uma profunda reflexão e preparação metodológica.

[1] LLaMA é a nova inteligência artificial da Meta. É um acrônimo para Large Language Model Meta AI.

DANIEL BECKER – Sócio do BBL Advogados, diretor de novas tecnologias no Centro Brasileiro de Mediação e Arbitragem (CBMA), organizador dos livros “O Advogado do Amanhã: Estudos em Homenagem ao professor Richard Susskind”, “O fim dos advogados? Estudos em Homenagem ao professor Richard Susskind – vol. II”, “Regulação 4.0, vols. I e II”, “Litigation 4.0” e “Comentários à Lei Geral de Proteção de Dados”, todos publicados pela Revista dos Tribunais

PAULO SAMICO – Graduado em Direito pela Faculdade Nacional de Direito da UFRJ, pós-graduado em Processo Civil e em Direito Regulatório pela UERJ. Foi coordenador jurídico na BAT Brasil (Souza Cruz), atuando como business partner em diferentes áreas do negócio pelo núcleo consultivo e contencioso (regulatório e cível) e coordenador do comitê jurídico de inovação. Foi coordenador e membro-fundador do núcleo de Departamentos Jurídicos da AB2L. Idealizador e coordenador dos livros ‘Departamento Jurídico 4.0 & Legal Operations’, ‘Legal Operations: como começar’, ‘Criatividade é comportamento… Inovação é processo’, todos pela Saraivajur. É professor da Future Law, gerente jurídico da Mondelēz International, autor de artigos publicados em diversos periódicos jurídicos e colunista da Legal & Business, uma coluna do JOTA