Jurídico · ERP & Fiscal · On-premise · Benchmark TJ-GO validado · Google Cloud for Startups

Acórdão bruto: 1.570 tokens.
Com HANE: 218 tokens.

HANE extrai entidades estruturadas de acórdãos, contratos, manuais ERP e documentos fiscais — entregando até 86% menos tokens ao seu LLM. Seus documentos nunca saem do seu ambiente.

Ver Demo → Falar com a equipe

85,9% menos tokens no LLM 148 ms mediana por acórdão Recall 1,0 entidades críticas 0 bytes saem do Tribunal

ACÓRDÃO · TJ-GO · 0001234-05.2024

// Antes — acórdão bruto (1.570 tokens)

EMENTA: APELAÇÃO CÍVEL. INDENIZAÇÃO POR DANOS MORAIS.

RESPONSABILIDADE CIVIL DO ESTADO. SERVIDOR PÚBLICO.

VALOR ARBITRADO EM R$ 15.000,00. RECURSO PARCIALMENTE

PROVIDO. RELATOR: DES. JOÃO MENDES. 2ª CÂMARA CÍVEL.

// ... + 48 páginas de fundamentação ...

1.570 tokens −86% ↓ 218 tokens

# HANE — contexto comprimido para o LLM

domain: juridico_pt

tipo: acórdão · apelação cível

partes: Estado de Goiás × Ana Ferreira

relator: Des. Roberto Alves · 2ª Câmara Cível

valor: R$ 15.000,00 · indenização danos morais

resultado: recurso parcialmente provido

// Antes — contrato de prestação (4.200 tokens)

CONTRATO DE PRESTAÇÃO DE SERVIÇOS DE TECNOLOGIA

CONTRATANTE: PREFEITURA MUNICIPAL DE GOIÂNIA

CONTRATADA: EMPRESA ALFA TECNOLOGIA LTDA

VIGÊNCIA: 12 meses · VALOR: R$ 480.000,00

// ... + cláusulas boilerplate (82 páginas) ...

4.200 tokens −84% ↓ 670 tokens

# HANE — contexto comprimido

domain: juridico_pt

tipo: contrato · prestação de serviços

contratante: Prefeitura Municipal de Goiânia

contratada: Empresa Alfa Tecnologia Ltda

vigência: 12 meses · renovável

valor: R$ 480.000,00 · parcelas mensais R$ 40k

multa: 20% valor total · cláusula 8.2

// Antes — petição inicial (2.800 tokens)

EXCELENTÍSSIMO SENHOR DOUTOR JUIZ DE DIREITO

DA VARA CÍVEL DA COMARCA DE GOIÂNIA/GO

AUTOR: CARLOS SANTOS · RÉU: BANCO NACIONAL S.A.

Causa de pedir: cobranças indevidas · Valor: R$ 28.500,00

// ... + pedidos, provas, jurisprudência ...

2.800 tokens −87% ↓ 364 tokens

# HANE — contexto comprimido

domain: juridico_pt

tipo: petição inicial · ação de cobrança

autor: Lucas Pereira

réu: Banco Nacional S.A.

foro: Vara Cível · Comarca de Goiânia/GO

valor_causa: R$ 28.500,00

pedido: devolução cobranças + danos morais

// Antes — SPED Fiscal EFD (3.800 tokens)

|C100|1|55|12345678000195|GO|62|004821|

|3/1/2025|3/1/2025|6102|1||480000,00|

|C170|1|8471.30.19|NOTEBOOK|100|UN|4800,00|

// ... + 1.200 registros C, D, E, G, H ...

3.800 tokens −74% ↓ 988 tokens

# HANE — contexto comprimido

domain: fiscal_pt

tipo: SPED EFD · escrituração digital

emitente: 12.345.678/0001-95 · UF GO

nota: NF-e 004821 · CFOP 6.102

produto: NCM 8471.30.19 · R$ 480.000,00

alerta: base reduzida conv. 52/91 não aplicada

BENCHMARK REAL · 63 ACÓRDÃOS TJ-GO · MAIO 2026

Números medidos, não estimados

PyMuPDF 1.27.2 · AdaptiveHANEPipeline v1.5.1 · CPU · ambiente isolado

tokens economizados por acórdão

1.570 → 218 tokens enviados ao LLM

0 ms

latência mediana ponta a ponta

P95 = 1.009 ms · 95% em menos de 1 s

acórdãos TJ-GO processados

PDF reais · domínio juridico_pt auto-detectado

−0%

redução de custo GPT-4o

$62/mês → $9/mês · 10k acórdãos/mês

TELEMETRIA AO VIVO — TOKENS ECONOMIZADOS NESTA SESSÃO

tokens economizados acumulados — clientes + testes reais

$0,00 custo GPT-4o evitado (estimado)

0 documentos equivalentes processados

0 Wh energia GPU evitada (estimado)

Base: 63 acórdãos TJ-GO + 28 manuais TOTVS (benchmarks offline) + uso real da API · GPT-4o a $2,50/M tokens · GPU @ 300W

PARA QUEM É O HANE

Do tribunal à fábrica

O HANE se adapta ao vocabulário de cada segmento — on-premise, sem dados externos, sem retreinamento. Troque o domínio editando um arquivo YAML.

⚖️ SETOR PÚBLICO · JUDICIÁRIO

Tribunais e Órgãos Públicos

Processe acórdãos, sentenças e editais com velocidade e sigilo processual total. On-premise em GCT — zero transferência externa.

Suporte a magistrados em jurisprudência e petições
Indexação de acervo jurídico com extração automática
Integração com PJe, SAJ e portais de protocolo
Auditoria TCE: editais, contratos, pareceres fiscais
Deploy Docker em GCT (homologado pelo CNJ)

Validado: 63 acórdãos TJ-GO · Mediana 148 ms · P95 1 s

📋 JURÍDICO PRIVADO

Escritórios e Departamentos Jurídicos

Analise contratos, petições e jurisprudência em volume — extraindo partes, prazos, valores e cláusulas de risco de forma estruturada.

Due diligence automatizada em lotes de contratos
Extração de prazos processuais e valores de causa
Diff semântico entre versões de contratos (NDA, M&A)
Chatbot jurídico interno com contexto comprimido
Monitoramento de cláusulas de multa e renovação

API REST + MCP · PDF, DOCX, TXT · −85,9% tokens ao LLM

🏭 ERP & FISCAL

ERP Protheus & Documentos Fiscais

Extraia entidades de manuais TOTVS, SPEDs, NF-e e ADVPL — acelerando implantações, auditorias fiscais e suporte técnico.

Leitura de SPED Fiscal para auditoria de CFOP e tributos
Indexação de manuais Protheus para suporte via LLM
Extração de entidades de código ADVPL / TLPP
Pipeline de implantação: parâmetros, tabelas, configurações
Integração com módulos TOTVS via REST API

Validado: 28 manuais TOTVS · F1 0,853 · Recall 1,0

💻 DESENVOLVIMENTO

Times de Desenvolvimento & DevOps

Indexe repositórios, analise impacto de mudanças e construa bases de conhecimento técnico — sem enviar o código inteiro ao LLM.

Code review assistido com contexto comprimido
Busca semântica sobre código via hane-code index
Análise de impacto arquitetural em PRs
Suporte a Python, JS/TS, SQL, Java, ADVPL
Hook automático no Claude Code via MCP

CLI hane-code · MCP Server · −93% tokens em ADVPL (850 linhas)

📜 CARTÓRIOS

Cartórios & Serventias Extrajudiciais

Cartórios de Registro de Imóveis, Notas, Títulos e Documentos e Civil processam volumes massivos de documentos repetitivos — escrituras, certidões, procurações e contratos. O HANE extrai partes, objetos, valores e qualificações automaticamente.

Extração de partes e qualificação em escrituras e contratos
Identificação de imóveis, matrículas e valores de transação
Indexação de acervo para busca semântica
Conferência automática de dados entre procuração e ato

Certidões de nascimento, casamento e óbito estruturadas
Suporte a PDF, DOCX e TXT sem cadastro
Deploy on-premise — dados do tabelião não saem da serventia
Integração com sistemas de gestão cartorária

Domínio juridico_pt · PDF, DOCX, TXT · 0 bytes para fora da serventia

85,9%menos tokens no prompt LLM†

148 msmediana E2E por acórdão (CPU)

Recall 1,0nenhuma entidade crítica perdida

63acórdãos TJ-GO validados no benchmark

† Medido sobre 63 acórdãos TJ-GO reais em PDF. Pipeline: AdaptiveHANEPipeline v1.5.1 · PyMuPDF 1.27.2 · CPU · ambiente isolado.

O que é o HANE

HANE (Hierarchical Adaptive NER Encoder) é um pipeline de extração de entidades nomeadas composto por quatro camadas adaptativas: seleção contextual semântica (CSG), NER hierárquico com ontologia jurídica, budget adaptativo por seção e cache de padrões. O resultado é extração precisa em acórdãos, contratos, petições e manuais — com suporte a documentos extensos via janelas sobrepostas.

Construído sobre o modelo GLiNER (open-source) como motor de NER, o HANE adiciona camadas proprietárias que transformam documentos jurídicos longos em contexto estruturado e comprimido. Não requer retreinamento para novos domínios — edite o YAML de ontologia e o pipeline se adapta.

Diferenciais

Pipeline ciente de seções

Reconhece automaticamente EMENTA, RELATÓRIO, FUNDAMENTAÇÃO, DISPOSITIVO e VOTO — e aplica budget máximo nas seções de maior densidade jurídica.

Ontologia jurídica editável

Hierarquias de entidades definidas em YAML — partes, valores, prazos, base legal, penalidades. Adicione novas entidades sem código ou retreinamento.

On-premise total

Os acórdãos nunca saem do ambiente do Tribunal. Deploy Docker em GCT ou VPS interna — zero chamada a serviço externo durante o processamento.

API pronta para integração

FastAPI com autenticação por API Key, suporte a PDF, DOCX, TXT. Integra com PJe, SAJ, N8n e qualquer sistema via POST /annotate/file.

CPU igual à GPU

Com PyMuPDF, CPU e GPU são equivalentes neste perfil de documento. Não é preciso GPU dedicada — container padrão GCT já entrega P95 = 1 s.

Benchmark auditável

63 acórdãos TJ-GO reais, ambiente isolado, dados brutos disponíveis. Mediana 148 ms · P95 1 s · 85,9% economia de tokens — números verificáveis.

SEM CADASTRO · SEM API KEY

Processe seu próprio acórdão agora

Faça upload de qualquer PDF ou DOCX jurídico e receba em segundos o contexto comprimido pronto para o seu LLM.

Abrir Demo →

Domínios suportados

COMO FUNCIONA

De acórdão bruto a contexto jurídico em 3 passos

📄

Upload do documento

Envie acórdão, contrato ou petição em PDF ou DOCX. O HANE detecta automaticamente as seções jurídicas (EMENTA, FUNDAMENTAÇÃO, DISPOSITIVO).

⚙️

HANE processa

4 camadas extraem partes, valores, prazos e base legal. Budget máximo nas seções críticas (DISPOSITIVO, FUNDAMENTAÇÃO). Cache reutiliza padrões já indexados.

⚡

Contexto comprimido

Seu LLM recebe 218 tokens em vez de 1.570 — mesma cobertura jurídica, custo ~7× menor por chamada. Entidades estruturadas, não texto bruto.

📄

Seu documento

acórdão · contrato · petição

→

CSG

→

NER

→

Budget

→

Cache

HANE

→

🔒
Contexto jurídico
−86% tokens · on-premise

→

🤖

LLM

Claude · GPT-4o · Gemini

→

⚖️

Resposta jurídica

partes · valores · prazos

Chat · Suporte a Magistrado

PIPELINE EM AÇÃO

4 camadas, cada uma com uma função jurídica

Enquanto o usuário aguarda a resposta, o HANE executa as 4 camadas em sequência — sem chamar nenhum LLM internamente.

CSG — Cláusulas boilerplate eliminadasRemove cláusulas padrão repetitivas e texto de preâmbulo. Redução interna de 82–91% antes do NER.

HierarchicalNER — Ontologia jurídica PT-BRGLiNER + ontologia jurídica: extrai partes, valores, prazos, base legal, penalidades com confiança calibrada.

AdaptiveBudget — Budget máximo no DISPOSITIVOSeções críticas (DISPOSITIVO, FUNDAMENTAÇÃO) recebem budget máximo. Rodapés e repetições são pulados.

PatternCache — Padrões contratuais reutilizadosEntidades de processos anteriores custam zero. Cache matricial 11× mais rápido em lotes de acórdãos.

Como o HANE se integra ao fluxo jurídico

Quatro modelos de uso — do mais simples ao mais avançado. O HANE entra como camada de eficiência antes do LLM, independente de qual você usa.

🗂️

A — Extração direta sem LLM

O HANE extrai entidades estruturadas de acórdãos e contratos e entrega JSON pronto — sem chamar nenhum LLM externo. Custo por token: zero.

Indexação de acervo jurídico: acórdãos, contratos, pareceres
Construção de base de jurisprudência estruturada
Auditoria e compliance — rastreabilidade de entidades
Alimentação de sistemas de busca e BI jurídico

Ideal quando a resposta não precisa ser em linguagem natural — só estrutura.

⚡

B — Pré-processamento de contexto RAG / LLM

Antes de enviar o acórdão ao LLM, o HANE comprime o contexto e injeta entidades jurídicas estruturadas. O LLM recebe 218 tokens em vez de 1.570.

Suporte a magistrados em análise de jurisprudência
Q&A sobre contratos e petições com contexto focado
Chatbot jurídico interno — sem alucinação em valores e prazos

Resultado validado: 1.570 tokens → 218 tokens · GPT-4o: $62 → $9 / mês por 10k acórdãos.

🤖

C — Orquestração multi-agentes LangChain · CrewAI

O HANE atua como ferramenta dentro do agente — via REST API (POST /annotate/file) ou MCP (extract_entities) — extrai entidades para que o LLM raciocine sobre dados verificados.

Agente de due diligence: processa lote de contratos e gera parecer
Pipeline de análise: extrai partes, valores, riscos e cláusulas-chave
Fluxo N8n sem código via nó HTTP Request → /annotate/file

O HANE reduz ~86% do custo das chamadas LLM em cada etapa do agente.

🔗

D — Hook de pré-processamento Claude Code

Via hook UserPromptSubmit, o HANE intercepta o prompt automaticamente quando detecta um arquivo jurídico mencionado — injeta contexto estruturado antes de o Claude receber a mensagem.

Documentos: PDF, DOCX, TXT
Claude recebe entidades extraídas + seções + métricas
Zero esforço após configuração — ~86% menos tokens ao Claude

Configuração única. O Claude responde melhor com contexto comprimido que com o PDF bruto.

🔌

E — MCP Server Model Context Protocol

O HANE expõe suas ferramentas como servidor MCP — qualquer host compatível (Claude Desktop, Claude Code, Cursor) pode invocar o pipeline diretamente.

extract_entities — extrai entidades de acórdão ou contrato
compare_documents — diff semântico entre versões de contrato
estimate_tokens — pré-estimativa de economia (sem GPU)
annotate_file — processa PDF/DOCX em disco

Zero engenharia extra. Config JSON de uma linha. Ver detalhes →

🚀

F — Deploy on-premise GCT / VPS

Container Docker completo com API, PostgreSQL e Nginx — roda na infraestrutura do Tribunal. Os documentos nunca saem do ambiente.

Stack: docker-compose.yml + nginx.conf + .env
Licença RSA-PSS emitida para o CNPJ do órgão
Warm-up único: GLiNER carregado uma vez (760 ms)
Zero cold start por documento após inicialização

GCT = plataforma homologada pelo CNJ para tribunais estaduais.

COMPARATIVO

HANE vs acórdão bruto no LLM

Métrica	Acórdão bruto	Com HANE	Ganho
Tokens enviados (acórdão TJ-GO · mediana)	1.570	218	−85,9%
Custo GPT-4o (por 10.000 acórdãos/mês)	$62/mês	$9/mês	−86%
Latência de processamento (E2E mediana · CPU)	—	147,8 ms	P95 = 1 s
Cobertura semântica	100%	100%	igual
Recall de entidades críticas	~95%	100%	+5 pp
Dados que saem do Tribunal	100% ao LLM externo	0 bytes	on-premise

* Valores medidos sobre 63 acórdãos TJ-GO reais (PDF). AdaptiveHANEPipeline v1.5.1 · PyMuPDF 1.27.2 · CPU. GPT-4o a $2,50/M input tokens.

JURÍDICO

Veja o HANE em ação com seu próprio documento

Faça upload de qualquer PDF ou DOCX jurídico e veja em segundos: seções detectadas, entidades extraídas e contexto comprimido pronto para o LLM. Sem cadastro.

Experimentar a Demo →

MODEL CONTEXT PROTOCOL

HANE como servidor MCP

Conecte o pipeline HANE diretamente ao seu IDE ou agente jurídico — sem REST, sem código de integração. O LLM decide quando invocar o HANE e com quais parâmetros.

🖥️

Host MCP

Claude Desktop, Claude Code, Cursor, Windsurf. Configura o HANE com um bloco JSON.

⚡

LLM invoca o HANE

O modelo decide automaticamente quando chamar extract_entities ou compare_documents — sem prompt manual.

⚖️

Contexto jurídico estruturado

O HANE retorna partes, valores, prazos e base legal — o LLM raciocina sobre dados verificados.

~/.claude.json (Windows: C:\Users\<usuario>\.claude.json)

{
  "mcpServers": {
    "hane": {
      "command": "python",
      "args":   ["/caminho/para/hane_mcp_client.py"],
      "env": {
        "HANE_MODE":    "rest",
        "HANE_API_URL": "http://localhost:8000",
        "HANE_API_KEY": "sua_api_key"
      }
    }
  }
}

FAQ

Perguntas frequentes

Os documentos saem do meu ambiente?+

Não. Na modalidade on-premise, o HANE roda inteiramente na sua infraestrutura — tribunal (GCT), cartório, escritório ou servidor interno. Os documentos são processados via POST /annotate/file para o container local e zero bytes trafegam para fora. Atende LGPD, sigilo processual e requisitos de segredo de justiça.

O HANE substitui o LLM ou os sistemas existentes (PJe, SAJ, ERP)?+

Não. O HANE atua como camada de pré-processamento antes do LLM — comprime o contexto que você envia, tornando cada chamada mais barata e precisa. Integra com PJe, SAJ, TOTVS Protheus, sistemas de cartório e qualquer plataforma via REST API ou N8n, sem substituir a arquitetura existente.

Precisa de GPU dedicada?+

Não. O benchmark foi executado integralmente em CPU — configuração padrão de um container on-premise em GCT. Com PyMuPDF, CPU e GPU são equivalentes neste perfil de documento. 95% dos acórdãos são processados em menos de 1 segundo em CPU.

Como é calculada a economia de 85,9%?+

Medido sobre 63 acórdãos TJ-GO reais em PDF (ambiente isolado, maio/2026). Token de entrada médio: 1.570; tokens após HANE: ~218. A economia vem de três camadas: CSG (~55%), Budget adaptativo (~31%) e Cache matricial (hit rate 11,7%). Dados brutos disponíveis em benchmark_raw.json.

Preciso retreinar algum modelo?+

Não. O HANE usa o modelo GLiNER pré-treinado e ontologias em YAML para adaptar ao domínio jurídico. Adicionar uma nova entidade (ex: tipo de ação) é editar um arquivo YAML — sem GPU, sem fine-tuning, sem code review.

Qual é o modelo de licenciamento para tribunais?+

Licença on-premise RSA-PSS emitida para o CNPJ do órgão. Verificação a cada 12 h com grace period de 72 h em caso de falha de conectividade. Inclui contrato de suporte e atualização. Entre em contato para proposta.

Quais formatos de arquivo são suportados?+

Documentos: PDF, DOCX, TXT, XML, JSON, XLS/XLSX, CSV e Parquet. Código-fonte: .PRW / .TLPP (ADVPL), .py, .js, .ts, .sql, .java. Arquivos fiscais estruturados como SPED EFD e EFD-Contribuições são processados via leitura de texto — sem parser específico de layout.

O HANE detecta automaticamente o tipo de documento?+

Sim. O domain fingerprinter analisa o vocabulário do documento e seleciona automaticamente a ontologia mais adequada: juridico_pt para acórdãos, contratos e petições; fiscal_pt para SPEDs e NF-e; erp para manuais Protheus; generico para documentos de cartório ou qualquer outro domínio. Você também pode forçar o domínio via parâmetro da API.

Funciona para cartórios, escritórios e empresas — não só tribunais?+

Sim. O HANE foi projetado para qualquer segmento que processe documentos em volume. Cartórios de Registro de Imóveis e Notas usam o domínio juridico_pt para extrair partes, imóveis e valores de escrituras e certidões. Escritórios de advocacia processam contratos e petições. Empresas com ERP Protheus usam o domínio erp para manuais e código ADVPL. O benchmark do TJ-GO valida a precisão no segmento mais exigente — os demais se beneficiam da mesma arquitetura.

A empresa

Startup de tecnologia especializada em extração semântica de entidades para documentos corporativos e jurídicos.

Dados da empresa

Razão social: HANEIA TECNOLOGIA E INOVACAO LTDA
CNPJ: 66.370.086/0001-52
Sede: Brasil
Goiânia · GO
Contato: contato@haneia.com.br

Registro INPI BR 51 2026 002247-9

Google Cloud for Startups — Aprovada

Equipe fundadora

Jacion Silva

Fundador & CEO · Cientista de Dados & Engenheiro de IA

Cientista de dados e analista de sistemas com foco em IA aplicada, NLP e automação de processos. MBA em Ciência de Dados pela PUC Goiás. Na TOTVS Brasil Central liderou um projeto de ETL orientado a dados para automatizar implantações do Protheus via leitura e análise do SPED Fiscal — 2º lugar no Desafio de Inovação TBC, hoje adotado pela TOTVS Matriz com redução significativa de custo e tempo nas implantações. Criador do pipeline HANE: modelo de extração semântica hierárquica de entidades que reduz em até 70% os tokens enviados a modelos de linguagem.

🏆

2º lugar · Desafio de Inovação TBC

Projeto de ETL com leitura de SPED Fiscal para aceleração de implantações Protheus · adotado pela TOTVS Matriz

🤖

Destaque em IA

Desenvolvimento do pipeline HANE — extração semântica hierárquica para documentos ERP, fiscal e jurídico

☁️

Google Cloud for Startups

HaneIA aprovada no programa — infraestrutura Google Cloud e suporte técnico especializado para escalar o HANE

IA Aplicada NLP / NER ERP Protheus SPED Fiscal ADVPL Python FastAPI

Acórdão bruto: 1.570 tokens. Com HANE: 218 tokens.

Números medidos, não estimados

Do tribunal à fábrica

Tribunais e Órgãos Públicos

Escritórios e Departamentos Jurídicos

ERP Protheus & Documentos Fiscais

Times de Desenvolvimento & DevOps

Cartórios & Serventias Extrajudiciais

O que é o HANE

Diferenciais

Pipeline ciente de seções

Ontologia jurídica editável

On-premise total

API pronta para integração

CPU igual à GPU

Benchmark auditável

Processe seu próprio acórdão agora

Domínios suportados

De acórdão bruto a contexto jurídico em 3 passos

Upload do documento

HANE processa

Contexto comprimido

4 camadas, cada uma com uma função jurídica

Como o HANE se integra ao fluxo jurídico

A — Extração direta sem LLM

B — Pré-processamento de contexto RAG / LLM

C — Orquestração multi-agentes LangChain · CrewAI

D — Hook de pré-processamento Claude Code

E — MCP Server Model Context Protocol

F — Deploy on-premise GCT / VPS

HANE vs acórdão bruto no LLM

Veja o HANE em ação com seu próprio documento

HANE como servidor MCP

Host MCP

LLM invoca o HANE

Contexto jurídico estruturado

Perguntas frequentes

A empresa

Dados da empresa

Equipe fundadora

Fale com a gente

Acórdão bruto: 1.570 tokens.
Com HANE: 218 tokens.