Entrar

Números medidos, não estimados

PyMuPDF 1.27.2 · AdaptiveHANEPipeline v1.5.1 · CPU · ambiente isolado

0%
tokens economizados por acórdão
1.570 → 218 tokens enviados ao LLM
0 ms
latência mediana ponta a ponta
P95 = 1.009 ms · 95% em menos de 1 s
0
acórdãos TJ-GO processados
PDF reais · domínio juridico_pt auto-detectado
−0%
redução de custo GPT-4o
$62/mês → $9/mês · 10k acórdãos/mês
TELEMETRIA AO VIVO — TOKENS ECONOMIZADOS NESTA SESSÃO
0
tokens economizados acumulados — clientes + testes reais
$0,00 custo GPT-4o evitado (estimado)
0 documentos equivalentes processados
0 Wh energia GPU evitada (estimado)
Base: 63 acórdãos TJ-GO + 28 manuais TOTVS (benchmarks offline) + uso real da API · GPT-4o a $2,50/M tokens · GPU @ 300W

Do tribunal à fábrica

O HANE se adapta ao vocabulário de cada segmento — on-premise, sem dados externos, sem retreinamento. Troque o domínio editando um arquivo YAML.

⚖️ SETOR PÚBLICO · JUDICIÁRIO

Tribunais e Órgãos Públicos

Processe acórdãos, sentenças e editais com velocidade e sigilo processual total. On-premise em GCT — zero transferência externa.

  • Suporte a magistrados em jurisprudência e petições
  • Indexação de acervo jurídico com extração automática
  • Integração com PJe, SAJ e portais de protocolo
  • Auditoria TCE: editais, contratos, pareceres fiscais
  • Deploy Docker em GCT (homologado pelo CNJ)
📋 JURÍDICO PRIVADO

Escritórios e Departamentos Jurídicos

Analise contratos, petições e jurisprudência em volume — extraindo partes, prazos, valores e cláusulas de risco de forma estruturada.

  • Due diligence automatizada em lotes de contratos
  • Extração de prazos processuais e valores de causa
  • Diff semântico entre versões de contratos (NDA, M&A)
  • Chatbot jurídico interno com contexto comprimido
  • Monitoramento de cláusulas de multa e renovação
🏭 ERP & FISCAL

ERP Protheus & Documentos Fiscais

Extraia entidades de manuais TOTVS, SPEDs, NF-e e ADVPL — acelerando implantações, auditorias fiscais e suporte técnico.

  • Leitura de SPED Fiscal para auditoria de CFOP e tributos
  • Indexação de manuais Protheus para suporte via LLM
  • Extração de entidades de código ADVPL / TLPP
  • Pipeline de implantação: parâmetros, tabelas, configurações
  • Integração com módulos TOTVS via REST API
💻 DESENVOLVIMENTO

Times de Desenvolvimento & DevOps

Indexe repositórios, analise impacto de mudanças e construa bases de conhecimento técnico — sem enviar o código inteiro ao LLM.

  • Code review assistido com contexto comprimido
  • Busca semântica sobre código via hane-code index
  • Análise de impacto arquitetural em PRs
  • Suporte a Python, JS/TS, SQL, Java, ADVPL
  • Hook automático no Claude Code via MCP
📜 CARTÓRIOS

Cartórios & Serventias Extrajudiciais

Cartórios de Registro de Imóveis, Notas, Títulos e Documentos e Civil processam volumes massivos de documentos repetitivos — escrituras, certidões, procurações e contratos. O HANE extrai partes, objetos, valores e qualificações automaticamente.

  • Extração de partes e qualificação em escrituras e contratos
  • Identificação de imóveis, matrículas e valores de transação
  • Indexação de acervo para busca semântica
  • Conferência automática de dados entre procuração e ato
  • Certidões de nascimento, casamento e óbito estruturadas
  • Suporte a PDF, DOCX e TXT sem cadastro
  • Deploy on-premise — dados do tabelião não saem da serventia
  • Integração com sistemas de gestão cartorária
85,9%menos tokens no prompt LLM†
148 msmediana E2E por acórdão (CPU)
Recall 1,0nenhuma entidade crítica perdida
63acórdãos TJ-GO validados no benchmark

† Medido sobre 63 acórdãos TJ-GO reais em PDF. Pipeline: AdaptiveHANEPipeline v1.5.1 · PyMuPDF 1.27.2 · CPU · ambiente isolado.

O que é o HANE

HANE (Hierarchical Adaptive NER Encoder) é um pipeline de extração de entidades nomeadas composto por quatro camadas adaptativas: seleção contextual semântica (CSG), NER hierárquico com ontologia jurídica, budget adaptativo por seção e cache de padrões. O resultado é extração precisa em acórdãos, contratos, petições e manuais — com suporte a documentos extensos via janelas sobrepostas.

Construído sobre o modelo GLiNER (open-source) como motor de NER, o HANE adiciona camadas proprietárias que transformam documentos jurídicos longos em contexto estruturado e comprimido. Não requer retreinamento para novos domínios — edite o YAML de ontologia e o pipeline se adapta.

Diferenciais

Pipeline ciente de seções

Reconhece automaticamente EMENTA, RELATÓRIO, FUNDAMENTAÇÃO, DISPOSITIVO e VOTO — e aplica budget máximo nas seções de maior densidade jurídica.

Ontologia jurídica editável

Hierarquias de entidades definidas em YAML — partes, valores, prazos, base legal, penalidades. Adicione novas entidades sem código ou retreinamento.

On-premise total

Os acórdãos nunca saem do ambiente do Tribunal. Deploy Docker em GCT ou VPS interna — zero chamada a serviço externo durante o processamento.

API pronta para integração

FastAPI com autenticação por API Key, suporte a PDF, DOCX, TXT. Integra com PJe, SAJ, N8n e qualquer sistema via POST /annotate/file.

CPU igual à GPU

Com PyMuPDF, CPU e GPU são equivalentes neste perfil de documento. Não é preciso GPU dedicada — container padrão GCT já entrega P95 = 1 s.

Benchmark auditável

63 acórdãos TJ-GO reais, ambiente isolado, dados brutos disponíveis. Mediana 148 ms · P95 1 s · 85,9% economia de tokens — números verificáveis.

Processe seu próprio acórdão agora

Faça upload de qualquer PDF ou DOCX jurídico e receba em segundos o contexto comprimido pronto para o seu LLM.

Abrir Demo →

Domínios suportados

Jurídico (PT-BR) Acórdãos e Sentenças Contratos Petições Editais e Licitações Pareceres Fiscais (TCE) SPED Fiscal & EFD ERP Protheus (TOTVS) Fiscal & Tributário Financeiro Propriedade Intelectual (INPI) Médico & Saúde ADVPL / TLPP Código Python · JS · SQL Genérico

De acórdão bruto a contexto jurídico em 3 passos

01
📄

Upload do documento

Envie acórdão, contrato ou petição em PDF ou DOCX. O HANE detecta automaticamente as seções jurídicas (EMENTA, FUNDAMENTAÇÃO, DISPOSITIVO).

02
⚙️

HANE processa

4 camadas extraem partes, valores, prazos e base legal. Budget máximo nas seções críticas (DISPOSITIVO, FUNDAMENTAÇÃO). Cache reutiliza padrões já indexados.

03

Contexto comprimido

Seu LLM recebe 218 tokens em vez de 1.570 — mesma cobertura jurídica, custo ~7× menor por chamada. Entidades estruturadas, não texto bruto.

📄
Seu documento
acórdão · contrato · petição
L1
CSG
L2
NER
L3
Budget
L4
Cache
HANE
🔒
Contexto jurídico
−86% tokens · on-premise
🤖
LLM
Claude · GPT-4o · Gemini
⚖️
Resposta jurídica
partes · valores · prazos
Chat · Suporte a Magistrado

4 camadas, cada uma com uma função jurídica

Enquanto o usuário aguarda a resposta, o HANE executa as 4 camadas em sequência — sem chamar nenhum LLM internamente.

1
CSG — Cláusulas boilerplate eliminadasRemove cláusulas padrão repetitivas e texto de preâmbulo. Redução interna de 82–91% antes do NER.
2
HierarchicalNER — Ontologia jurídica PT-BRGLiNER + ontologia jurídica: extrai partes, valores, prazos, base legal, penalidades com confiança calibrada.
3
AdaptiveBudget — Budget máximo no DISPOSITIVOSeções críticas (DISPOSITIVO, FUNDAMENTAÇÃO) recebem budget máximo. Rodapés e repetições são pulados.
4
PatternCache — Padrões contratuais reutilizadosEntidades de processos anteriores custam zero. Cache matricial 11× mais rápido em lotes de acórdãos.

Como o HANE se integra ao fluxo jurídico

Quatro modelos de uso — do mais simples ao mais avançado. O HANE entra como camada de eficiência antes do LLM, independente de qual você usa.

🗂️

A — Extração direta sem LLM

O HANE extrai entidades estruturadas de acórdãos e contratos e entrega JSON pronto — sem chamar nenhum LLM externo. Custo por token: zero.

  • Indexação de acervo jurídico: acórdãos, contratos, pareceres
  • Construção de base de jurisprudência estruturada
  • Auditoria e compliance — rastreabilidade de entidades
  • Alimentação de sistemas de busca e BI jurídico

Ideal quando a resposta não precisa ser em linguagem natural — só estrutura.

B — Pré-processamento de contexto RAG / LLM

Antes de enviar o acórdão ao LLM, o HANE comprime o contexto e injeta entidades jurídicas estruturadas. O LLM recebe 218 tokens em vez de 1.570.

  • Suporte a magistrados em análise de jurisprudência
  • Q&A sobre contratos e petições com contexto focado
  • Chatbot jurídico interno — sem alucinação em valores e prazos

Resultado validado: 1.570 tokens → 218 tokens · GPT-4o: $62 → $9 / mês por 10k acórdãos.

🤖

C — Orquestração multi-agentes LangChain · CrewAI

O HANE atua como ferramenta dentro do agente — via REST API (POST /annotate/file) ou MCP (extract_entities) — extrai entidades para que o LLM raciocine sobre dados verificados.

  • Agente de due diligence: processa lote de contratos e gera parecer
  • Pipeline de análise: extrai partes, valores, riscos e cláusulas-chave
  • Fluxo N8n sem código via nó HTTP Request → /annotate/file

O HANE reduz ~86% do custo das chamadas LLM em cada etapa do agente.

🔗

D — Hook de pré-processamento Claude Code

Via hook UserPromptSubmit, o HANE intercepta o prompt automaticamente quando detecta um arquivo jurídico mencionado — injeta contexto estruturado antes de o Claude receber a mensagem.

  • Documentos: PDF, DOCX, TXT
  • Claude recebe entidades extraídas + seções + métricas
  • Zero esforço após configuração — ~86% menos tokens ao Claude

Configuração única. O Claude responde melhor com contexto comprimido que com o PDF bruto.

🔌

E — MCP Server Model Context Protocol

O HANE expõe suas ferramentas como servidor MCP — qualquer host compatível (Claude Desktop, Claude Code, Cursor) pode invocar o pipeline diretamente.

  • extract_entities — extrai entidades de acórdão ou contrato
  • compare_documents — diff semântico entre versões de contrato
  • estimate_tokens — pré-estimativa de economia (sem GPU)
  • annotate_file — processa PDF/DOCX em disco

Zero engenharia extra. Config JSON de uma linha. Ver detalhes →

🚀

F — Deploy on-premise GCT / VPS

Container Docker completo com API, PostgreSQL e Nginx — roda na infraestrutura do Tribunal. Os documentos nunca saem do ambiente.

  • Stack: docker-compose.yml + nginx.conf + .env
  • Licença RSA-PSS emitida para o CNPJ do órgão
  • Warm-up único: GLiNER carregado uma vez (760 ms)
  • Zero cold start por documento após inicialização

GCT = plataforma homologada pelo CNJ para tribunais estaduais.

HANE vs acórdão bruto no LLM

MétricaAcórdão brutoCom HANEGanho
Tokens enviados (acórdão TJ-GO · mediana)1.570218−85,9%
Custo GPT-4o (por 10.000 acórdãos/mês)$62/mês$9/mês−86%
Latência de processamento (E2E mediana · CPU)147,8 msP95 = 1 s
Cobertura semântica100%100%igual
Recall de entidades críticas~95%100%+5 pp
Dados que saem do Tribunal100% ao LLM externo0 byteson-premise

* Valores medidos sobre 63 acórdãos TJ-GO reais (PDF). AdaptiveHANEPipeline v1.5.1 · PyMuPDF 1.27.2 · CPU. GPT-4o a $2,50/M input tokens.

JURÍDICO

Veja o HANE em ação com seu próprio documento

Faça upload de qualquer PDF ou DOCX jurídico e veja em segundos: seções detectadas, entidades extraídas e contexto comprimido pronto para o LLM. Sem cadastro.

Experimentar a Demo →
MODEL CONTEXT PROTOCOL

HANE como servidor MCP

Conecte o pipeline HANE diretamente ao seu IDE ou agente jurídico — sem REST, sem código de integração. O LLM decide quando invocar o HANE e com quais parâmetros.

01
🖥️

Host MCP

Claude Desktop, Claude Code, Cursor, Windsurf. Configura o HANE com um bloco JSON.

02

LLM invoca o HANE

O modelo decide automaticamente quando chamar extract_entities ou compare_documents — sem prompt manual.

03
⚖️

Contexto jurídico estruturado

O HANE retorna partes, valores, prazos e base legal — o LLM raciocina sobre dados verificados.

~/.claude.json  (Windows: C:\Users\<usuario>\.claude.json)
{
  "mcpServers": {
    "hane": {
      "command": "python",
      "args":   ["/caminho/para/hane_mcp_client.py"],
      "env": {
        "HANE_MODE":    "rest",
        "HANE_API_URL": "http://localhost:8000",
        "HANE_API_KEY": "sua_api_key"
      }
    }
  }
}
FAQ

Perguntas frequentes

Não. Na modalidade on-premise, o HANE roda inteiramente na sua infraestrutura — tribunal (GCT), cartório, escritório ou servidor interno. Os documentos são processados via POST /annotate/file para o container local e zero bytes trafegam para fora. Atende LGPD, sigilo processual e requisitos de segredo de justiça.

Não. O HANE atua como camada de pré-processamento antes do LLM — comprime o contexto que você envia, tornando cada chamada mais barata e precisa. Integra com PJe, SAJ, TOTVS Protheus, sistemas de cartório e qualquer plataforma via REST API ou N8n, sem substituir a arquitetura existente.

Não. O benchmark foi executado integralmente em CPU — configuração padrão de um container on-premise em GCT. Com PyMuPDF, CPU e GPU são equivalentes neste perfil de documento. 95% dos acórdãos são processados em menos de 1 segundo em CPU.

Medido sobre 63 acórdãos TJ-GO reais em PDF (ambiente isolado, maio/2026). Token de entrada médio: 1.570; tokens após HANE: ~218. A economia vem de três camadas: CSG (~55%), Budget adaptativo (~31%) e Cache matricial (hit rate 11,7%). Dados brutos disponíveis em benchmark_raw.json.

Não. O HANE usa o modelo GLiNER pré-treinado e ontologias em YAML para adaptar ao domínio jurídico. Adicionar uma nova entidade (ex: tipo de ação) é editar um arquivo YAML — sem GPU, sem fine-tuning, sem code review.

Licença on-premise RSA-PSS emitida para o CNPJ do órgão. Verificação a cada 12 h com grace period de 72 h em caso de falha de conectividade. Inclui contrato de suporte e atualização. Entre em contato para proposta.

Documentos: PDF, DOCX, TXT, XML, JSON, XLS/XLSX, CSV e Parquet. Código-fonte: .PRW / .TLPP (ADVPL), .py, .js, .ts, .sql, .java. Arquivos fiscais estruturados como SPED EFD e EFD-Contribuições são processados via leitura de texto — sem parser específico de layout.

Sim. O domain fingerprinter analisa o vocabulário do documento e seleciona automaticamente a ontologia mais adequada: juridico_pt para acórdãos, contratos e petições; fiscal_pt para SPEDs e NF-e; erp para manuais Protheus; generico para documentos de cartório ou qualquer outro domínio. Você também pode forçar o domínio via parâmetro da API.

Sim. O HANE foi projetado para qualquer segmento que processe documentos em volume. Cartórios de Registro de Imóveis e Notas usam o domínio juridico_pt para extrair partes, imóveis e valores de escrituras e certidões. Escritórios de advocacia processam contratos e petições. Empresas com ERP Protheus usam o domínio erp para manuais e código ADVPL. O benchmark do TJ-GO valida a precisão no segmento mais exigente — os demais se beneficiam da mesma arquitetura.

A empresa

Startup de tecnologia especializada em extração semântica de entidades para documentos corporativos e jurídicos.

Dados da empresa

Razão social
HANEIA TECNOLOGIA E INOVACAO LTDA
CNPJ
66.370.086/0001-52
Sede
Brasil
Goiânia · GO
Registro INPI BR 51 2026 002247-9
Google Cloud for Startups — Aprovada

Equipe fundadora

Jacion Silva — Fundador HaneIA
Jacion Silva
Fundador & CEO · Cientista de Dados & Engenheiro de IA

Cientista de dados e analista de sistemas com foco em IA aplicada, NLP e automação de processos. MBA em Ciência de Dados pela PUC Goiás. Na TOTVS Brasil Central liderou um projeto de ETL orientado a dados para automatizar implantações do Protheus via leitura e análise do SPED Fiscal — 2º lugar no Desafio de Inovação TBC, hoje adotado pela TOTVS Matriz com redução significativa de custo e tempo nas implantações. Criador do pipeline HANE: modelo de extração semântica hierárquica de entidades que reduz em até 70% os tokens enviados a modelos de linguagem.

🏆
2º lugar · Desafio de Inovação TBC
Projeto de ETL com leitura de SPED Fiscal para aceleração de implantações Protheus · adotado pela TOTVS Matriz
🤖
Destaque em IA
Desenvolvimento do pipeline HANE — extração semântica hierárquica para documentos ERP, fiscal e jurídico
☁️
Google Cloud for Startups
HaneIA aprovada no programa — infraestrutura Google Cloud e suporte técnico especializado para escalar o HANE
IA Aplicada NLP / NER ERP Protheus SPED Fiscal ADVPL Python FastAPI

Fale com a gente

Interessado em uma demonstração com dados reais do Tribunal ou quer um trial? Preencha o formulário — respondemos em até 24 h.

Ou escreva direto: contato@haneia.com.br

Começar grátis →