Prosodia Logo Prosodia Logo

Visão Geral

O Prosodia é um projeto para construir, no Brasil, uma infraestrutura pública e aberta de inteligência artificial de base, centrada em uma família de modelos fundacionais de linguagem em português. A proposta não é treinar apenas um modelo, mas estabelecer uma capacidade contínua de pesquisa, desenvolvimento e governança que permita ao país dominar todo o ciclo de vida de modelos de linguagem — desde a coleta e curadoria de dados, passando por arquitetura e treinamento, até a implantação segura em escala.

Hoje, os modelos de maior impacto no mundo são, em grande parte, oferecidos como serviços proprietários e pouco transparentes. Isso cria dependência tecnológica, concentra poder e dificulta auditorias sobre dados, decisões de treinamento e riscos éticos e jurídicos. O Prosodia responde a esse cenário com uma abordagem de ciência aberta: pesos, código, tokenizers, pipelines de treinamento e inferência, ferramentas de telemetria e documentação serão publicados sob licenças abertas, permitindo auditoria independente, reuso e adaptação por universidades, governo, empresas e sociedade civil.

Frentes Técnicas

Do ponto de vista técnico, o Prosodia organiza seu avanço em três frentes complementares. Primeiro, uma família escalável de modelos, desde versões enxutas — pensadas para rodar em hardware com 8 a 12 GB de memória — até modelos maiores voltados a centros de dados. Segundo, um tokenizer especializado em línguas românicas, com alta eficiência para o português do Brasil, reduzindo fragmentação de palavras e custo computacional. Terceiro, arquiteturas híbridas que combinam Transformers e modelos de espaço de estados (State Space Models), buscando maior eficiência, estabilidade de treinamento e melhor desempenho em contexto longo. Tudo isso será sustentado por grandes corpora em português, curados com transparência e foco em representar não só a norma culta, mas também regionalismos, diferentes registros e manifestações culturais brasileiras.

Infraestrutura

Além dos modelos e dados, o Prosodia também constrói infraestrutura. O projeto utilizará clusters nacionais de GPUs em ambientes de computação de alto desempenho e desenvolverá uma rede de supercomputação voluntária, com software cliente aberto para Linux, Windows e macOS. Essa rede permitirá que centros de pesquisa, órgãos públicos e cidadãos contribuam com capacidade ociosa para tarefas selecionadas de pré-processamento, avaliação e, quando apropriado, treinamento, reduzindo custos de experimentação, aumentando a resiliência e ampliando a participação social na ciência aberta.

Capacidade Permanente

O resultado esperado é mais do que lançamentos pontuais: é uma capacidade permanente para o Brasil. O Prosodia foi desenhado para sustentar, ao longo do tempo, a manutenção e evolução dos corpora, dos pipelines de dados e treinamento, da rede distribuída e da própria família de modelos, com novas versões e variantes alinhadas a prioridades públicas e setoriais.

voltar ao índice