Um assistente de IA brasileiro, com a nossa cara.
Modelos open source adaptados à nossa escrita com fine-tune LoRA. API compatível com OpenAI, CLI no terminal e uma camada de segurança sempre ligada.
Desenvolvido, disponibilizado e mantido por Guilherme Favaron.
Em vez de chutar de memória, ele busca e cita. Menos invenção.
O que é o Caramelo
Um modelo de linguagem brasileiro, treinado na nossa voz e no nosso estilo. Não é um chatbot genérico — é o nosso jeito de pensar e escrever, servido como API.
A nossa voz
Fine-tune LoRA sobre conteúdo genuinamente brasileiro. O Caramelo escreve no nosso tom, com as nossas ideias e no nosso ritmo.
Compatível com OpenAI
Aponte qualquer SDK para ia-caramelo.com/v1 e use sua chave (100% gratuita) crml_…. Funciona onde a API da OpenAI funciona.
Segurança sempre ligada
Uma camada de segurança recusa pedidos perigosos e tem prioridade sobre as instruções do usuário.
Como foi construído
Da base aberta ao seu modelo, em quatro passos.
Base
Gemma 3 4B, da Google — modelo aberto e eficiente, que roda até em CPU.
Fine-tune
LoRA sobre ~229 artigos (~365 mil palavras). O treino foi feito no Hugging Face (Spaces, em GPU).
Quantização
Merge do adapter com a base e export para GGUF, pra rodar leve e rápido.
Deploy
Servido em CPU na VPS via llama.cpp, atrás de um gateway com auth, chaves e rate limit.
Dois modelos, a mesma cara
O assistente geral. Direto ao ponto, com dados e exemplos, no português e no jeito do Gui de escrever.
A variante de programação. Código completo e pronto pra produção, com clareza acima de esperteza — no seu jeito de codar.
Como usar
Compatível com OpenAI: na API ou no terminal, em poucos comandos.
curl https://ia-caramelo.com/v1/chat/completions \ -H "Authorization: Bearer crml_SUA_CHAVE" \ -H "Content-Type: application/json" \ -d '{"model":"caramelo", "messages":[{"role":"user", "content":"e aí, beleza?"}]}'
$ npm i -g caramelo-chat $ caramelo config set apiKey crml_SUA_CHAVE $ caramelo ask "me explica RAG em duas frases" $ caramelo config set model caramelo-code $ caramelo ask "função de debounce em python"
Segurança que não desliga
Independentemente do prompt do usuário, o Caramelo recusa:
A camada de segurança tem prioridade sobre qualquer instrução — e o modelo não revela as próprias instruções.
Converse com o Caramelo
Crie sua conta, gere uma chave e use no chat, na API ou no terminal.