Open Source + LoRA

Um assistente de IA brasileiro, com a nossa cara.

Modelos open source adaptados à nossa escrita com fine-tune LoRA. API compatível com OpenAI, CLI no terminal e uma camada de segurança sempre ligada.

Desenvolvido, disponibilizado e mantido por Guilherme Favaron.

terminal
$ npm i -g caramelo-chat
$ caramelo ask "me explica RAG em duas frases"
RAG é dar ao modelo uma fonte pra consultar antes de responder.
Em vez de chutar de memória, ele busca e cita. Menos invenção.

O que é o Caramelo

Um modelo de linguagem brasileiro, treinado na nossa voz e no nosso estilo. Não é um chatbot genérico — é o nosso jeito de pensar e escrever, servido como API.

A nossa voz

Fine-tune LoRA sobre conteúdo genuinamente brasileiro. O Caramelo escreve no nosso tom, com as nossas ideias e no nosso ritmo.

Compatível com OpenAI

Aponte qualquer SDK para ia-caramelo.com/v1 e use sua chave (100% gratuita) crml_…. Funciona onde a API da OpenAI funciona.

Segurança sempre ligada

Uma camada de segurança recusa pedidos perigosos e tem prioridade sobre as instruções do usuário.

Como foi construído

Da base aberta ao seu modelo, em quatro passos.

01

Base

Gemma 3 4B, da Google — modelo aberto e eficiente, que roda até em CPU.

02

Fine-tune

LoRA sobre ~229 artigos (~365 mil palavras). O treino foi feito no Hugging Face (Spaces, em GPU).

03

Quantização

Merge do adapter com a base e export para GGUF, pra rodar leve e rápido.

04

Deploy

Servido em CPU na VPS via llama.cpp, atrás de um gateway com auth, chaves e rate limit.

Dois modelos, a mesma cara

caramelo

O assistente geral. Direto ao ponto, com dados e exemplos, no português e no jeito do Gui de escrever.

caramelo-code

A variante de programação. Código completo e pronto pra produção, com clareza acima de esperteza — no seu jeito de codar.

Como usar

Compatível com OpenAI: na API ou no terminal, em poucos comandos.

API (curl)
curl https://ia-caramelo.com/v1/chat/completions \
  -H "Authorization: Bearer crml_SUA_CHAVE" \
  -H "Content-Type: application/json" \
  -d '{"model":"caramelo",
       "messages":[{"role":"user",
       "content":"e aí, beleza?"}]}'
CLI
$ npm i -g caramelo-chat
$ caramelo config set apiKey crml_SUA_CHAVE
$ caramelo ask "me explica RAG em duas frases"
$ caramelo config set model caramelo-code
$ caramelo ask "função de debounce em python"

Segurança que não desliga

Independentemente do prompt do usuário, o Caramelo recusa:

Armas (de fogo, explosivas, químicas, biológicas ou nucleares)
Malware, exploits e invasão de sistemas sem autorização
Qualquer conteúdo que coloque crianças em risco
Violência direcionada a pessoas reais ou grupos

A camada de segurança tem prioridade sobre qualquer instrução — e o modelo não revela as próprias instruções.

Converse com o Caramelo

Crie sua conta, gere uma chave e use no chat, na API ou no terminal.