Vector DB · Qdrant · Weaviate · pgvector

Vector database hospedado pra alimentar o seu agente de IA.

Q: O que é um vector database?

Banco de dados especializado em armazenar e buscar vetores (embeddings) — representações numéricas de texto, imagem ou áudio gerados por modelos de IA. Permite busca por similaridade semântica em escala (RAG, recomendação, classificação).

Q: Quais ferramentas vocês instalam?

Você escolhe: Qdrant (mais popular, ótimo para RAG), Weaviate (com GraphQL e módulos), Milvus (escala bilhões de vetores), pgvector (PostgreSQL com extensão vetorial) ou ChromaDB. Instalamos a versão estável mais recente, com configuração otimizada para o seu caso.

Q: Por que self-hosted em vez de Pinecone?

Custo previsível (você paga o servidor, não por vetor armazenado), controle total dos dados (importante pra LGPD), zero vendor lock-in (pode exportar e migrar quando quiser) e latência baixa (servidor brasileiro vs. Pinecone US).

Q: Como dimensionar o plano?

Regra geral: 1M de vetores OpenAI (1536 dim) consome ~6 GB de RAM. VDB Start (16 GB) cobre até 1-2M; Pro (32 GB) cobre até 50M com índice HNSW; Scale (64 GB) vai até 500M+. Em dúvida, fale com nosso time pra dimensionar caso a caso.

Q: Tem backup automático?

Sim, snapshot diário automático com retenção de 7 dias. Restauração ponto-a-ponto sob demanda. Backup em storage S3-compat separado para resiliência geográfica.

Q: Em quanto tempo entregam?

Provisionamento em até 3 dias úteis após aprovação: setup do servidor, instalação do vector DB escolhido, configuração de autenticação e TLS, dashboard de monitoramento e onboarding de 1h com seu time.

Q: Posso fazer upgrade de plano depois?

Sim. Migração entre tiers feita em janela combinada (geralmente 30-60 min de downtime). Você paga proporcional ao uso e não há multa.

Qdrant, Weaviate, Milvus ou pgvector pré-instalados em servidor brasileiro com NVMe enterprise e RAM generosa. RAG corporativo, busca semântica, recomendação por similaridade — sem custo por vetor, dado no seu ambiente.

Ver planos Falar com especialista

Sem custo por vetor
Faturamento em real
LGPD-ready
Sem vendor lock-in

Por que Vector DB gerenciado pela Rollin Host

Hardware dimensionado pra RAM

Vector DB é RAM-bound — índice HNSW vive em memória pra busca rápida. NVMe enterprise pra persistência sem perda de performance.

Sua escolha de stack

Qdrant (mais popular pra RAG), Weaviate (com GraphQL), Milvus (escala bilhões), pgvector (extensão Postgres) ou ChromaDB. Você escolhe.

Sem cobrança por vetor

Pinecone cobra por dimensão × vetor armazenado. Self-hosted: você paga o servidor, indexa quanto quiser. Custo previsível em volume.

Dado no seu ambiente

Embeddings, payloads e metadata ficam no seu storage. Sem trafegar por terceiros. LGPD compliant desde o dia 1.

Planos Vector DB gerenciado

Hardware AMD EPYC + NVMe + instalação + manutenção. Setup único de R$ 259 em todos os planos.

Para começar

VDB Start

Até ~1 milhão de vetores

R$ 259/mês

+ setup R$ 259 (parcela única) · sem fidelidade

Contratar pelo WhatsApp

4 vCPU AMD EPYC
16 GB RAM
200 GB NVMe
Stack à escolha (Qdrant, Weaviate, Milvus, pgvector)
Snapshot diário · 7 dias retenção
Dashboard de monitoramento
Suporte 24/7 brasileiro

Mais popular

VDB Pro

Até ~50 milhões de vetores

R$ 599/mês

+ setup R$ 259 (parcela única) · sem fidelidade

Contratar pelo WhatsApp

8 vCPU AMD EPYC
32 GB RAM
500 GB NVMe
Stack à escolha (Qdrant, Weaviate, Milvus, pgvector)
Snapshot diário · 7 dias retenção
Dashboard de monitoramento
Suporte 24/7 brasileiro

Produção pesada

VDB Scale

500 milhões+ de vetores

R$ 1.199/mês

+ setup R$ 259 (parcela única) · sem fidelidade

Contratar pelo WhatsApp

16 vCPU AMD EPYC
64 GB RAM
1 TB NVMe
Stack à escolha (Qdrant, Weaviate, Milvus, pgvector)
Snapshot diário · 7 dias retenção
Dashboard de monitoramento
Suporte 24/7 brasileiro

Pagamento via Pix, boleto ou cartão (até 12x). Acima de 500M vetores ou requisitos especiais (HA multi-zona, dataset criptografado, etc.) — orçamento sob consulta.

Casos de uso

RAG corporativo

Indexar wiki interna (Notion, Confluence, GitBook), políticas, documentação técnica. Agente responde com contexto da empresa.

Busca semântica

Substituir busca por keyword (lenta, frustrante) por busca semântica em catálogo de produtos, base de chamados ou FAQ.

Recomendação

"Produtos similares", "artigos relacionados", "candidatos parecidos" — qualquer recomendação por similaridade vetorial.

Detecção de duplicatas

Encontrar leads duplicados no CRM, posts plagiados, imagens semelhantes. Threshold de similaridade ajustável.

Memória de longo prazo pra agente

Open Claw e outros agentes always-on usam vector DB pra "lembrar" conversas anteriores e contexto de cada usuário.

Classificação multi-label

Categorizar tickets, e-mails, leads ou conteúdo automaticamente comparando com exemplares já classificados.

Perguntas frequentes

O que é um vector database?

Banco de dados especializado em armazenar e buscar vetores (embeddings) — representações numéricas de texto, imagem ou áudio gerados por modelos de IA. Permite busca por similaridade semântica em escala (RAG, recomendação, classificação).

Quais ferramentas vocês instalam?

Você escolhe: Qdrant (mais popular, ótimo pra RAG), Weaviate (GraphQL e módulos), Milvus (escala bilhões), pgvector (PostgreSQL com extensão) ou ChromaDB. Instalamos a versão estável mais recente, configurada pro seu caso.

Por que self-hosted em vez de Pinecone?

Custo previsível (paga o servidor, não por vetor), controle total dos dados (LGPD), zero vendor lock-in (exporta quando quiser) e latência baixa (servidor brasileiro vs. Pinecone US).

Como dimensionar o plano?

1M de vetores OpenAI (1536 dim) consome ~6 GB de RAM. Start (16 GB) cobre 1-2M; Pro (32 GB) cobre até 50M com HNSW; Scale (64 GB) vai até 500M+. Em dúvida, fale com a Lana.

Funciona com OpenAI, Anthropic, Cohere?

Sim, qualquer modelo de embedding. Você gera os embeddings com a API que preferir (OpenAI, Cohere, Anthropic, Voyage, modelos locais) e armazena. Queries também usam o modelo da sua escolha.

Tem backup automático?

Sim. Snapshot diário com retenção de 7 dias. Restauração ponto-a-ponto sob demanda. Backup em storage S3-compat separado pra resiliência.

Em quanto tempo entregam?

Provisionamento em até 3 dias úteis após aprovação: setup, instalação, autenticação + TLS, dashboard de monitoramento e onboarding de 1h.

Posso fazer upgrade de plano depois?

Sim. Migração entre tiers em janela combinada (30-60 min de downtime). Pagamento proporcional ao uso, sem multa.

Pronto pra hospedar seu projeto de IA?

Comece em 5 minutos. Migração gratuita, suporte 24/7 em português e garantia de reembolso em 7 dias.

Contratar agora Falar no WhatsApp