Embeddings + Sabiá-3 + RAG
Embeddings
O Que São?
Embeddings são representações numéricas de textos, utilizadas para capturar o significado semântico e as relações entre palavras, frases ou documentos em um formato vetorial. Esses vetores permitem medir a similaridade semântica entre textos e realizar tarefas de recuperação de informações e análise de similaridade semântica.
Como obter embeddings com a Maritaca AI
A Maritaca AI não disponibiliza atualmente um modelo próprio de embeddings. Por isso, recomenda a utilização da DeepInfra como provedor de embeddings. A DeepInfra oferece o modelo Multilingual-E5-large, especializado em embeddings para múltiplos idiomas. Este guia será dedicado ao uso da DeepInfra, mas incentivamos você a avaliar diferentes fornecedores de embeddings para encontrar a solução mais adequada ao seu caso de uso específico.
Começo rápido com DeepInfra
O DeepInfra oferece um modelo de embeddings multilíngue chamado intfloat/multilingual-e5-large. As seções a seguir demonstram como usar esse modelo para obter embeddings via Python.
1. Registre-se e obtenha sua chave de API
Você precisa obter uma chave de API do DeepInfra para autenticar suas requisições.
2. Use Python para enviar requisições de embeddings
Você pode usar a biblioteca requests no Python para interagir com a API do DeepInfra.
pip install requests