Blockify reescreve o RAG para empresas: usa o IdeaBlock em vez de chunking, comprime 40 vezes e reduz o token em 3 vezes

A nova ferramenta de optimização de dados de IA para empresas, Blockify, foi organizada e promovida em 9 de Maio por akshay_pachaar, que afirma que, no processo de RAG (Retrieval-Augmented Generation), consegue comprimir as bases de dados das empresas 40 vezes, reduzir em 3 vezes o consumo de tokens nas consultas e aumentar em 2,3 vezes a precisão da pesquisa vectorial. Na explicação oficial do GitHub da Blockify: o produto é apresentado pela Iternal Technologies; usa unidades de conhecimento estruturadas da estrutura “IdeaBlock” para substituir o chunking tradicional e, através de deduplicação e fusão, mantém a base de conhecimento concisa, coerente e governável.

Conceito central: substituir o chunking tradicional por IdeaBlock

O desenho técnico da Blockify:

Abordagem tradicional: dividir documentos longos em chunks de tamanho fixo, incorporar vectores e, na recuperação, seleccionar top-k

Abordagem da Blockify: converter o conteúdo original em IdeaBlock — unidades de conhecimento estruturadas em XML

Cada IdeaBlock inclui: perguntas próprias, respostas fiáveis, tags, entidades e palavras-chave

IdeaBlocks semelhantes são deduplicados e fundidos automaticamente, pelo que a base de conhecimento não se expande à medida que o conteúdo cresce

O problema do chunking tradicional é que a mesma informação pode aparecer em vários chunks, gerando redundância na recuperação e desperdício de tokens; o IdeaBlock, através da deduplicação, aumenta a densidade de informação, expressando o mesmo conteúdo com um espaço de armazenamento menor.

Benefícios concretos: compressão 40 vezes, redução de tokens 3 vezes e aumento de precisão 2,3 vezes

Indicadores de benefícios concretos publicados pela Blockify:

Compressão de dados: a base de dados da empresa reduz-se para cerca de 2,5% do tamanho original (40 vezes de compressão), mantendo mais de 99% da informação

Tokens por consulta: de cerca de 303 (chunks tradicionais) para cerca de 98 (IdeaBlock) — eficiência 3,09 vezes maior

Precisão da pesquisa vectorial: aumento de 2,29 vezes

Melhoria global de precisão: cerca de 78 vezes (efeito combinado da deduplicação e das melhorias na recuperação)

Estimativa de poupança de custos: 100 milhões de consultas/ano, economizando cerca de 738 mil dólares em custos de tokens

Um aumento global de precisão de 78 vezes é um efeito combinado — a deduplicação reduz o ruído, o conteúdo estruturado do IdeaBlock é mais favorável à pesquisa vectorial, e a descida do número de tokens por resposta reduz simultaneamente o espaço para erros do modelo.

Âmbito de integração: LlamaIndex, LangChain, Milvus, Cloudflare e outras estruturas de referência

Ferramentas e infra-estruturas de base que a Blockify já integrou:

Frameworks RAG: LlamaIndex, LangChain

Gestão de conhecimento: Obsidian

Bases de dados vectoriais: Milvus, Elastic, Supabase

Computação de ponta: Cloudflare

Integração low-code: n8n (através de modelos de fluxos de trabalho)

A estratégia de integração da Blockify é “não substituir os frameworks RAG existentes, mas actuar como uma camada prévia de optimização de dados”. Os programadores podem substituir o passo de chunking por Blockify dentro de um fluxo já existente do LlamaIndex ou LangChain, mantendo o resto do processo inalterado.

Eventos concretos a acompanhar no futuro: crescimento do número de estrelas no GitHub da Blockify e taxa de adopção pela comunidade; se a Iternal Technologies vai pedir ou divulgar detalhes técnicos sobre a estrutura IdeaBlock (neste momento, promove “patented ingestion”); e se os frameworks RAG mais comuns vão incorporar uma lógica semelhante de deduplicação como função predefinida.

Este artigo, Blockify reescreve o RAG empresarial: usar IdeaBlock em vez de chunking, comprimir 40 vezes e reduzir tokens 3 vezes, surgiu primeiro em 鏈新聞 ABMedia.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

A Tencent Yuan Bao lança hoje a funcionalidade de resumo de conversas no WeChat

De acordo com o anúncio da Tencent a 13 de maio, o Tencent Yuan Bao lançou uma nova funcionalidade que permite aos utilizadores resumir registos de conversas do WeChat. Os utilizadores podem selecionar o histórico de conversas no WeChat, tocar em “Encaminhar para outras aplicações” e escolher o Yuan Bao na lista para copiar conteúdo diretamente para a interface de chat da aplicação, onde a IA fornece resumos e análises inteligentes.

GateNews3h atrás

XYO lança um SDK de IA para permitir o desenvolvimento de blockchain sem conhecimentos de Solidity a 12 de maio

De acordo com a XYO, a empresa lançou um kit de desenvolvimento de software (SDK) de IA a 12 de maio, concebido para simplificar a criação de aplicações blockchain na XYO Layer One com recurso a prompts em linguagem natural. O AI SDK permite aos programadores construir aplicações descentralizadas através de assistentes de codificação com IA, como Codex e Claude, sem exigir conhecimentos de Solidity nem experiência aprofundada em blockchain. A plataforma sediada em San Diego, que atualmente supor

GateNews3h atrás

O WeChat passa agora a permitir o encaminhamento de mensagens com um clique para o Yuanbao AI, para resumo instantâneo

Segundo Beating, o WeChat integrou-se com o assistente de IA da Tencent, Yuanbao, para permitir o reencaminhamento de mensagens entre aplicações. Os utilizadores já podem selecionar registos de chat, encaminhá-los para o Yuanbao e receber, de imediato, resumos de conversas longas de grupos ou de conversas privadas. A funcionalidade também suporta a extração de dados de despesas em tabelas, a geração de itinerários de viagem a partir de tópicos de discussão e a disponibilização de sugestões de ch

GateNews5h atrás

Wu Jihan: Objetivo de implementação de GPU em 10.000 unidades; a receita anualizada anual do “BitDeer” em nuvem de IA subiu 60% em abril

O presidente do conselho de administração do grupo Bitdeer, Wu Jihan, declarou no dia 12 de maio, na X, que: «O próximo objectivo da implementação de GPUs é de 10.000 unidades, depois 100.000 e, por fim, 1.000.000.» No mesmo dia, a Bitdeer publicou uma actualização operacional de abril não auditada, indicando que as receitas recorrentes anuais (ARR) do negócio de nuvem de IA cresceram 60% em cadeia para 69 milhões de dólares. Negócio de nuvem de IA: ARR cresce 60% em cadeia para 69 milhões de dó

MarketWhisper7h atrás

A SAP investe na n8n numa avaliação de 5,2 mil milhões de dólares através de uma venda secundária de participações

De acordo com o CEO Jan Oberhauser, a SAP da Alemanha investiu na startup berlinense de automação de fluxos de trabalho n8n através de uma venda secundária de ações, avaliando a empresa em 5,2 mil milhões de dólares. A SAP também assinou um acordo plurianual para integrar as ferramentas da n8n no seu construtor de IA Joule Studio, à medida que expande as suas ofertas de produto de IA. Fundada em 2019, a n8n disponibiliza software que permite às empresas automatizar tarefas com programação mínima

GateNews8h atrás

The Graph lança funcionalidade de pagamentos x402, suportando USDC por acesso a dados on-chain mediante pedido em 12 de maio

De acordo com o anúncio oficial da The Graph a 12 de maio, o Graph Gateway passou a suportar pagamentos x402, permitindo que programadores e Agentes de IA acedam a dados on-chain através de pagamentos por pedido em USDC, sem necessidade de chaves de API, contas ou painéis. Os utilizadores recebem uma resposta HTTP 402 com informação de preço e, em seguida, completam um pagamento em USDC baseado em assinatura na rede Base para obter dados em pedidos subsequentes. A atualização inclui um novo endp

GateNews19h atrás
Comentar
0/400
Nenhum comentário