Ramp Labs mengajukan solusi baru untuk berbagi memori antar-multiagen, konsumsi Token tertinggi turun 65%

GateNews

Berita Gerbang, 11 April, perusahaan infrastruktur AI Ramp Labs merilis hasil riset “Latent Briefing”, yang memungkinkan berbagi memori yang efisien antar sistem multi-agen dengan mengompresi langsung cache KV dari model besar. Dengan tidak mengorbankan akurasi, konsumsi Token diturunkan secara signifikan. Dalam arsitektur multi-agen arus utama, orkestrator (Orchestrator) memecah tugas dan berulang kali memanggil model pekerja (Worker); seiring rantai penalaran terus diperpanjang, jumlah Token meningkat secara eksponensial. Gagasan inti dari Latent Briefing adalah menggunakan mekanisme atensi untuk mengidentifikasi bagian konteks yang benar-benar penting, lalu membuang informasi redundan langsung pada level representasi, bukan mengandalkan ringkasan LLM yang lambat atau penelusuran RAG yang kurang stabil. Pada pengujian benchmark LongBench v2, metode ini menunjukkan performa yang menonjol: konsumsi Token model Worker turun 65%, penghematan Token untuk dokumen berukuran menengah (32k hingga 100k) mencapai median 49%, akurasi keseluruhan meningkat sekitar 3 poin persentase dibanding baseline, sementara waktu tambahan untuk setiap kompresi hanya sekitar 1,7 detik—lebih cepat kira-kira 20 kali dibanding algoritma asli. Eksperimen menggunakan Claude Sonnet 4 sebagai orkestrator dan Qwen3-14B sebagai model pekerja, mencakup skenario dokumen beragam seperti makalah akademik, dokumen hukum, novel, serta laporan pemerintah. Penelitian juga menemukan bahwa ambang kompresi optimal berbeda tergantung tingkat kesulitan tugas dan panjang dokumen—masalah yang sulit cocok untuk kompresi yang agresif guna menyaring kebisingan penalaran yang bersifat spekulatif, sementara dokumen panjang lebih cocok untuk kompresi ringan guna mempertahankan informasi kunci yang tersebar.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

OpenClaw Merilis v2026.4.29 pada 29 April, Melakukan Upgrade Memori ke Personalized Wiki dengan Pelacakan Relasi

Menurut Beating, asisten AI open-source OpenClaw (GitHub 367K bintang) merilis v2026.4.29 pada 29 April, menandai pembaruan keduanya dalam dua hari. Sistem memorinya berkembang dari pengingat berbasis pencarian sederhana menjadi wiki yang dipersonalisasi, memungkinkan agen secara otomatis membangun profil karakter dan melacak r

GateNews6jam yang lalu

CEO Google Sundar Pichai mengungkapkan bahwa dengan AI Gemini, ia dapat memahami sisi manusia untuk membangun komunikasi yang lebih tulus

Pichai mengatakan bahwa sebelum rapat-rapat penting, ia menggunakan sudut pandang Gemini untuk menganalisis dan memprediksi psikologi lawan, sehingga dapat meningkatkan empati dan komunikasi yang lebih tulus. Agen AI juga dapat secara otomatis merangkum email, menyusun jadwal, dan membuat ringkasan agar urusan harian menjadi lebih efisien. Selain itu, platform AI berbasis open co-creation tengah berkembang; teknologi sumber terbuka seperti Gemini 4 menurunkan hambatan masuk. Ia juga menekankan perlunya membangun kerangka tata kelola AI, dengan keterlibatan pihak pemerintahan dan masyarakat untuk mengatasi tantangan seperti keamanan siber, deepfake, dan keberlanjutan.

ChainNewsAbmedia9jam yang lalu

Oobit Meluncurkan Kartu Agen AI Berbasis Visa pada Kamis, Memungkinkan Pengeluaran USDT Tanpa Konversi ke Fiat

Menurut The Block, startup dompet yang didukung Tether, Oobit, meluncurkan AI Agent Cards pada Kamis, memungkinkan bot otonom melakukan pembelian menggunakan saldo USDT tanpa mengonversinya ke fiat atau mengakses kredensial kartu perusahaan secara langsung. Kartu yang didukung Visa dapat digunakan secara online di mana pun Visa dapat diakses

GateNews10jam yang lalu

ChimpX AI Menggalang 2,8 Juta Dolar AS dalam Putaran Seed yang Dipimpin Waterdrip Capital dan MetaLabs Ventures

ChimpX AI mengumumkan hari ini penutupan putaran seed senilai 2,8 juta dolar untuk mempercepat pengembangan Mojo AI, sebuah execution agent yang mengubah niat berbahasa Inggris biasa menjadi transaksi DeFi on-chain di Solana. Putaran ini dipimpin oleh Waterdrip

GateNews11jam yang lalu

CEX Utama Meluncurkan Protokol Pembayaran Agen pada 29 April, Memungkinkan Transaksi Lintas Rantai yang Didorong AI

Menurut pengumuman terbaru, salah satu bursa kripto terkemuka meluncurkan Agent Payments Protocol pada 29 April, standar terbuka yang memungkinkan agen kecerdasan buatan menjalankan transaksi bisnis penuh di berbagai jaringan blockchain tanpa campur tangan manusia. Protokol

GateNews12jam yang lalu

Walrus Meluncurkan MemWal SDK untuk Memori AI Agent

Walrus meluncurkan MemWal, sebuah SDK yang dirancang untuk mengatasi keterbatasan pada memori agentic dengan menghadirkan verifiabilitas, ketersediaan, portabilitas, dan kemampuan dibagikan dalam cara AI agent menyimpan dan mengakses informasi, menurut Product Manager Mysten Labs Group Abinhav Garg. Memori yang Dapat Diverifikasi dan Portabel

CryptoFrontier12jam yang lalu
Komentar
0/400
Tidak ada komentar