Hanya sebuah pemikiran: mungkin "bitstream" lebih menangkap esensi daripada "token" ketika kita berbicara tentang arsitektur AI. Dan inilah masalahnya - mengapa kita masih terobsesi dengan jumlah parameter? Kendala nyata ada tepat di depan kita: kapasitas memori, batasan bandwidth, dan operasi komputasi. Ukuran file memberi tahu Anda lebih banyak tentang apa yang sebenarnya dapat dilakukan. Kita seharusnya mengukur model AI berdasarkan apa yang secara fisik membatasi mereka, bukan angka abstrak yang terlihat mengesankan di atas kertas.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
13 Suka
Hadiah
13
5
Posting ulang
Bagikan
Komentar
0/400
BanklessAtHeart
· 11-06 17:22
Lompat pikiran begitu cepat, terjebak.
Lihat AsliBalas0
DataPickledFish
· 11-06 10:09
Hardware bull adalah bull sejati!
Lihat AsliBalas0
AirdropLicker
· 11-06 10:07
Ukuran file adalah yang terpenting~
Lihat AsliBalas0
HallucinationGrower
· 11-06 09:57
Sebuah parameter model ditambah setumpuk air saja.
Lihat AsliBalas0
ZKProofster
· 11-06 09:50
secara teknis, ukuran != kemampuan... ini hanya teori informasi dasar smh
Hanya sebuah pemikiran: mungkin "bitstream" lebih menangkap esensi daripada "token" ketika kita berbicara tentang arsitektur AI. Dan inilah masalahnya - mengapa kita masih terobsesi dengan jumlah parameter? Kendala nyata ada tepat di depan kita: kapasitas memori, batasan bandwidth, dan operasi komputasi. Ukuran file memberi tahu Anda lebih banyak tentang apa yang sebenarnya dapat dilakukan. Kita seharusnya mengukur model AI berdasarkan apa yang secara fisik membatasi mereka, bukan angka abstrak yang terlihat mengesankan di atas kertas.