#prediction #compression #intelligence
为什么 predict next token 是最有效的学习
因为压缩即智能,智能即压缩。
更好的压缩,代表更深层的理解;更好的预测,更好的 predict next token(让你感动的那种好),前提是更好的压缩。
一句话总结:[[Intelligence = Dynamic Lossless Reversible Compression (DLRC)]]
智能本质上是一种高效的压缩与预测系统。我们的思维、记忆、学习,其实都是在通过压缩信息并预测未来。 llm 范式的人工智能,把人类知识压缩到一个万亿参数的模型中,然后跟随你的指令和 prompt,进行高质量预测。
这就是 Arthur clarke 第三定律所说的:任何足够先进的科技,近乎魔法。