9. 新的模型架构
通过前文的学习,我们知道神经预言模型的核心借口是一个将
token
序列映射到上下文嵌入的编码器: \[
\text{the}, \text{mouse}, \text{ate}, \text{the}, \text{cheese}]
\stackrel{\phi}{\Rightarrow} \left[\binom{1}{0.1}, \binom{0}{1},
\binom{1}{1}, \binom{1}{-0.1}, \binom{0}{-1} \right].
\]