频道

AI 投研

AI 赛道深度、公司拆解、概念解读和周报月报。

8.0 AI 投研 EleutherAI Blog
AI 投研

The Practitioner’s Guide to the Maximal Update Parameterization

本文源自EleutherAI Blog的研究专栏,聚焦最大更新参数化(Maximal Update Parameterization,简称muTransfer)的实现细节,属于面向AI从业者的实用指南。内容将梳理该参数化

The Practitioner’s Guide to the Maximal Update Parameterization
来源: EleutherAI Blog 8.0
AI Radar Summary

本文源自EleutherAI Blog的研究专栏,聚焦最大更新参数化(Maximal Update Parameterization,简称muTransfer)的实现细节,属于面向AI从业者的实用指南。内容将梳理该参数化方法的核心观点、分析框架,探讨实践中值得关注的问题,并给出非确定性的结论,为相关研发人员提供参考,完整内容可通过官方原文链接溯源。

6.0 AI 投研 EleutherAI Blog
AI 投研

Pile-T5

AI 摘要:Trained T5 on the Pile

Pile-T5
来源: EleutherAI Blog 6.0