讨论:Transformer架构
添加话题外观
魔琴在话题“关于Transformer拼写的大小写”中的最新留言:22天前
|
本条目依照页面评级标准评为丙级。 本条目属于下列维基专题范畴: |
|||||||||||||||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
|||||||||||||||||||||||||||||||||
关于Transformer拼写的大小写
[编辑]
@魔琴您好!我注意到您回退了我关于"Transformer"拼写的编辑。
作为专有名词,我感觉Transformer保持首字母大写似乎较优?我参照了以下材料:
- 英文维基[1]:英文维基百科以小写transformer为主,亦有夹杂句中大写的情况。
- 提出架构的原论文Attention Is All You Need[2],其中只有冠以定语(如big,4-layer)时使用小写。
- DeepSeek V3技术报告[3],其中只有使用"transformers"(即复数形式)或在前冠以其馀定语(如Enhanced)时使用小写。
- GPT-4技术报告[4],正文全部采用大写T,惟正文提及次数较少,主要出现在引用。
- Llama 3[5],主要采大写T,惟“40 transformer blocks”之类地方采小写。
鉴于英文维基的书写未必足够formal,我个人倾向于参考学术文献的写法。考虑到原论文的表述形式未必在后续会被沿用,参考了DeepSeek技术报告与英文维基的Reference[6]小节,感觉采用"Transformer"似乎是更正式的写法。--Michael nju(留言) 2025年10月21日 (二) 03:41 (UTC)
- 我一开始认为英维的首句全小写,所以是普通名词。不过后来也注意到了很多地方大小写混杂这个问题,会不会是因为《Attention Is All You Need》的Transformer是专有名词,其他地方是普通名词?我先征求意见,然后去英维讨论页问一下。 ——魔琴[留言 贡献 PJ:小学 PJ:两岸] 2025年10月21日 (二) 07:52 (UTC)
- 我也担心只有《Attention is All You Need》采大写,后续可能会在使用中被改为小写。因此我提供了其他技术报告作为参考。
- 从其他技术报告及英文维基的Reference小节来看,似乎大部分涉及学术之处应该是采大写居多,小写的在排除“冠以定语”的特定形式之后就更少了。
- 可以先等等英文维基编者的意见再看看如何处理,非母语者遇到这种问题确实比较难办。--Michael nju(留言) 2025年10月21日 (二) 08:21 (UTC)
- 唯一一个理我的人说他把大写全改小写了。en:Special:GoToComment/c-魔琴-20251021075600-T_capitalized_or_not。先暂时这样吧。 ——魔琴[留言 贡献 PJ:小学 PJ:两岸] 2025年11月21日 (五) 12:26 (UTC)