Talk:Mamba2
添加话题外观
Tisscherry在话题“同行評審”中的最新留言:4个月前
| ||||||||||
| 本條目已經由維基百科社群同行評審並已存檔,當中或有可以改善此條目的資訊。 | ||||||||||
|
本条目依照页面评级標準評為初级。 本条目属于下列维基专题范畴: |
|||||||||||||||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
|||||||||||||||||||||||||||||||||
同行評審
[编辑]== Mamba2 ==
Mamba2(编辑 | 讨论 | 历史 | 链接 | 监视 | 日志)
- 评审期:2025年7月4日 (五) 14:57 (UTC)至2025年8月3日 (日) 14:57 (UTC)
下次可評審時間:2025年8月10日 (日) 14:58 (UTC)起
新人写的第一个条目,在此征求外部意见,以供改进,谢谢。Vertin,do you want to be the timekeeper?(留言) 2025年7月4日 (五) 14:57 (UTC)
- 没有分类。--Allervous花冷列車 2025年7月5日 (六) 08:56 (UTC)
- @MilkyDefer:我看到你好像把他的文章移回草稿去了,理由似乎和arXiv的來源以及复述手法有關。arXiv我懂,但复述手法可能要問一下你的想法。
- @Linxingjun:說一下,引用最佳的論文來源,應當為經過同行評審的期刊論文。arXiv似乎有未經同行評審的論文,這大概是他「表示担忧」的原因。可能的話試試看 ACM, IEEE Xplore, JSTOR, Scopus 看看吧。有論文需要查找的話可以找WP:維基圖書館。--Saimmx(留言) 2025年7月5日 (六) 18:01 (UTC)
- 我刚才看到了,等我到时候有空了改一下
- 至于复述手法我并不是很理解,因为mamba乃至很多的深度学习模型都是一种发明创造,他肯定是来源于作者所发表的某个论文,论文复述我想不通为什么这是理由,事实上除了复述之外我没想到别的方式,我总不能搞原创研究吧--Vertin,do you want to be the timekeeper?(留言) 2025年7月5日 (六) 18:06 (UTC)
- arxiv作为预印本平台,确实大多数都没有经过同行评审,这个是我的问题--Vertin,do you want to be the timekeeper?(留言) 2025年7月5日 (六) 18:07 (UTC)
- 我幫你了找兩份應該與Mamba2有關的論文,你讀一下。我不太確定會議論文是否會經過同行評審就是了。--Saimmx(留言) 2025年7月5日 (六) 18:19 (UTC)
- 会议论文一般来说会经过,你把论文放在哪里了--Vertin,do you want to be the timekeeper?(留言) 2025年7月5日 (六) 18:26 (UTC)
- 我已看到--Vertin,do you want to be the timekeeper?(留言) 2025年7月5日 (六) 18:28 (UTC)
- 我幫你了找兩份應該與Mamba2有關的論文,你讀一下。我不太確定會議論文是否會經過同行評審就是了。--Saimmx(留言) 2025年7月5日 (六) 18:19 (UTC)
- 把这个条目想象成一篇论文。「架构」一章很像正常论文的section 3 (method);「性能优势」像section 4 (experiments);「未来方向」更是section 5 (conclusion)。我不能接受如此简单地量产条目。我推荐将它合并到Mamba里面。--MilkyDefer 2025年7月6日 (日) 10:17 (UTC)
- 并且Mamba-2并不能视作「跟cnn,mamba,gan一模一样」。虽然都是来源于论文但是并非突破性。好像yolo都v12了,但是肯定不能说从v1到v12每个都建一个条目吧?--MilkyDefer 2025年7月6日 (日) 10:20 (UTC)
- 这个是我的写法问题,我在此道歉
- 但是我并不认同合并的做法,正如大家不能把同一个系列的不同作品全部合并到一个条目中,除非这个系列的每个作品都不知名又或者不同作品本质上是相同的,你说的yolo这是不成立的因为它的创新点并没有mamba1/2显著,你可以去看看他的发展史,你能说他每一个相较于前作他所创新的部分每一个都是独特的吗,k-means是yolo2作者所提出的算法吗,FPN是yolo3作者所提出的算法吗,可mamba2相较于mamba之间的创新是确确实实独特的,在mamba2提出之前,你能找到任何一个对mamba的改进到可以允许在现代加速器上使用矩阵乘法单元吗
- 另外,显然的,mamba2对mamba改进到显著到已经可以投出一篇期刊论文而不触及一稿多投的问题了,并且这种改进并不像其他的改进,那个时候有多少篇mambaXvision的。?--Vertin,do you want to be the timekeeper?(留言) 2025年7月6日 (日) 10:27 (UTC)
- 我后面我也会专门写一个小标题说明一下mamba2到底是怎么改进的--Vertin,do you want to be the timekeeper?(留言) 2025年7月6日 (日) 10:28 (UTC)
- Mamba-2的改进:提出了状态空间对偶(SSD)框架,连接了状态空间模型、结构化矩阵和注意力机制。SSD可以从三个方面来理解:SSD Model是一个 DNN 模型层,可以用来组合以构建模型;SSD Framework是一个分析框架,可以分析各种生成式模型特点;SSD algorithm是更加适合GPU计算的高效算法,比 SSM 有更高的计算效率。最后,基于SSD还可以进行系统层面的优化,充分利用针对Transformers开发的优化,例如张量并行,序列并行,可变长序列的训练和推理等。
- 如果说这些创新性都是其他人论文上面有的只是mamba2作者单纯的排列组合,那么我赞同你的观点,但是很可惜并不是--Vertin,do you want to be the timekeeper?(留言) 2025年7月6日 (日) 10:36 (UTC)
- 我认为我的缺点就是把这玩意写的太像论文了,并没有考虑到非专业读者的问题,but
- method和架构像是很正常的因为他们都是在说明同一样东西,但我不赞同你的一样观点
- mamba2他不仅是单单纯纯的做实验来证明自己的性能优势,他还有时间复杂度的分析,硬件性能的优化等等,而这些并不是光凭实验就能得出来的
- 未来方向这个确实是我的问题,因为我是直接从论文上面直接复述一遍的--Vertin,do you want to be the timekeeper?(留言) 2025年7月6日 (日) 10:40 (UTC)
- 回看了一下,性能优势那一栏我确实忘记写时间复杂度的分析以及它是怎么样优化硬件加速的了,这个我在此道歉--Vertin,do you want to be the timekeeper?(留言) 2025年7月6日 (日) 10:41 (UTC)
- 已经修改完毕。--Vertin,do you want to be the timekeeper?(留言) 2025年7月11日 (五) 11:02 (UTC)
