整合营销服务商

电脑端+手机端+微信端=数据同步管理

免费咨询热线:

贾扬清共一论文获时间检验奖,国内无缘10篇最佳论文,

贾扬清共一论文获时间检验奖,国内无缘10篇最佳论文,ICML 2024奖项

器之心报道

机器之心编辑部

ICML 全称是 International Conference on Machine Learning,由国际机器学习学会(IMLS)举办,是计算机人工智能领域的顶级会议。

今年的 ICML 大会已是第 41 届,目前正在奥地利维也纳举行。在刚刚进行的开幕式上,一年比一年火热的 ICML 公布了今年的大会数据与奖项信息。

本届主会议共收到有效论文投稿 9473 篇,其中有 2610 篇论文被录用,录用率为 27.5%,其中包含 144 篇 oral,191 篇 spotlight。

被接收论文的主题关键词为:大语言模型、强化学习、深度学习、图神经网络、机器学习、联邦学习、扩散模型、Transformer、LLM、表示学习、生成模型…… 这些关键词也代表了当前 AI 领域最为热门的研究方向。

除了这些数据,大会现场还公布了今年的时间检验奖与最佳论文。贾扬清十年前在伯克利期间共一完成的论文 DeCAF,获得了今年的时间检验奖。而相比于去年的 6 篇,今年有 10 篇研究获得最佳论文,其中包含前段时间爆火的 Google DeepMind 世界模型 Genie、视频模型 VideoPoet 等。

时间检验奖

关于 DeCAF 获奖,贾扬清在朋友圈表示,「从今天的用词来说,DeCAF 应该是视觉领域的 foundation features 和 deep embedding,也让计算机视觉领域有了一个 generalizable feature。DeCAF 的工作后来又催生了通用的物体检测框架 R-CNN,高性能异构计算的框架 Caffe,间接促成了伯克利和 NVidia 合作编写了第一代的加速框架 CuDNN,雅虎实验室创作的大规模分布式训练 CaffeOnSpark,等一系列工作,奠定了伯克利在深度学习浪潮当中的领先地位。」

论文:DeCAF: A Deep Convolutional Activation Feature for Generic Visual Recognition

作者:Jeffrey Donahue、Yangqing Jia、Oriol Vinyals、Judy Hoffman、Ning Zhang、Eric Tzeng、Trevor Darrell

机构:UC Berkeley & ICSI, Berkeley, CA, USA

论文链接:https://arxiv.org/pdf/1310.1531

研究团队评估了从在大规模、固定的目标识别任务集上以完全监督方式训练的深度卷积网络的激活中提取的特征是否可以重新用于新的通用任务。这些通用任务可能与最初训练的任务有显著不同,且可能没有足够的有标签或无标签数据来常规地训练或调整深度架构以适应新任务。他们研究并可视化了深度卷积特征在各种任务(包括场景识别、领域适应和细粒度识别挑战)中的语义聚类。研究者比较了依赖网络不同层次来定义固定特征的效果,并报告了在若干重要视觉挑战上显著优于现有技术的新结果。他们发布了 DeCAF,这是一种深度卷积激活特征的开源实现,包含所有相关的网络参数,以便视觉研究人员能够在一系列视觉概念学习范式中进行深度表示的实验。

最佳论文

论文 1:Scaling Rectified Flow Transformers for High-Resolution Image Synthesis

作者:Patrick Esser, Sumith Kulal, Andreas Blattmann, Rahim Entezari, Jonas Müller, Harry Saini, Yam Levi, Dominik Lorenz, Axel Sauer, Frederic Boesel, Dustin Podell, Tim Dockhorn, Zion English, Robin Rombach

机构:Stability AI

论文地址:https://proceedings.mlr.press/v235/esser24a.html

机器之心报道:Stable Diffusion 3论文终于发布,架构细节大揭秘,对复现Sora有帮助?

这篇论文正是 Stable Diffusion 3 的论文。与之前的版本相比,Stable Diffusion 3 生成的图在质量上实现了很大改进,支持多主题提示,文字书写效果也更好了。

Stable Diffusion 3 模型架构。

扩散模型通过将数据的前向路径反转为噪声来从噪声中创建数据,已成为一种强大的生成建模技术,适用于图像和视频等高维感知数据。Rectified Flow(RF)是一种最新的生成模型公式,它将数据和噪声连接在一条直线上。尽管其具有更好的理论特性、概念简单,但它尚未被明确确立为标准实践。

该研究改进了现有的噪声采样技术,通过将 RF 模型偏向于感知相关的尺度来训练它们。通过大规模研究,该研究表明与用于高分辨率文本到图像合成的现有扩散公式相比,这种方法具有优越的性能。

此外,该研究还提出了一种基于 Transformer 的新型架构,用于文本到图像的生成,该架构对两种模式使用单独的权重,并实现图像和文本 token 之间的双向信息流,从而改善文本理解、人类偏好评级等。该研究证明,该架构遵循可预测的扩展趋势,并观察到验证损失随着模型大小和训练步骤的增加而平稳降低。

改进的多模态扩散 Transformer:MMDiT 块。

论文 2:Genie: Generative Interactive Environments

作者:Jake Bruce, Michael Dennis, Ashley Edwards, Jack Parker-Holder, Yuge Shi, Edward Hughes 等

机构:Google DeepMind、不列颠哥伦比亚大学

论文地址:https://arxiv.org/pdf/2402.15391.pdf

该论文定义了生成式 AI 的全新范式 —— 生成式交互环境 ——Genie(Generative Interactive Environments)。Genie 是一个 110 亿参数的基础世界模型,可以通过单张图像提示生成可玩的交互式环境。

机器之心报道:刚刚,谷歌发布基础世界模型:11B参数,能生成可交互虚拟世界

Genie 架构中的多个组件基于 Vision Transformer (ViT) 构建而成。值得注意的是,由于 Transformer 的二次内存成本给视频领域带来了挑战,视频最多可以包含 (10^4 ) 个 token。因此,谷歌在所有模型组件中采用内存高效的 ST-transformer 架构,以此平衡模型容量与计算约束。

Genie 包含三个关键组件(如下图所示):

1) 潜在动作模型(Latent Action Model ,LAM),用于推理每对帧之间的潜在动作 ;

2) 视频分词器(Tokenizer),用于将原始视频帧转换为离散 token ;

3) 动态模型,给定潜在动作和过去帧的 token,用来预测视频的下一帧。

为了实现可控的视频生成,谷歌将前一帧所采取的动作作为未来帧预测的条件。然而,此类动作标签在互联网的视频中可用的很少,并且获取动作注释的成本会很高。相反,谷歌以完全无监督的方式学习潜在动作。

论文 3:Considerations for Differentially Private Learning with Large-Scale Public Pretraining

作者:Florian Tramèr, Gautam Kamath, Nicholas Carlini

机构:苏黎世联邦理工大学、滑铁卢大学、Google DeepMind

论文地址:https://arxiv.org/abs/2212.06470

通过利用在大型公共数据集上预训练的非私有模型的迁移学习功能,可以显著提高差分私有机器学习的性能。该论文质疑使用大型网络抓取数据集是否应被视为差分隐私保护。

该研究认为:将这些在网络数据上预训练的模型设置为「私有」模型可能会损害并削弱公众对差分隐私的信任。除了使用公共数据的隐私考虑之外,该研究进一步质疑了这种范式的实用性。该研究仔细检查了现有的机器学习基准是否适合衡量预训练模型泛化到敏感领域的能力,这些领域在公共网络数据中可能很难得到体现。

此外,该研究注意到部署大模型可能会造成隐私的净损失,因为需要将私有数据外包给计算能力更强的第三方。

论文 4:Discrete Diffusion Modeling by Estimating the Ratios of the Data Distribution

作者:Aaron Lou、Chenlin Meng、Stefano Ermon

机构:斯坦福大学、Pika Labs

论文地址:https://proceedings.mlr.press/v235/lou24a.html

尽管扩散模型在许多生成建模任务中表现出色,但在自然语言等离散数据领域却未能达到预期效果。标准的扩散模型依赖于成熟的得分匹配理论,但将其推广到离散结构的尝试并未带来相同的经验收益。

在这项工作中,研究团队通过提出得分熵这一新颖的损失来弥补这一差距。得分熵自然地将得分匹配扩展到离散空间,无缝集成以构建离散扩散模型,并显著提升性能。

在实验中,他们在标准语言建模任务上测试了得分熵离散扩散模型(SEDD)。在可比的模型规模下,SEDD 优于现有的语言扩散范式(困惑度降低 25-75%),并且与自回归模型竞争,特别是在性能上超过了 GPT-2。此外,与自回归模型相比,SEDD 能够在不需要分布退火技术(如温度缩放)的情况下生成真实文本(生成困惑度比未退火的 GPT-2 高出约 6-8 倍),可以在计算量和质量之间进行权衡(以 32 倍更少的网络评估实现相似的质量),并且支持可控的填充(匹配核采样质量,同时允许除从左到右提示之外的其他策略)。

论文 5:Probabilistic Inference in Language Models via Twisted Sequential Monte Carlo

作者:Stephen Zhao、Rob Brekelmans、Alireza Makhzani 、Roger Grosse

机构:University of Toronto、Vector Institute

论文地址:https://proceedings.mlr.press/v235/zhao24c.html

大语言模型(LLMs)的众多能力和安全技术,包括 RLHF、自动红队测试、提示工程和填充,可以视为从由给定奖励或潜在函数定义的非规范化目标分布中采样。在这项工作中,作者利用顺序蒙特卡洛(SMC)的丰富工具箱来处理这些概率推理问题。特别是,他们使用学习到的扭曲函数来估计每个时间步长上潜在的预期未来值,从而能够在推理时的计算集中在有希望的部分序列上。

研究者提出了一种新颖的对比方法来学习扭曲函数,并与软强化学习的丰富文献建立了联系。作为扭曲 SMC 框架的一个补充应用,他们提出了一种方法,使用新的双向 SMC 界限在对数分区函数上评估语言模型推理技术的准确性。这些界限可用于估计推理分布与目标分布之间的双向 KL 散度。他们应用推理评估技术,证明扭曲 SMC 在从预训练模型中采样不良输出(对无害训练和自动红队测试很有用)、生成具有不同情感的评论以及执行填充任务方面是有效的。

论文 6:Debating with More Persuasive LLMs Leads to More Truthful Answers

作者:Akbir Khan、John Hughes、Dan Valentine、Laura Ruis、Kshitij Sachan、Ansh Radhakrishnan、Edward Grefenstette、Samuel Bowman、Tim Rockt?schel、Ethan Perez

机构:伦敦大学学院、Speechmatics、MATS、Anthropic、FAR AI

论文地址:https://proceedings.mlr.press/v235/khan24a.html

将大语言模型(LLMs)与期望行为对齐的常见方法在很大程度上依赖于人工标注数据。然而,随着模型变得越来越复杂,它们将超越人类的专业知识,而人类评估的角色将演变为非专家监督专家。基于此预期,研究者提出了一个问题:较弱的模型能否评估较强模型的正确性?他们设置了类似的情景来研究这个问题:其中较强的模型(专家)拥有回答问题所需的背景信息,而较弱的模型(非专家)缺乏这些信息。研究者选择了辩论作为测试方法 —— 即让两个 LLM 专家各自为不同的答案辩护,由非专家选择最终答案。

研究团队发现辩论有效地帮助了非专家模型和人类回答问题,分别实现了 76% 和 88% 的准确率(原始基线分别为 48% 和 60%)。

此外,以无监督方式优化专家辩手的说服力,提高了非专家在辩论中识别真相的能力。此结果在缺乏真值标签的情况下,通过辩论对齐模型的可行性提供了参考。

论文 7:Information Complexity of Stochastic Convex Optimization: Applications to Generalization, Memorization, and Tracing

作者:Idan Attias、Gintare Karolina Dziugaite、Mahdi Haghifam、Roi Livni、Daniel Roy

机构:本?古里安大学、多伦多大学、DeepMind 等

论文地址:https://proceedings.mlr.press/v235/attias24a.html

在这项工作中,作者研究了在随机凸优化(SCO)背景下记忆与学习之间的相互作用。他们通过学习算法揭示其训练数据点的信息来定义记忆,并使用 Steinke 和 Zakynthinou(2020)提出的条件互信息(CMI)框架来量化这些信息。

该研究的主要结果是精确刻画了学习算法的准确性与其 CMI 之间的权衡,回答了 Livni(2023)提出的一个开放问题。本文表明,在 L2 Lipschitz–有界设置和强凸性条件下,每个具有过度误差 ? 的学习者,其 CMI 分别下界为 Ω(1/?2) 和 Ω(1/)。作者 进一步设计一个对手,展示了记忆在 SCO 问题中不可或缺的作用,该对手能够在特定的 SCO 问题中准确识别出大量训练样本。最后,他们列举了结果的若干影响,例如基于 CMI 的泛化界限的限制以及 SCO 问题中样本的不可压缩性。

论文 8:Measure Dataset Diversity, Don't Just Claim It

作者:Dora Zhao、Jerone Andrews、Orestis Papakyriakopoulos、Alice Xiang

机构:斯坦福大学、Sony AI(英国伦敦)、慕尼黑工业大学、Sony AI(美国西雅图)

论文地址:https://arxiv.org/html/2407.08188v1

机器学习(ML)数据集通常被认为是中立的,但它们本质上包含了抽象且有争议的社会构建。数据集策展人经常使用诸如多样性、偏见和质量等价值负载术语来描述数据集。尽管这些术语被广泛使用,但它们缺乏明确的定义和验证。该研究团队的研究通过分析 135 个图像和文本数据集中的 “多样性” 来探讨这一问题的影响。借鉴社会科学,应用测量理论中的原则来确定考虑因素,并提供有关数据集中多样性的概念化、操作化和评估的建议。他们的研究结果对 ML 研究具有广泛的影响,倡导在数据集构建中处理价值负载属性时采用更细致和精确的方法。

论文 9:VideoPoet: A Large Language Model for Zero-Shot Video Generation

作者:Dan Kondratyuk、Lijun Yu、Xiuye Gu、Jose Lezama、 Jonathan Huang、Grant Schindler、Rachel Hornung、Vighnesh N Birodkar、Jimmy Yan、Ming-Chang Chiu、Krishna Somandepalli、Hassan Akbari、Yair Alon、Yong Cheng、Joshua V Dillon、Agrim Gupta、Meera Hahn、Anja Hauth、David Hendon、Alonso Martinez、David Minnen、Mikhail Sirotenko、Kihyuk Sohn、Xuan Yang、Hartwig Adam、Ming-Hsuan Yang、Irfan Essa、Huisheng Wang、David Ross、Bryan Seybold、Lu Jiang

机构:谷歌、卡内基梅隆大学

论文地址:https://proceedings.mlr.press/v235/kondratyuk24a.html

项目链接:http://sites.research.google/videopoet/

机器之心报道:视频生成可以无限长?谷歌 VideoPoet 大模型上线,网友:革命性技术

研究团队发布了 VideoPoet,这是一种能够从多种条件信号合成高质量视频的语言模型。VideoPoet 采用仅解码器的 Transformer 架构,处理包括图像、视频、文本和音频在内的多模态输入。

训练协议遵循大语言模型(LLMs)的流程,包括两个阶段:预训练和任务特定适应。在预训练阶段,VideoPoet 在自回归 Transformer 框架内结合多模态生成目标的混合。预训练的 LLM 作为基础,可以适应一系列视频生成任务。他们展示了该模型在零样本视频生成方面的最新能力,特别是生成高保真运动的能力。

论文 10:Stealing part of a production language model

作者:Nicholas Carlini、Daniel Paleka、Krishnamurthy Dvijotham、Thomas Steinke、Jonathan Hayase、A. Feder Cooper、Katherine Lee、Matthew Jagielski、Milad Nasresfahani、Arthur Conmy、Eric Wallace、David Rolnick、Florian Tramer

机构:OpenAI、Google DeepMind、苏黎世联邦理工学院、华盛顿大学、麦吉尔大学

论文地址:https://arxiv.org/pdf/2403.06634

该论文提出了一种全新的攻击 AI 模型的方法。它能够从 OpenAI 的 ChatGPT 或谷歌的 PaLM-2 的黑盒生成式语言模型中,精准提取信息。这种方法能侵入 Transformer 的嵌入投影层(这是模型理解语言的关键部分),只需要通过 API 访问权限,通过一个网站或应用程序,和模型聊天就能让它「破防」。基于论文中的方法,研究者破解了了 GPT 系列两个基础模型 Ada 和 Babbage 的整个投影矩阵的整个投影矩阵,如隐藏维度这样的关键信息也直接破获:一个为 1024,一个为 2048。他们还攻破了 gpt-3.5- turbo 的隐藏维度,如果想要恢复模型的整个投影矩阵,成本不会超过 2000 美元。研究者提出了一系列防御措施和缓解策略,以防范此类攻击的发生。

产动漫风愈刮愈烈,从《大圣归来》到《大鱼海棠》,每一部国产动漫的片子都备受热评,网评有好有坏,有吐槽有质疑也有赞扬,最近大热的《大鱼海棠》更是被指抄袭,骂声一片。目前正在东南卫视和石狮电视台热播动画,国内首创 ”全年龄层双段式” 原创IP《灵石茂险王》是世茂斥巨资打造的一部走心的良心动画,竟也难逃指责被指抄袭。

现在众多网友说满屏中国风的《大鱼海棠》抄袭千与千寻,东南卫视热播的原创IP动画《灵石茂险王》也被指模仿。

近年来国产原创动漫已经有了飞速发展,但跟日本和欧美相比还处于学习阶段,学习别人长处是成长的过程而并非模仿,这一点不能被忽略。原创IP《灵石茂险王》吸取了很多优秀动漫的长处,而被误认为模仿,实属冤枉。

《灵石茂险王》场景插画——南之山谷山路&丛林

《灵石茂险王》人物原设——天空之城人物

《灵石茂险王》——Q版莎莎造型

首创“全年龄层 双段式”结构

<iframe align="center,center" allowtransparency="true" frameborder="0" height="250" hspace="0" id="iframeu2148927_0" marginheight="0" marginwidth="0" scrolling="no" src="http://pos.baidu.com/vcxm?rdid=2148927&dc=2&di=u2148927&dri=0&dis=0&dai=1&ps=2883x694&dcb=BAIDU_SSP_define&dtm=HTML_POST&dvi=0.0&dci=-1&dpt=none&tsr=0&tpr=1468576714875&ti=%E5%9B%BD%E6%BC%AB%E9%A2%91%E9%A2%91%E8%A2%AB%E6%8C%87%E6%8A%84%E8%A2%AD%EF%BC%8C%E5%8E%9F%E5%88%9B%E3%80%8A%E7%81%B5%E7%9F%B3%E8%8C%82%E9%99%A9%E7%8E%8B%E3%80%8B%E4%B8%8D%E5%B9%B8%E8%BA%BA%E6%9E%AA%20-%20%E6%B6%88%E8%B4%B9%E6%8C%87%E5%8D%97%20-%2021CN.COM&ari=2&dbv=2&drs=1&pcs=2378x1170&pss=2379x3149&cfv=0&cpl=32&chi=1&cce=true&cec=UTF-8&tlm=1468576714&rw=1170&ltu=http%3A%2F%2Flife.21cn.com%2Fzaojiao%2Fshopping%2Fa%2F2016%2F0714%2F15%2F31288600.shtml&ecd=1&psr=1920x1080&par=1920x1050&pis=-1x-1&ccd=24&cja=true&cmi=48&col=zh-CN&cdo=-1&tcn=1468576715&qn=ef45db10d4bdecfc&tt=1468576714814.72.154.158" style="display: block; border: 0px; vertical-align: bottom; margin: 0px;" vspace="0" width="250"></iframe>

《灵石茂险王》是国内首创“全年龄层、双段式”结构动画,同时拥有3D和2D“大茂小剧场”、Q版两种视觉表达形式来满足不同年龄层的观众,每集22分钟,前19分钟针对7-14岁儿童的寓教于乐式的3D科幻冒险类动画片,后3分钟满足3-6岁小朋友观影需求的2D卡通小剧场。此模式的优点在于,既延展了传统卡通片单一的表现形式,又将IP价值最大化地呈现给观众。

不可否认,在当今日漫欧漫撑起半边天的现况下。国漫走得尤其艰辛。但我们不得不承认的是,国产动画越来越用心。《灵石茂险王》是世茂集团精心打造的一部优质动画。在传统地产转型之余,发展以优质的IP作为灵魂,为国产动漫的发展献出自己的一份力量,是世茂集团的初衷。

不过有吐槽有质疑,这说明观众对国产动画的要求越来越高,也说明观众们越来越重视我们自己的动画。《灵石茂险王》这部优质原创IP动画将在全国各大少儿卫视陆续开播,陪伴小朋友们开启欢乐的假期模式,这是值得我们关注的一部原创动画!

对于我国的动漫产业以及这些正在努力为国产动漫做贡献的人们,请我们少一份冷漠与吐槽,给予多一份理解和支持。

望着,盼望着,春天来了,Vega的脚步又近了。然而据小道消息称,Vega最早也要在5月份才能与大家见面,为了安抚A饭们迫切的心情,AMD在4月中旬的这个时候正式为大家带来了Polaris 10的升级版产品——Radeon RX 580作为Vega发布前的“开胃菜”。该卡同样使用Polaris核心,不过已经由Polaris 10升级为Polaris 20,并且公版的外观和散热方式照比之前有所改变,神似蓝宝石的RX 400超白金系列,从单涡轮扇换成了双开放式风扇,不过整体风格还是跟之前一样。

此前我们已经对全新的RX 500系列显卡进行了全面的曝光,这些曝光均已被证实:该卡拥有和RX 480相同的GCN 4.0架构,同样具备2304个流处理器,显存配置也是一样的256-bit 8Gbps GDDR5,也就是说从硬件参数上看,RX 580和RX 480是没有什么区别的。正如前面说的,RX 580是RX 480的升级版产品,因此核心没什么变化也是正常的,重点是看AMD对全新的RX 580进行了怎样的优化。

蓝宝石 RX 580 超白金 OC 限量版

说起RX 580和RX 480最大的不同自然就是频率方面,RX 580的核心频率可达1340MHz,照比RX 480提升了11%,非公版提升更为明显,率先寄到我们这里的蓝宝石 RX 580 超白金 OC 限量版的频率高达1450MHz,照比RX 480公版提升了20%以上!此外,RX 580无论是公版还是非公版的PCB均经过全面优化,最直观的一处就是供电接口:公版的外接供电由RX 480的6pin升级为8pin,而我们手里这块蓝宝石非公版采用的则是8+6pin,当然,强化供电除了为了避免去年“偷电门”事件的再度发生,由于频率的升高,更充足的供电也能保证显卡在高频下工作的稳定性。

照比R9 380X和GTX 970提升非常明显

距离上一次AN两家发布甜点级新卡才过去不到一年,所以两家都没有准备像去年一样的革命性产品,AMD推出了RX 480的升级版RX 580,而NVIDIA发布了GTX 1060的显存超频版GTX 1060 9Gbps,二者都只能算是去年的小改良版。两款新卡对于那些去年已经购买了RX 480或GTX 1060的人来说升级的意义不大,但对于那些还在使用GTX 960、R9 380这样的甜点卡的玩家来说,今年这两款卡似乎可以成为他们下手的目标。所以我们第一时间为大家带来了RX 580的首测文章,告诉那些还在犹豫的朋友这款卡究竟值不值得买。

更顺滑的高清游戏体验

在开始测试之前我们先说一下参测显卡,吉吉我为了精确体现Radeon RX 580的实力,选择了一块GTX 1060以及一块RX 480作为主要对比对象。考虑到我们所用的RX 580为蓝宝石的顶级非公版产品,我们选择的GTX 1060为微星的GTX 1060 GAMING X,同样是市面上的顶级非公版GTX 1060之一。RX 480我们选择的是蓝宝石RX 480海外版,是一款市面上比较有代表性的RX 480非公版产品。那么接下来就让我们通过全方位的游戏和软件测试,来看看新升级的Polaris会有怎样的实力。

Radeon RX 580视频

http://www.iqiyi.com/w_19rtyitl7p.html?source=

频率再创新高

Radeon RX 580采用14nm FinFET “Polaris 20”核心,核心面积为232平方毫米,共包含57亿个晶体管。基于GCN 4.0架构的该核心共有2304个流处理器,运算单元数量为36个,TMUs总数量为144个,ROPs数量为32个,四个带宽为64bit的双通道显存控制器组成了总量为256bit的显存控制单元,大小为8GB。

显 卡 规 格 比 较 表



显卡型号RX 480RX 580R9 380XGTX 1060
首发限价¥1999¥1899¥1799¥1999
GPU代号Polaris 10Polaris 20AntiguaGP106
GPU工艺14nm14nm28nm16nm
GPU晶体管5.7B 5.7B 5B 4.4B
着色器数量2304230420481280
单精度浮点5.8 T6.2 T4 T4.4T
ROPs数量32323248
纹理单元数量14414412880
核心频率1120MHz1257MHz?MHz1506MHz
boost频率1266MHz1340MHz970MHz1709MHz
架构GCN 4.0GCN 4.0GCN 1.2 Pascal
显存频率2000 MHz2000 MHz1425 MHz2002 MHz
内存位宽256 bit256 bit256 bit192 bit
内存带宽256 GB/s256 GB/s182 GB/s192 GB/s
内存类型GDDR5GDDR5GDDR5GDDR5
内存容量8/4 GB8/4 GB4 GB6 GB

注:表中售价均为官方首发限价

我们可以看到,Radeon RX 580的默认核心频率已经几乎与RX 480的boost频率持平,而Boost频率则是高达1340MHz,比RX 480高了74MHz,这个频率是目前所有A卡中最高的。RX 580显存带宽为256GB/s,默认Pixel Fillrate能力达到了42.9 Gpiexls/S,默认Texture Fillrate能力为193 Gtexels/S。凭借高频和庞大的运算规模,RX 580拥有6.2 TFLOPS的高单精度浮点运算能力,照比RX 480又提升了0.4T。

Polaris 20架构图

GCN 4.0架构Polaris 20芯片由以下主要的部分组成:

1、基于三星的14nm FinFET工艺,照比之前的28nm工艺,为每个CU单元带来15%的性能提升,以及高达2.8倍的能耗比提升。

2、与“Fiji”相同的宏观并行结构,36组CU单元被分为4个Shader Engines,每个Shader Engines包含9组CUs。每个CU的Shader效率照比前代提升了15%,同时几何引擎也有所改进。

3、与Shader Engines一一对应的4组Geometry Unit(几何处理单元)以及4组Rasterizer(光栅化单元)。

4、ACE异步计算单元的总量为4组,同时,还有2组全新的,为异步运算设计的HWS加入到架构中。HWS用来更好地对硬件资源进行调度,提高异步运算效率。

5、二级缓存是之前的2倍,在降低显存带宽需求的同时改善电源效率,在显存运行上更节能。

RX 580和RX 570详细参数

上表是RX 580和RX 570的详细参数,我们可以看到,随着频率的提升,两张卡的单精度浮点运算性能、像素填充率和纹理填充率均有明显上升,不过TDP也水涨船高,RX 580照比RX 480涨了35W,RX 570照比RX 470涨了30W。

Radeon Chill技术介绍

在去年年末,AMD发布了鸡血驱动Radeon Software Crimson ReLive Edition 16.12.1,该驱动为玩家带来了一个全新的功能——Radeon Chill,该技术可以说是“超出想象的节能手段”。Radeon Chill会实时监控游戏状态,在玩家没有操作鼠标、键盘时自动降低帧率,一旦检测到玩家的操作,显卡会立即恢复之前的高性能运行状态。也就是说,Radeon Chill的原理是降低操作间隙时的帧数,而保持有操作时的帧数,这样在无形中降低了显卡功耗,又不影响玩家的操作体验。

Radeon Chill功能设置在AMD驱动设置中,玩家需要依次点击全局设置——全局WattMan——Chill,打开全局开关,之后便可以开启Radeon Chill,只要你所玩的游戏支持该功能。在该功能发布之初,共有18款游戏支持该功能,但遗憾的是Radeon Chill目前只能支持DX9和DX11游戏,想要在DX12游戏中使用该功能还需要AMD后期的升级。

Radeon ReLive功能介绍

Radeon ReLive的主要功能是屏幕录制,开启后可以录制高清流畅的游戏画面,但对硬件性能的影响很小。官方测试在开启录制功能后,游戏帧数只下降3-4%,对于喜欢分享游戏画面以及直播玩家来说该功能非常实用。通过一个易于访问的游戏工具栏,玩家可以无缝播放ReLive录制内容,并且快速方便地自定义设置,自定义场景布局等等。

Radeon FreeSync 2技术介绍

AMD于今年年初正式推出了FreeSync 2技术,不过它跟FreeSync相比并不是替代的关系,而是会与FreeSync并存,因为二者的技术出发点并不一样。FreeSync的目的是消除游戏画面撕裂、卡顿,保证流畅性,FreeSync 2则主要是加入了对HDR10渲染显示的支持,可以让普通显示器也获得HDR高清效果,而且支持在SDR/HDR两种模式间自动切换。该技术可以让显示器获得相比于sRGB色域超过2倍的亮度和色彩表现力,并且支持即插即用、低帧率补偿,延迟还非常低。FreeSync 2同前一代相比增加了渐进式刷新率递增功能,使得帧数率平滑增加或减少,提供更平滑的最终用户体验。

蓝宝石RX 580超白金限量版拆解

由于我们测试使用的是蓝宝石 RX 580 8G D5 超白金 OC 限量版这款显卡,因此我们对这款卡进行了拆解。

显卡风扇设计

蓝宝石 RX 580 超白金 OC 限量版显卡拥有两枚9.5cm直径的双滚珠静音轴承风扇,双滚珠轴承有效减少运动时的磨损,静音运行的同时使用寿命得到了大幅提升。重新设计的翼型叶片提升进风量同时有效降低风噪。第三代IFC风扇智能启停技术,允许用户自定义风扇启停的温度档位,在全方位营造通风散热环境的同时,还能找到散热与噪音间的平衡点,适合DIY玩家们的入手。

可更换蓝光LED风扇

蓝宝石 RX 580 超白金 OC 限量版显卡的风扇采用单螺丝固定的快拆设计,去掉一颗螺丝就能整个拆除,方便用户对风扇进行单独清洗维护。此次的限量版RX 580就附赠了两枚蓝光LED风扇,玩家可以根据自己的喜好更换风扇,让你的显卡更炫更有个性。

散热模块设计

蓝宝石 RX 580 超白金 OC 限量版显卡采用2根8mm热管+2根6mm热管,搭配大面积纯铜底座和高密度散热鳍片,为显卡带来良好的散热效果。另外,显存和供电的散热整合到散热模块中,并附有导热贴,为显卡带来全方位的散热。

显卡背板设计

蓝宝石 RX 580 超白金 OC 限量版显卡拥有一块全金属背板,背板不仅可以起到装饰作用,更能有效保护PCB免受外力伤害。背板上的不规则形状导气孔可以有效排出热量,搭配NITRO Free Flow定向导流技术,可有效减少显卡积热产生的高温。

显卡PCB设计

蓝宝石 RX 580 超白金 OC 限量版显卡采用比公版更长更大的PCB设计,面积更大的PCB可以容纳更多电器元件。全新的超白金系列显卡采用了效能更强的第四代黑钻电感,拥有相比普通电感高25%的电磁转换效率以及低10%的运行温度。电感在线圈内部内置了散热片,可有效的抑制高频啸叫。另外,搭配寿命高达16000小时的16K全固态黑金电容,给予显卡更高的运行稳定性。

显卡核心

蓝宝石 RX 580 超白金 OC 限量版显卡采用了14nm FinFET工艺打造,基于GCN4.0架构的Polaris 20核心,外观看上去和Polaris 10一样。

显卡供电设计

蓝宝石 RX 580 超白金 OC 限量版显卡采用6+1相供电设计,可以为显卡提供充足的电量,充足的电量供应是显卡性能的保证,更是显卡超频实力的体现。

显卡供电接口设计

考虑到高频下稳定工作以及超频的需要,蓝宝石 RX 580 超白金 OC 限量版显卡配备的是8+6pin供电,不同于公版的8pin设计,能够为显卡额外提供75w的电力,而且卡口朝向PCB背面,方便电源线插拔。

视频接口设计

蓝宝石 RX 580 超白金 OC 限量版显卡为玩家提供2*DP+2*HDMI+DVI的全接口组合,能够保证兼容目前市面上大部分显示器的同时也能够满足需要多屏幕输出的玩家的需求。另外,双HDMI接口的设计也是考虑到了兼容目前正流行的VR设备,方便VR玩家使用。

BIOS切换开关

蓝宝石 RX 580 超白金 OC 限量版显卡拥有一个开关,用来在2组BIOS间自由切换,一边是静音模式(1411MHz),另一边式游戏模式(1450MHz),满足玩家的不同需求。

信仰灯呼吸效果示意图

其他非公版产品赏析

蓝宝石 RX 580 超白金 OC

蓝宝石 RX 580 超白金 OC

蓝宝石 RX 580 超白金 OC

XFX讯景 RX 580 8G 深红

XFX讯景 RX 580 8G 深红

XFX讯景 RX 580 8G 深红

迪兰 RX 580 Red Devil

迪兰 RX 580 Red Devil

迪兰 RX 580 Red Devil

迪兰 RX 580 X-Serial

迪兰 RX 580 X-Serial

迪兰 RX 580 X-Serial

铭瑄 RX 580 JetStream 8G

铭瑄 RX 580 JetStream 8G

测试平台环境一览

为保证测试能够发挥显卡的最佳性能,本次测试平台采用全新7代酷睿芯——Intel酷睿i7-7700K处理器、华硕Z270芯片组主板、阿斯加特DDR4-2133 32GB双通道内存、安钛克1000w钛金电源组建而成。详细硬件规格如下表所示:

测 试 平 台 软 硬 件 配 置

核心配件

CPUIntel酷睿i7-7700K
主板华硕ROG MAXIMUS XI APEX
核芯显卡IntelHD 630
内存阿斯加特LEORICE DDR4-2133 32GB x2
硬盘浦科特PX-512M6S+
电源安钛克HCP 白金版-1000
系统及驱动程序

操作系统Microsoft Windows 10
主板驱动Intel芯片组驱动
显卡驱动NVIDIA GeForce Game Ready Driver(381.65 WHQL)AMD Radeon Software Crimson ReLive(17.10 Press Beta)
DirectX环境DirectX 12
帧数监控Fraps 3.5.1

参测主板:华硕 ROG MAXIMUS IX APEX

参测N卡:微星 GTX 1060 GAMING X 6G

在测试成绩方面,理论性能测试用得分来衡量性能,数值越高越好;游戏性能测试用游戏自带Benchmark及游戏中平均帧数来衡量性能,数值同样越高越好。

理论性能测试:3DMark FireStrike

首先进行的是用来衡量显卡理论DX11性能的3DMark FireStrike测试,选择模式为Extreme,对应的是2K分辨率,测试结果如下:

3DMark FSE GPU成绩

在3DMark FireStrike Extreme测试中,RX 580表现不错,得分超过顶级非公版GTX 1060约200分,超过RX 480约12%,性能提升较为明显。接下来我们测试一下该卡的理论DX12性能,使用的是3DMark Time Spy,对应的同样是2K分辨率,结果如下:

3DMark TS GPU成绩

在3DMark Time Spy测试中,RX 580的GPU得分依旧稍稍超过GTX 1060,超过RX 480约10%。最后我们来测试一下显卡的VR性能,使用的是SteamVR Performance Test,测试结果如下:

SteamVR保真度结果

在VR性能测试中,三款卡都达到了VR Ready的级别,但RX 580照比GTX 1060还是有一定的差距,保真度低了1.3,差不多是15%,而照比RX 480则是有着7%以上的提高。

综上所述,RX 580的DX11和DX12性能均稍稍领先GTX 1060,但VR性能还是差了一些。同RX 480相比,RX 580的提升还是比较全面的,理论性能平均提升幅度为10%左右,符合以往升级版之于初版显卡的提升水平。当然,理论性能只是一方面,接下来我们就进行重头戏游戏测试,看看RX 580又会有着怎样的表现。

DX12游戏性能测试

在游戏性能测试环节,我们选取了4款DX12游戏和4款DX11游戏进行测试,测试分辨率为1080p和2K。在测试中关闭垂直同步,选用适当的抗锯齿和特效,用游戏内自带benchmark或Fraps记录下平均帧数,首先是DX12游戏的测试,结果如下:

《杀出重围:人类分裂》帧数对比

在《杀出重围:人类分裂》的测试中,RX 580技压群雄,领先GTX 1060约13%,领先RX 480约10%(领先幅度结果为2个分辨率下领先幅度之和除以2得出的值)。

《杀手6》帧数对比

从《杀手6》的测试结果可以看出,RX 580继续保持领先,领先GTX 1060约5%,领先RX 480约8%。该游戏此前一直对A卡优化较好,但后期对N卡也进行了全面的优化,AN卡可谓是优势相当,再加上我们使用的是顶级非公版GTX 1060,这就导致RX 480稍稍落后于GTX 1060。

《古墓丽影:崛起》帧数对比

在《古墓丽影:崛起》的测试中,RX 580继续领先,但领先对手的幅度有所缩减,领先GTX 1060约2%,领先RX 480约10%。

《战锤:全面战争》帧数对比

最后是《战锤:全面战争》的测试,测试中RX 580领先GTX 1060约6%,领先RX 480约4%,优势不是很明显。

总结一下,在DX12游戏测试中,RX 580在各项游戏中的表现都是最好的,领先GTX 1060约7%,领先RX 480约8%。如果说RX 480与GTX 1060比是各有千秋的话,RX 580则是毫无疑问的完胜,哪怕优势体现在帧数上仅仅是2-3帧。

DX11游戏性能测试

测试完三款卡的DX12游戏性能,我们再来看一下它们在DX11游戏中的表现,最终测试结果如下:

《全境封锁》帧数对比

首先是《全境封锁》的游戏帧数对比,从结果可以看出,RX 580全面领先其余两款显卡,领先GTX 1060约6%,领先RX 480约10%。

《孤岛惊魂:原始杀戮》帧数对比

接下来是《孤岛惊魂:原始杀戮》的游戏帧数对比,从结果可以看出,RX 580终于出现了落后GTX 1060的情况,在1080p下落后后者约4%,但在2K下还是稍稍领先。此外,RX 580领先RX 480约11%,领先较为明显。

《幽灵行动:荒野》帧数对比

《幽灵行动:荒野》是刚刚发布的硬件杀手级大作,所以我适当降低了特效,将特效设置为“高”。从结果可以看出,RX 580依旧领先,超过GTX 1060约2%,超过RX 480约8%。

《守望先锋》帧数对比

最后是《守望先锋》的帧数对比,我们可以看出,即使RX 580照比RX 480有了约8%的提升,其还是落后于GTX 1060,落后幅度约为6%。由于暴雪的游戏一向对N卡优化较好,所以RX 580落后GTX 1060也算是意料之内的事。

双卡交火性能测试

测试过单卡后我们该来测试双卡交火的性能了,大家都知道,A卡的交火效率一向很高,犹记得RX 480首发时其双卡交火表现甚至可以在某些项目中胜过GTX 1080,所以这次吉吉我也是非常好奇两块RX 580能够达到怎样的效果。由于篇幅和时间所限,我们选择的测试项目只是3DMark FireStrike以及3DMark Time Spy,测试结果如下图:

3DMark FSE GPU分数为12656分

3DMark TS GPU分数为8590分

我们此次交火所用的两块卡分别是蓝宝石 RX 580 超白金 OC 限量版以及XFX讯景 RX 580 深红,两者的核心频率均为1450MHz。通过结果可以看出,RX 580 CF的FSE得分为RX 580单卡的1.93倍,TS得分为单卡的1.94倍,提升非常明显。

RX 580双卡交火性能对比

通过测试结果可以看出,RX 580 CF的成绩仅仅落后GTX 1080 Ti约7.5%,但领先GTX 1080有20.5%!两块RX 580的价格不超过4000元,其性能与同等价位的GTX 1080比超出了20%,与价格5700元的GTX 1080 Ti比落后不到10%,可见单从理论性能看,RX 580的双卡平台是非常有性价比的。

显卡功耗及温度测试

温度方面我们将继续采用FurMark来进行测试,考虑到不同游戏之中,显卡的负载率不同,尤其是低分辨率和高分辨率的负载率差异会让显卡的功耗完全无法测算平均数值。因此我们需要采用Furmark这样的权威性烤机软件,让GPU芯片之中每一个运算单元完全满载,充分发挥供电最大化的状态才能得出准确的成绩。

显卡烤机温度为76℃

满载温度方面我们是采用Furamrk拷机,让显卡达到满载状态,然后根据GPU-Z显示的数值来测量温度。我们将参数设定为1280*1024分辨率,开启8*MSAA。烤机30分钟以上,最终显卡的满载温度为76℃,最终核心频率稳定在1450MHz,未出现降频状况。

参测显卡温度对比

由于我们此次使用的三款卡均为非公版显卡,因此烤机温度仅供参考。从图上可以看出,GTX 1060的表现最为良好,烤机温度不过66℃,RX 480的温度照比RX 580要低一些,虽然RX 580的散热要强于RX 480,但RX 580的芯片发热量远大于RX 480,因此温度还是要高一些的。

各卡功耗对比

待机功耗方面,所有参测显卡所在平台的功耗均在50w左右,这说明在空载状态下,参测显卡的耗电程度是差不多的;而满载平台功耗方面,由于TDP的不同,呈现出了明显的差异。首先,RX 580、RX 480和GTX 1060的TDP分别为185W、150W和120W,测试结果显示RX 580的功耗比RX 480高37W左右,比GTX 1060高63W左右,基本符合各卡对应的TDP差距值。

是时候升级你的显卡了

通过上面的测试可以发现,RX 580的确是目前2000元左右游戏性能最强的显卡,稍稍领先于对手家的GTX 1060,但领先幅度仅为5-7%左右。与第一代Polaris RX 480相比,其有着8-10%的性能提升,相当于提升了一个性能级,表现还是不错的。从游戏帧数来看,RX 580已经可以在几乎所有大作中做到1080p下特效全开,除了一些优化成问题的显卡杀手级游戏,而且在2K分辨率下也可以达到45帧以上这样一个较为流畅的帧数,因此对于那些喜爱单机游戏的普通玩家来说,一块RX 580已经足够满足你的需求了。

2000元价位极致性能之选

不过我相信一定会有玩家吐槽,就10%左右的性能提升,我为什么要买RX 580?就这个问题我来简单说明下:首先,RX 580的针对人群是那些还在使用GTX 960或R9 380这样的老甜点卡的人,因为研究显示,显卡的生命周期为一年半,就以R9 380为例,其在2015年完全可以应付市面上大多数游戏,但换到今天,绝大多数游戏大作的入门要求都是RX 480或RX 470了,R9 380的性能显然已经跟不上时代的脚步了。

有82%的GPU达不到VR Ready的需求

除此之外,从2016年开始,VR全面爆发,而VR Ready的入门需求就是RX 470或GTX 1060 3G,老一代的R9 380和GTX 960显然达不到运行VR应用的最低要求,因此对于那些用着老甜点但还想使用VR设备的玩家来说,升级到RX 580是非常有必要的。再有就是新技术的使用,如4K实时串流、HDR、单线5K输出等,这些都是全新的Polaris显卡才具备的特性,要想体验只能升级显卡。

许多新特性只有新卡才能支持

优点显而易见,但缺点也是不容忽视的,RX 580最大的缺点就是功耗太高,185W的TDP都快赶上NVIDIA旗舰级的GTX 1080了,但性能照比后者却有着近50%的差距,那么为什么同样是1x nm,N卡能做到频率远超A卡,TDP却要小于后者?其实这正是由于工艺不同所导致的。NVIDIA除GTX 1050/1050 Ti外,使用的都是台积电的16nm FinFET工艺,而AMD这边由于订不到货,用的是三星的14nm FinFET。虽然三星的制程看似更低,但其14nm无论良率还是效能均不及台积电的16nm工艺,其导致的结果就是Polaris家族的频率一直没能超过1.5GHz,但Pascal则可以自动超频至近2GHz。

全新进化的Polaris家族

虽然TDP增长了35W,但好在各AIB厂商均对散热进行了强化,因此温度上并没有高很多,甚至有的显卡照比RX 480还有所降低,所以玩家在实际使用时并不会觉得很受影响。除了RX 580外,AMD还同时发布了RX 570、RX 560以及RX 550,前两款显卡不用多说,就是RX 470和RX 460 1024sp的升级版,而RX 550则是采用全新的Polaris小核心,流处理器数量为512个,面向网吧等入门级市场,其照比上代的R7 250有着2倍的性能提升,是入门级产品中的亮眼新秀。

专为玩家打造

从综合指标来看,RX 580和GTX 1060是相当的,前者的优点是游戏性能稍强、价格稍低,缺点是功耗温度较高、VR性能稍弱,后者则正好相反,因此两者可以说是不相上下。正如我们前面说的,RX 580只是Vega发布前的预热前菜,由于刚刚升级了架构和制程,AMD不可能在不到一年的时间里做到既能调教好Vega,又能让RX 500照比RX 400有个大升级,所以RX 580诞生的最大意义就是取代性能上与GTX 1060相当的RX 480,哪怕只是比对手强了一点点,还是可以让那些执着于性能,却选择困难的玩家们有个明确的目标,这也恰恰是AMD多年来的一贯作风。