AMD不愧为农企,八核推土机连英特尔四核i5都干不过

  • Z
    ZetaGundam
    简单解释下:
    AMD的推土机的一个模块可以类似的看过2个ALU(整数运算单元)+一个FPU(浮点运算单元,共享),但是ALU和FPU都源自K8以来的架构,虽然2个ALU可以同步运行,但是依赖编译器的优化支持,在目前环境下,单线程也就是能用上一个ALU+FPU而已,那么比不上INTEL很正常。
    INTEL的超线程,实际是在利用超长的流水线,PD的超线程悲剧的原因是分支预测太差,导致超线程发挥不了威力,但是单纯论性能,INTEL的ALU+FPU还是比AMD彪悍不少的。这方面AMD一直就没超越过。
    当年K8虐PD的原因主要就是因为这个该死的分支预测,一旦发现预测错误,就必须把流水线清空从上一个分支重新来过,你性能再好,重来的次数多了,你的外观性能表现依然悲剧(重来的耗时是可观的)。
  • K
    Kevin22cn
    单比CPU运算解码什么的,很多项目还是超过了的,比综合性能的话,在内存控制器等方面差距不小,所以会落后,你仔细研究一下各种评测,看看具体在哪些方面落后就知道了
  • j
    jehutymoon
    文字游戏
  • 沙悟净@蓝领
    PD没超线程的,你弄错了。
    第一代超线程:奔四、奔四EE
    第二代超线程:酷睿i系列(备注:桌面版的i5的超线程被阉割了)

    intel的超线程是是完全共享的,运算单元、缓存之类的每个核心只有1个,超线程的目的是利用闲置的运算单元和缓存,仅仅增加了3%的晶体管电路,这与推土机不同的
  • 沙悟净@蓝领
    是的,其他没列出来的项目有些是超过了一点点,一点点性能,换来的是大幅上升的功耗,依然是完败
  • P
    Pombii
    我在想,要不要把990FX出掉呢……
  • Z
    ZetaGundam
    http://www.pcpop.com/doc/0/674/674977_all.shtml
    泡泡的技术文,算是写的比较明白的。
    实际就是ALU和FPU没有改进,靠改进大结构,结果就是没有优化过的程序编译器,当前的应用程序在这个CPU上跑依然是悲剧。
  • a
    abcdrl
    1100T降价吧,降到3位数
  • 沙悟净@蓝领
    SMT超线程并没有增加APU、FPU之类的运算单元,这与推土机不同的
  • 沙悟净@蓝领
    990FX芯片组?
  • 沙悟净@蓝领
    AMD和各级渠道商都要层层啃利润的
  • P
    Pombii
    等了半天的推土机,出来还不如I7啊……这样真不如换I平台了
  • K
    Kevin22cn
    很简单,你把推土机的模块看成是超线程额外加一个ALU算术运算单元就行了,这个ALU只占整个核心20%的面积不到,1个模块<1.2个核心,4个模块不到4.8个核心,成本就增加了这么一点点,AMD的工艺一直都比Intel的差,功耗本来就比较高的,不过大部分时候你不会8线程满载,所以那个最大功率知道就好了
  • 赫敏
    那啥,肥龙的晶体管和面积起码可以和同代intel差不多,功耗也不错,然后堆规模。推土机。。。。哇塞直接来个2 billion,315mm,是snb2倍多,(不算snb的集显的话3倍了),功耗也高50%,直奔安腾而去了
  • 赫敏
    就冲你这个一个模块等于intel一个核心就该打脸*/-93
  • 沙悟净@蓝领
    额,学到了,另外,既然它每个模块都有2个线程,当CPU所有8个线程跑满时,ALU都利用到了吧?
  • Z
    ZetaGundam
    那你来解释一下?
  • 赫敏
    前端4 Fetch/decode/issue被你无视了。虽然没有明确指出,但推土机肯定又是个超长流水线,但分支没改善,在极度依赖分支的测试中败于1100t(单线程)

    按照原先计划推土机本来是超长流水线,比k10要高30%频率的。但没做出来。可能大雷的GF 32nm工艺导致了延期+频率和功耗的双重悲剧
  • Z
    ZetaGundam
    其实AMD的一个模块不是在所有时刻都能执行两个线程的,因为两个ALU共享一个FPU,共享一套缓存。
    比较完美的情况是编译后的代码把一个任务的整数计算部分可以拆分成2个对等的计算线程交给2个ALU运行,然后合并ALU的计算结果再交给FPU计算浮点部分。不过这种编译器也太浮云了。
  • i
    iMARS
    那真八核什么时候出呀?!*/-18
  • 沙悟净@蓝领
    感觉AMD SB了,既然拿不出像样的编译器,何必折腾呢?
  • Z
    ZetaGundam
    多指令发射这种东西严重依赖编译器优化,考虑到AMD一直以来的瘸腿走路,你把一个模块当1个核心看也没多大问题*/-19
    我个人更倾向于把推土机看做一个缩小规模异类化的CELL。
  • Z
    ZetaGundam
    既然最后都要拉出来,那何必吃饭呢?*/-19
  • 沙悟净@蓝领
    你误解我了,我的意思是,既然没有编译器,AMD就别搞一些异想天开的异性结构了,事事该向INTEL看齐
  • 赫敏
    amd这种对两个核心轮流发射的做法看来还是比较惧怕传统的wide issue或者wide execution,才做出这种奇怪的设计(或者SMT实现遇到问题?)。毕竟这种设计现在来讲完全没看出什么好处(按and的说法是省晶体管,可现在的情况是2Billion,已经傲视所有桌面cpu直奔安腾而去了),而sparc的CMT设计是从中受益了,核心数很多但晶体管数目并不夸张
  • Z
    ZetaGundam
    咱想问题能不这么简单么?事事向INTEL看齐,那还玩个屁啊。
  • Z
    ZetaGundam
    所以,软硬不分家,特别是走异形结构的,更依赖软件的优化。
    SPARC这种RISC结构当然更适合CELL类模式。
    关键还是CISC指令集的问题。
    AMD现在的问题已经不是简单的指令集优化了,已经需要操作系统的进程/线程调度优化了。
  • 沙悟净@蓝领
    拿不出像样的编译器,又处处异想天开搞些异性结构,铁定只能玩屁。。。。。。
  • 沙悟净@蓝领
    就算推土机是4核心,I5 2500K也是四核心,3.6GHz推土机干不过3.3GHz i5 2500K,这也不光彩吧,i5还阉割了超线程
  • Z
    ZetaGundam
    那是正常结果,ALU和FPU没啥改进,这种结果很正常。
  • Z
    ZetaGundam
    关键是要MS家支持。
  • 沙悟净@蓝领
    既然异形结构依赖软件的优化,而AMD没有能力优化软件,何必折腾呢?
  • Z
    ZetaGundam
    因为WINTEL联盟已经不玩了。
  • 沙悟净@蓝领
    。。。。。。。。。作为新一代的产品,也丢脸吧
  • Z
    ZetaGundam
    优化到位了还是会有显著提升,问题就是AMD能说动多少家给他做优化了。
  • 沙悟净@蓝领
    没人优化=不优化
  • 脑袋没有了
    开核B55 表示很开心
  • 七口白水
    2500K 无压力路过
  • D
    DiamondBall
    都是换件那么勤快的玩家

    就算后期优化跟上了,这U也造就扔了吧
  • 沙悟净@蓝领
    9494
  • d
    dilbret
    */-27早在半年前既煙幕果真是真的*/-27
  • B
    Bolva
    i5 2500k如果是垃圾u

    何必分带k不带k呢!
  • 沙悟净@蓝领
    i5 2500k与i5 2500默认的频率性能一样!带k不锁倍频方便超频,另外带K为了提升超频性能,不支持vt-d和txt虚拟化技术,集成的核芯显卡不一样,其他参数完全一样的。
  • 沙悟净@蓝领
    晕死,你以为k=快啊?
  • f
    fokker2518
    挖地虎不行捏
  • l
    louisaihuang
    嗯嗯。。米错!
  • 沙悟净@蓝领
    你胆子大,不怕跨省?*/-21
  • 银魂
    八心八箭,有木有啊!*/-93
  • d
    dragonrabbit
    真的么。。。