AMD不愧为农企,八核推土机连英特尔四核i5都干不过
- ZetaGundam简单解释下:
AMD的推土机的一个模块可以类似的看过2个ALU(整数运算单元)+一个FPU(浮点运算单元,共享),但是ALU和FPU都源自K8以来的架构,虽然2个ALU可以同步运行,但是依赖编译器的优化支持,在目前环境下,单线程也就是能用上一个ALU+FPU而已,那么比不上INTEL很正常。
INTEL的超线程,实际是在利用超长的流水线,PD的超线程悲剧的原因是分支预测太差,导致超线程发挥不了威力,但是单纯论性能,INTEL的ALU+FPU还是比AMD彪悍不少的。这方面AMD一直就没超越过。
当年K8虐PD的原因主要就是因为这个该死的分支预测,一旦发现预测错误,就必须把流水线清空从上一个分支重新来过,你性能再好,重来的次数多了,你的外观性能表现依然悲剧(重来的耗时是可观的)。 - Kevin22cn单比CPU运算解码什么的,很多项目还是超过了的,比综合性能的话,在内存控制器等方面差距不小,所以会落后,你仔细研究一下各种评测,看看具体在哪些方面落后就知道了
- jehutymoon文字游戏
- 沙悟净@蓝领PD没超线程的,你弄错了。
第一代超线程:奔四、奔四EE
第二代超线程:酷睿i系列(备注:桌面版的i5的超线程被阉割了)
intel的超线程是是完全共享的,运算单元、缓存之类的每个核心只有1个,超线程的目的是利用闲置的运算单元和缓存,仅仅增加了3%的晶体管电路,这与推土机不同的 - 沙悟净@蓝领是的,其他没列出来的项目有些是超过了一点点,一点点性能,换来的是大幅上升的功耗,依然是完败
- Pombii我在想,要不要把990FX出掉呢……
- ZetaGundamhttp://www.pcpop.com/doc/0/674/674977_all.shtml
泡泡的技术文,算是写的比较明白的。
实际就是ALU和FPU没有改进,靠改进大结构,结果就是没有优化过的程序编译器,当前的应用程序在这个CPU上跑依然是悲剧。 - abcdrl1100T降价吧,降到3位数
- 沙悟净@蓝领SMT超线程并没有增加APU、FPU之类的运算单元,这与推土机不同的
- 沙悟净@蓝领990FX芯片组?
- 沙悟净@蓝领AMD和各级渠道商都要层层啃利润的
- Pombii等了半天的推土机,出来还不如I7啊……这样真不如换I平台了
- Kevin22cn很简单,你把推土机的模块看成是超线程额外加一个ALU算术运算单元就行了,这个ALU只占整个核心20%的面积不到,1个模块<1.2个核心,4个模块不到4.8个核心,成本就增加了这么一点点,AMD的工艺一直都比Intel的差,功耗本来就比较高的,不过大部分时候你不会8线程满载,所以那个最大功率知道就好了
- 赫敏那啥,肥龙的晶体管和面积起码可以和同代intel差不多,功耗也不错,然后堆规模。推土机。。。。哇塞直接来个2 billion,315mm,是snb2倍多,(不算snb的集显的话3倍了),功耗也高50%,直奔安腾而去了
- 赫敏就冲你这个一个模块等于intel一个核心就该打脸*/-93
- 沙悟净@蓝领额,学到了,另外,既然它每个模块都有2个线程,当CPU所有8个线程跑满时,ALU都利用到了吧?
- ZetaGundam那你来解释一下?
- 赫敏前端4 Fetch/decode/issue被你无视了。虽然没有明确指出,但推土机肯定又是个超长流水线,但分支没改善,在极度依赖分支的测试中败于1100t(单线程)
按照原先计划推土机本来是超长流水线,比k10要高30%频率的。但没做出来。可能大雷的GF 32nm工艺导致了延期+频率和功耗的双重悲剧 - ZetaGundam其实AMD的一个模块不是在所有时刻都能执行两个线程的,因为两个ALU共享一个FPU,共享一套缓存。
比较完美的情况是编译后的代码把一个任务的整数计算部分可以拆分成2个对等的计算线程交给2个ALU运行,然后合并ALU的计算结果再交给FPU计算浮点部分。不过这种编译器也太浮云了。 - iMARS那真八核什么时候出呀?!*/-18
- 沙悟净@蓝领感觉AMD SB了,既然拿不出像样的编译器,何必折腾呢?
- ZetaGundam多指令发射这种东西严重依赖编译器优化,考虑到AMD一直以来的瘸腿走路,你把一个模块当1个核心看也没多大问题*/-19
我个人更倾向于把推土机看做一个缩小规模异类化的CELL。 - ZetaGundam既然最后都要拉出来,那何必吃饭呢?*/-19
- 沙悟净@蓝领你误解我了,我的意思是,既然没有编译器,AMD就别搞一些异想天开的异性结构了,事事该向INTEL看齐
- 赫敏amd这种对两个核心轮流发射的做法看来还是比较惧怕传统的wide issue或者wide execution,才做出这种奇怪的设计(或者SMT实现遇到问题?)。毕竟这种设计现在来讲完全没看出什么好处(按and的说法是省晶体管,可现在的情况是2Billion,已经傲视所有桌面cpu直奔安腾而去了),而sparc的CMT设计是从中受益了,核心数很多但晶体管数目并不夸张
- ZetaGundam咱想问题能不这么简单么?事事向INTEL看齐,那还玩个屁啊。
- ZetaGundam所以,软硬不分家,特别是走异形结构的,更依赖软件的优化。
SPARC这种RISC结构当然更适合CELL类模式。
关键还是CISC指令集的问题。
AMD现在的问题已经不是简单的指令集优化了,已经需要操作系统的进程/线程调度优化了。 - 沙悟净@蓝领拿不出像样的编译器,又处处异想天开搞些异性结构,铁定只能玩屁。。。。。。
- 沙悟净@蓝领就算推土机是4核心,I5 2500K也是四核心,3.6GHz推土机干不过3.3GHz i5 2500K,这也不光彩吧,i5还阉割了超线程
- ZetaGundam那是正常结果,ALU和FPU没啥改进,这种结果很正常。
- ZetaGundam关键是要MS家支持。
- 沙悟净@蓝领既然异形结构依赖软件的优化,而AMD没有能力优化软件,何必折腾呢?
- ZetaGundam因为WINTEL联盟已经不玩了。
- 沙悟净@蓝领。。。。。。。。。作为新一代的产品,也丢脸吧
- ZetaGundam优化到位了还是会有显著提升,问题就是AMD能说动多少家给他做优化了。
- 沙悟净@蓝领没人优化=不优化
- 脑袋没有了开核B55 表示很开心
- 七口白水2500K 无压力路过
- DiamondBall都是换件那么勤快的玩家
就算后期优化跟上了,这U也造就扔了吧 - 沙悟净@蓝领9494
- dilbret*/-27早在半年前既煙幕果真是真的*/-27
- Bolvai5 2500k如果是垃圾u
何必分带k不带k呢! - 沙悟净@蓝领i5 2500k与i5 2500默认的频率性能一样!带k不锁倍频方便超频,另外带K为了提升超频性能,不支持vt-d和txt虚拟化技术,集成的核芯显卡不一样,其他参数完全一样的。
- 沙悟净@蓝领晕死,你以为k=快啊?
- fokker2518挖地虎不行捏
- louisaihuang嗯嗯。。米错!
- 沙悟净@蓝领你胆子大,不怕跨省?*/-21
- 银魂八心八箭,有木有啊!*/-93
- dragonrabbit真的么。。。