10年前就困扰我的问题

  • X
    Xininye
    CPU 为啥不能超过做到10GHz
    SRAM 为啥不能取代DRAM, 非要整个L1 ,L2
    RAM 为啥不能做到CPU中
    集显为啥不能比独显牛
    显存为啥不能和运存合体
  • 似水无痕
    因为小和热
  • l
    lotus163
    cpu为啥只能用硅
    为啥不用铝,这样散热多快?
  • p
    pas_dts
    散热,散热,散热,散热,散热
  • 年轻气盛
    统一几个字回复你: 制造工艺
  • X
    Xininye
    20年间,从55n米 发展到现在的7n米制程, 只用在了核心数和架构复杂性上, 而从未消除外部总线的时延瓶颈,这让人感觉到匪夷所思
  • k
    karluka
    不差钱的话没啥不可以 iOS fly ~
  • X
    Xininye
    WINTEL害人不浅,固守城池
  • w
    wuketidai
    边际成本递增,边际效益递减
  • X
    Xininye
    是的,一个体系的形成,就算到达瓶颈,也没办法推翻,所有IBM 诺基亚 倒下了
  • j
    jiangzhongchina
    给你500亿造个10g的3nm的CPU呗
  • s
    shaokn
    x86把一堆乱七八糟的东西堆在一起,
  • g
    gj91
    1.高频一方面对工艺有要求,另一方面也比多核费电,7nm假设能上10g,估计也得给CPU准备一个1200w电源,愿意吗?
    2.sram又贵又发热,4g sram卖2000一条,肯买吗?(估计没那么便宜的4g sram)
    3.把内存塞进CPU里核心年纪得多大,一片晶元上能出几十个CPU?一不小心报废一半,CPU成本要堆到5000+,肯买吗?
    4.同上,把itx1660塞进CPU里,核心面积得多大?成本…
    5.显存和内存的数据格式好像不那么一样,显存应该是按块存取的,估计对通用数据来说效率没那么高,而且gddr比ddr贵吧,还是钱
    综合起来,楼主这些想法应该能把电脑价格推上5万一台了,还附赠电暖气,不过不用担心太热,毕竟电表可以改装成风扇吹吹…
  • k
    karluka
    首先,LZ没有提3nm这个要求。
    我想表达的意思是,成本对工业界是个很重要的因素,如果不计代价和功耗等,按现在的工艺,LZ说的很多都能够实现。
    而且,你给的钱也太少了。iOS fly ~
  • X
    Xininye
    谢谢你的认真回帖,M1的发布让我对沉睡已久的PC发展的热情有了一点点的期待。
    借着这个话题,讨论下PC发展是不是陷入困局?半导体芯片制造工艺不断翻倍的更新制程,但换来的性能提升还是挤牙膏的感觉。

    粗略了解CPU发展和工作原理的人应该知道,CPU工作频率和电压和功耗成正比,工作频率越高,核心电压必须也得高,不然晶体管开关压差太小很难克服量子隧穿问题,但工作电压高意味着功耗也就会高。

    这么些年,CPU为啥要用DRAM , SRAM(静态存储器)需要6个晶体管才能存储1BIT, 所以还是成本的问题,就像T固体硬盘从SLC 和MLC 到现在的QLC , 工艺再进化也没有降低成本来的重要,市场是价格决定走向。

    IBM 最初制定的PC 架构, CPU + RAM + 外部IO总线 +扩展总线这种模式,是为了兼容性和扩展性, 本身不是系统性能最优化的设计。


    LZ 作为复杂指令集的支持者,也坚定不移认为CISC是执行效率最高的方式, 总所周知,CPU 运算除了最简单的加减乘除和逻辑运算,大部分时间都是在MOV数据,从内存搬运到寄存器,从外存搬运到内存,从内存搬运到显卡设备,到声卡设备等等。 CPU 的指令丰富性决定了执行效率,精简指令很多操作都需要反复执行重复的指令,而一个时钟周期一般只做一个指令的执行,就像一个工厂分工越细效率应该更高才对,所以一直支持CISC。

    但WINTEL 坚持的兼容机路线,让外部数据交换成为了最大的瓶颈, CPU大部分时间都是在等,等硬盘响应,等内存相应,等显卡总线响应。外部内存总线PCIE总线,sata总线布局在电路板上,总线速度不能做的太高,信号线路电磁干扰问题难以克服。所以为什么不把它们进行整合,缩短总线直接的距离,降低延时瓶颈提高系统性能,苹果M1都用了5nm整合了160亿晶体管,而INTEL 最新的U还在14nm 不到几十亿晶体管。

    所以觉得,WINTEL阵营是不是这些年有点固步自封了? 完全不用改变软件系统生态的事情都很难进步。
  • g
    gj91
    回复16#Xininye

    我感觉m1性能牛逼一个很重要的前提就是要接受soc里可以包含各种加速器的设定…

    例如一个CPU+gpu的组合(先不谈功耗的事,这是硬伤了),跑浮点的时候能不能让gpu来跑,剪辑视频的时候能不能默认图灵架构的gpu来编解码h.265视频?

    可能有人会觉得说比CPU性能你扯gpu干嘛,但苹果这个soc也明明就是一套各种u而不是CPU单打独斗(当然我也承认CPU部分的性能也很牛逼),如果能做到统一人均ryzen5 5500+rtx3050(主要是架构要新,要支持各种新的硬件加速特性,毕竟m1也是新平台),不存在a卡了,大家都支持cuda,CPU架构也统一起来,会不会整体效率也上一个台阶?

    我感觉很多时候的性能不均衡也有开发者没法针对有特长的硬件进行优化的原因,但大家都用特性统一的硬件本来就是伪命题,偏偏苹果能做到(大家都是今年发布的新gpu,这在PC上没有一个时代能实现吧?还有多少人的独显都解不动4k h.265),我觉得这个各建通天塔的现状也很阻碍PC的发展…
  • X
    Xininye
    对于PC CPU SOC 整合,晶圆DIE面积应该不是问题,不像移动设备内部寸土寸金苛刻要求。 感觉还是不愿破除现有框架架构,INTEL和AMD 达成不了公示,PC厂 和外设周边厂也不乐意响应改变。
    M1 的 整数浮点执行效率我表示存疑,毕竟主频不公布,这些操作实打实的需要计算单元和时钟频率有关,视频编解码器 现在都是独立硬解码器,最终还是看数据交换效率,就是解码器于运存之间的直接存取效率, X86阵营的视频编解码应该都是交给显卡厂商去做,想象一下,编解码视频几个G ,需要从CPU 内存,外部总线控制器,显卡,再到编解码器,编解码一组数据还要回传送到RAM , 这种周期损失和时间延时,通讯交易握手等等,就不能做到最优解。

    另外M1做视频剪辑是苹果自家的,软件 硬件 操作系统都可以做到最大优化减少过程浪费,肯定效率有保障,但传统的编码执行效率未必比WINTEL 的高频高功耗复杂指令系统优势。
  • y
    yanyi2000
    回复1#Xininye

    乔布斯不认识你,是他的损失。
  • 烂人村村民
    我记得就是发热和钱的问题
  • X
    Xininye
    原谅 我一楼有点调侃,危言耸听
    但感觉SOC 在未来X86阵营肯定得走,或者做出改变
    画了长图,希望INTEL AMD 英文达 微软采纳


  • z
    zhdphao
    为啥PC这么陈旧的系统结构,还没实现彻底的模块化积木化。