TG Telegram Group Link
Channel: Luv‘s Desk
Back to Bottom
今年还有个很有意思的看点就是 AMX. 非 Pro 的 P-AMX 差不多还是一个 P 核心的大小, 但是 Pro/Max 的 AMX 部分跟两个核差不多了, 而且 Max 这边 AMX 延伸的部分左边类似 Pro, 右边下半部分就完全不一样.
很多人觉得 M3 Pro 是这代最尴尬的一款,缩了大核数量和位宽。
但从现在的角度看,M1/2 Pro 其实是 Max Lite,即砍掉了下半部分的GPU/SLC/MC/ME/NE的Max。
但是 M3 Pro 不是,M3 Pro 就像 M123,是独立的设计,不再是 Max 布局上的缩减版。
而之所以 Pro 变成 6P,其实是因为这代苹果的 P Cluster 就是 6C;而M3的 4P 就是在 6P 硬裁得到,更不用说 M3 缩减了Display 到两块、SSD PCIe IO 到两条、GPU 规模就只有一半,SLC 也小得可怜。
关于 M3 Pro 降低位宽的问题, 多少跟这代 Cache Prefetch 有关系,原来的 SLC 缓存机制只能缓存最频繁访问部分,虽然这部分能被充分加速,但缓存全命中就意味着这部分运行的时候,内存带宽没跑满,而其他workload就会缓存命中率低,被内存带宽卡脖子;新的分配/Prefetch机制其实就让各阶段workload都能命中,同时保持内存带宽的利用。
但是实现这个机制需要 SLC 部分增加不少 Logic 和 SRAM,放在老工艺上 Logic 太大,放 A17 Pro 上的话,本身因为面积较大结构复杂,在手机上收益不如直接做更大 SLC。
这就是为什么 M3 系列要上 N3B。
当然 N3B 带来的问题就是单个 wafer 更贵且良率降低,所以M3/M3Pro 都必须精打细算,因此 M3 Pro 砍掉了点位宽(内存控制器很吃管子,如果访存带宽瓶颈不大的话其实多了没啥用),砍掉了点 SSD IO(毕竟 Pro 机型上 8T 的不多),砍掉了些 Media/Display,加上原来 Pro用的 Max 的底子里面有很多给双芯预留的数据通路,上面这些通通不要之后,M3 Pro 晶体管数量才出现了下降。才让 M3 Pro 成本可控,不至于出现加价(当然丐版、满血版有些指标提升对比上代确实有限)
还有个问题就是,M3 Pro CPU多核心性能提升确实不大,GPU 部分除了光追,多一个 CU+更好的缓存机制也不足以相比 M2 Pro 根本性进步。价格也维持原来水平,这算是比较核心的槽点。
但 M3 Pro 的封装面积比 M2 Pro 小20%,加上少一个内存通道其实能显著降低待机耗电,也许 M3 Pro 未来会上 iMac 27 或者是 MacBook Air 15。6P+6E 能打得过对应位的 6P+8E/8xZen4.
至于 M3 Max 还是老布局,空间利用非常低效,靠着暴力屏蔽 1/6 P-Core 和 1/4 GPU/MC/SLC 的方式来保证良率,但间接性的搞出了新的 Max Lite。当然 12P+4E 的规格能够有效和 Intel 的 8P+8E 对抗,包括干高通 Elite X(elite x 的 GB6 靠着浮点刷了很多分,而以前很多浮点生产力任务都被 GPU/NPU 取代了)。
当然 Max 的价格就贵了很多,但这个规格加上 128GB 满血带宽,如果真的干大光追工程/AI interference,还真找不到对位的竞争对手,Elite X 要 dGPU 也是有些莫名其妙。
这么一看高通的 Oryon 堆料都集中在浮点上了, 浮点子项目领先 20%, 但跑到 4.3Ghz 整数部分不如 4Ghz 的 M3, 目测 M3 Pro 满血版的多核性能就有望反超 Elite X, 单核的话 Pro/Max 得益于更大 SLC/稍微鸡血点频率超回去问题也不大.
这两天到手很多 USB-C 直插的配件, 发现普遍都没法兼容 Fine Woven Case 的厚度, 插进去触点没通.
算是验证了之前说 Lightning 强度高的优势. 毕竟当初 iPad 很多壳子非常厚(比如原厂的硅胶壳, Case+Cover 直接跟本体一样重了), 但 Pencil 公头做得很长, 所以还能充上电. 关键做得长的前提, 还真的是 Lightning 强度够高. 更不用说需要线才能充电的山寨比和 Pencil 青春版了.
尽管 USB-C 公头也能做长, 但越长, 可靠性就越不如 Lightning.
以及手头一些 Full Speed 的 3.1gen2 的端子外壳已经踩在了全包壳的尺寸极限了, 还是微软当初 950XL 那根全功能线, USB-IF 毕竟不是做产品、搞体验的, 不会像 MFi 那样考虑得周全.
这两天的震撼:
某位朋友的 iPhone 8 256G 一直用到今年, 还没换过电池(虽然续航已经不太行了)
前同事的 iPhone 8 到今天才换…
M2 Max 发布:
群众: 才提升 10-20% ,挤牙膏, 苹果芯片不行了
M3 Max
群众A: 又提升 10-20%, 才九个月, 给苹果当韭菜了
群众B: 又才提升 10-20%, 要被高通打败了

东西还是一样的东西, 但是消费的叙述可以两极分化.
经常发现有种 N 卡爱好者尬吹 RTX NK 系列的「Quardo 专业卡驱动」, 特别是尬吹这类卡 NX 性能甩开 4090, 在这基础上还能 NVLink.
但问题是隔壁 A 卡早就放开游戏卡的某些 OpenGL 加速了, 而这种「专业」应用的话, 哪怕是中端的 RX6700 都绰绰有余了, 搞 NVLink 跑 NX 这是给老黄上 IQ Tax.
也不想想看老黄干掉 Quardo 的品牌, 就是因为买这类卡的用户, 都转向了没那么偏工业的设计创意公司, 需求更多是 OptiX 渲染视频这样原来非常吃时间的应用.
以及就是这类传统「专业」用户总是某名奇妙的优越感, 好像自家专业软件特别娇贵所以需要专业卡专业驱动, 但实际上几个用得多的专业软件早就用了新的 API 利用性能.
从某种程度上说, 某些万年卡在 OpenGL 库的软件, 本身就是性能需求没那么强、产能和性能没那么挂钩的行业.
这些人看不起剪视频, 但没想过自媒体的产能瓶颈一半在电脑上, 一方面对电脑性能考察的范围全面(CPU/GPU, 媒体引擎, 甚至是存储容量/seq性能, 内存容量, NPU 对超分、追踪的加速), 性能好增加产能 or 降低成本, 就是实在的经济效益; 另外一方面就是工作流跑得顺, 这同样对产能, 或者说工作体验有着直观帮助, 像跨设备剪切板这样的东西基本还是留在 Mac.
所以说自媒体老师吹 Mac 基本都是知行合一, 这玩意就是用起来不仅舒服还有经济效益, 而且这行不限制背景, 就是要能学能分享; 机械行业虽然有空间, 但产能瓶颈显然不在电脑上, 个人发展更多也看机械用在哪个领域, 最后还不是工地工厂设计院给配啥基本就用啥.
这两天稍微研究了下 Apple Silicon 平台的 DRAM 和 NAND, 发现苹果对这两块定制的东西非常多, 根本不是懂哥所谓「都是芯片厂采购的」.
DRAM 方面主要是 A/S 系芯片采用了 InFO-PoP, 所以丝印都是 Apple LOGO, 中间也有额外的定制硅片消除台阶效应, 这样的工艺下基本不存在内存重焊的问题, 最佳的信号完整性也降低了 SoC 的 PHY 驱动力要求, 节约芯片面积的同时还省电; 而安卓这边 SoC 主要都是传统 PoP 封装, 很多厂的封装都有台阶问题(就 SoC Package 比 DRAM 大), 整体厚度是 A 系芯片的两倍, 优势在于芯片厂可以按需搭配不同 RAM, 2*4*24gb 的 24GB 皇帝版就是这么来的, 但代价是越大就越厚/不省电, 更不用说 888/8gen1 时代 SoC 过热导致的 PMIC/WiFi/DRAM 焊接出现的问题. M 系列就是 MoP, 特色在于 64bit 宽的 Package 超级小. 主要靠 4-8 层的封装+先进 DRAM Die 来堆厚度, 而需要堆内存容量的 Max 系列则相对强化了 PHY 驱动力(哪怕 M2 Max M2 Pro 看起来类似, 但 M2 Pro 的 PHY 有所缩水, 导致只能用 64bit 单颗 8GB 内存, 封顶容量 32G), 从而让 M3 Max 实现在不牺牲延迟、带宽和功耗的情况下, 以极小的封装弄进了 128GB 内存. 我认为苹果之所以加容量更贵, 除了定制封装带来的额外成本(别人都是通用 32bit module, 甚至是 64bit 手机 module, 出货量大所以便宜), 此外就是芯片 PHY 体质问题, 导致不是所有芯片都适合上 8 层 die 的 DRAM 颗粒.
NAND 方面的话, S 系列的 NAND Die 直接和 DRAM Die/AP 封在了一起, 有点 eMCP 的味道, 最小化了面积, 估计 S 芯片内部就有 ONFI/DDR 的实现; 而 A/M 系 SoC 内置了 ANS2(Apple NAND Storage 2)存储控制器, 也就是常说的 SSD 主控; 苹果的 NAND 不是常见的 ONFI/DDR, 里面还有封装了一片叫做 MSP(Memory Singal Processor)的信号协议转换/次级控制器芯片, 运行苹果自己的 RTKit 实时系统固件, 用于兼容各家 NAND, 转换成统一的 PCIe 协议和 SoC 连接. 而 PCIe 协议的好处就是差分传输/纠错能力很强, 带来更好的信号完整性, 能在 PCB 上走线很远, 因此在 Mac 上能让 NAND 靠近进风口的位置散热, 在持续读写中控制温度.
关于 Vision Pro 的重量和续航算是又见到一堆懂哥出来跳了, 进去一看就是 MKBHD 吐槽重量的信息源+官网 600-650g 的整机重量+对玻璃/铝合金重量近乎刻板印象的认知; 要知道其他头显基本也是 500-600g 的整机重量, 而一个很矛盾的点在于, 要想佩戴体验兼具舒适+稳定, 那头带系统必然要做得comprehensive, Quest 3 的破布条虽然不重、但是不怎么稳定. 苹果的方案极为激进, Single band 佩戴简单的原因就是只比用户的实际头稍微大了一点点, 保证弹性刚刚好; dual band 的稳定性和兼容性会更好, 但代价是丑+戴起来要麻烦些.
更何况实际佩戴感受并不是重量这一个维度, quest3 比 2 更重但是更舒服, 原因在于薄了. Vision Pro 目前看起来整体厚度控制的非常激进, 个人觉得除了背后有根线会碍事些, 整体佩戴方面的综合水平其实是比 quest 3 更高的(原版轻但是简陋、 精英稳定但是复杂、不方便躺). 更何况这是系列的第一款产品, 后续瞳距调节/显示组件肯定有升级空间, 包括未来单 SoC 化也只是时间问题.
至于续航的话, 很多人其实都不知道 Quest 3 的「平均续航」水分极大, 即 VST 场景只有一个半小时, 所谓的2hr+全靠非 VST 场景拉高. Vision Pro 官方的这个 2hr 场景是叠加了 VST 和具体的 use case, 加上外接电池支持 passthrough/magsafe 可以实现电池快速更换,比 quest 3 玩1-2小时然后直接熄火的体验用过都会喷; PICO 的后置电池方案也不适合于靠沙发的体验.
当然现阶段不推荐购买的原因很多, 比如没中文输入法、购买麻烦、首发溢价、专门适配的软件还有待普及、只有传统游戏生态, 说句难听话就是, 如果你现在没有 quest3/55 寸以上的 OLED/分区背光/miniLED 电视, 也没 Netflix/TV+ 追剧的习惯, 也没开发需求, 然后直接上去掏 3-4W 买 Vision Pro, 除非已经是数字游民不方便买大件, 不然评价就是纯纯跟风.
真的感兴趣的话, 目测首发评测也很难看出啥来(目测只允许 720P 录屏, 更何况录屏只是视野裁切一小部分), 建议还是有偿体验朋友的, 看看 NF/双杜比片源, 体验一把「山猪吃不来细糠」.
M3 MacBook Air 终于支持外接双显示器了, 之前降价到 250 的 elgato mini(被改成了 wero 包装) 可以说瞬间变得有意义, 因为靠着雷电3实现了 DP 1.4和 HDMI 2.0 同时输出, C 口也是 5G 速率, 网卡甚至是 PCIe 的接口.
https://m.tb.cn/h.5FGTD4v
HTML Embed Code:
2024/06/09 21:07:32
Back to Top