近期,B站知名UP主“雖然但是張黑黑”發(fā)布了一段引人注目的視頻,視頻內容聚焦于蘋果最新推出的滿血版M3 Ultra芯片在高性能計算領域的卓越表現。該UP主通過一系列測試,展示了M3 Ultra在運行大型AI模型時的驚人速度,甚至在某些場景下超越了使用8張NVIDIA A100顯卡的配置。
測試中,M3 Ultra被用于運行擁有6710億參數的DeepSeek R1模型。在GGUF格式下,雖然M3 Ultra的速度略低于8張A100顯卡,達到了15.78 Tokens/s,但當切換至更能發(fā)揮其統(tǒng)一內存優(yōu)勢的MLX格式時,M3 Ultra的速度飆升至19.17 Tokens/s,成功反超了A100顯卡的組合。在DeepSeek V3模型的測試中,M3 Ultra同樣展現出了出色的性能,速度高達19.66 Tokens/s。
值得注意的是,這次測試中使用的滿血版M3 Ultra搭載在Mac Studio上,僅需一臺機器就能實現如此強大的性能,這無疑大大提升了其性價比。據透露,這款配備512GB統(tǒng)一內存的M3 Ultra總價為74249元人民幣,相比之下,8張A100顯卡的成本則要高得多。
然而,盡管M3 Ultra在某些場景下表現出色,但它并非無所不能。在單用戶進行單一模型推理時,由于主要依賴內存帶寬和容量,A100顯卡的性能仍然非常強勁,其潛力并未被完全釋放。而在多用戶推理和大模型訓練等更為復雜的場景下,M3 Ultra則顯得力不從心,無法與A100相提并論。
盡管如此,M3 Ultra的出色表現仍然引起了業(yè)界的廣泛關注。隨著技術的不斷進步和應用的日益廣泛,高性能計算領域對于芯片性能的要求也越來越高。蘋果此次推出的M3 Ultra芯片,無疑為這一領域帶來了新的選擇和可能性。