极客中国网
您所在的位置:极客中国网 > 资讯 >

又一颗芯片,要吊打英伟达

发布时间:2025-07-29 11:34:00     来源:证券之星     阅读量:6049   

公众号记得加星标,第一时间看推送不会错过。 近年来,围绕着下一代人工智能的竞争正在涌现新的战线,而处于核心地位的是一家名为PositronAI的初创公司,其雄心勃勃的计划正在半导体行业引起广...

公众号记得加星标,第一时间看推送不会错过。

近年来,围绕着下一代人工智能的竞争正在涌现新的战线,而处于核心地位的是一家名为 Positron AI 的初创公司,其雄心勃勃的计划正在半导体行业引起广泛关注。随着各大公司争相控制人工智能系统不断飙升的能源需求,Positron 和少数几家挑战者押注,截然不同的芯片架构可能会削弱英伟达等行业巨头的控制力,并重塑人工智能硬件格局。

Positron 日前宣布,公司已经完成超额认购的5160万美元A轮融资,,使其今年的融资总额超过7500万美元。这笔新资金将支持Positron AI第一代产品 Atlas 的持续部署,并加速其第二代产品在 2026 年的推出。

Positron AI 首席执行官 Mitesh Agrawal 表示:“我们创立 Positron 是为了满足现代人工智能的需求:旨在以最低的单位tokens生成成本和最高内存容量运行前沿模型。我们高度优化的芯片和内存架构允许在单个系统中运行超级智能,我们的目标是每个系统运行多达 16 万亿个参数的模型,这些模型包含数千万个上下文长度的tokens,或内存密集型视频生成模型。”

Positron AI是谁?

Positron AI由首席技术官 Thomas Sohmers 和首席科学家 Edward Kmett 于 2023 年共同创立,前 Lambda 首席运营官 Mitesh Agrawal 加入担任首席执行官,以扩大公司的商业运营规模。在短短 18 个月内,该团队仅用 1250 万美元的种子资金就将 Atlas 推向市场。在完成 A 轮融资之前,他们验证了产品性能,获得了早期企业客户,并在部署环境中完善了产品。

现在,随着采用率的不断提高和产品路线图的清晰,Positron AI正在开发定制 ASIC,以解锁推理的更高水平的性能、功率效率和部署规模。

据该公司在领英介绍。Positron AI为企业和研究团队提供了供应商自由度和更快的推理速度,允许他们使用专为生成式语言模型 和大型语言模型 全新设计的硬件和软件。Positron AI凭借更低的功耗和大幅降低的总体拥有成本 (TCO),让您能够运行热门的开源 LLM,以高tokens率和长上下文长度为多用户提供服务。Positron AI还在设计自己的 ASIC,以将推理和微调功能扩展到支持训练和其他并行计算工作负载。

该公司团队表示,其创立 Positron AI的初衷很简单:通过最佳性价比和功耗比的生成式 AI 推理系统,让每个人都能拥有超级智能。

据Positron AI所说,我们花了足够多的夜晚来应对臃肿的 GPU,深知必须做出改变。GPU是一个很好的起点——但长期的 Nvidia 短缺、巨大的功耗和内存瓶颈正在扼杀我们大规模有效部署 Transformer 模型的能力。

“我们厌倦了眼睁睁地看着计算周期因 GPU 效率低下而消失。因此,我们决定自己动手,创建了专门用于高效运行 Transformer 推理工作负载的方案。”Positron AI团队介绍。如他们所说,其方案具备以下特征:

  • 内存带宽利用率超过 90%;

  • 每个推理机架的功耗降低 66%;

  • 不再受供应商锁定或 GPU 短缺的困扰。

PositronAI的第一代产品 Atlas 现已上市,我们很高兴地宣布,Positron 的第二代产品将于 2026 年上市。Positron致力于最大限度地提升 Terachip 的内存带宽和内存容量。

先用FPGA打开局面

相关资料显示,在该公司成立仅 18 个月后就一直在向客户交付其基于 FPGA 的 LLM 推理系统。今年年初,他们也向其二级 CSP 客户交付了首批价值数百万美元的订单系统。

据该公司CEO Sohmers 所说,目前另有 20 家潜在客户正在直接或远程评估 Positron 基于 FPGA 的 AI 设备 Atlas。Positron 的客户包括运行本地或主机托管基础设施的企业,以及二级云服务提供商 。

Sohmers 补充道:“我们进行的大部分对话,尤其是关于更大规模部署的对话,都是与那些本身就是 CSP 的公司或提供大规模网络服务的公司进行的。”

“当我们创立 Positron 时,我们专注于只有两件事很重要:从基于 Nvidia 的系统获得完全无缝的体验,而我们看到许多 AI 芯片初创公司的失败点是他们花了太长时间和太多时间才进入市场,”Sohmers 表示,并指出虽然该公司正在开发自己的 AI 推理加速器 ASIC,但其第一代和第二代 Atlas 系统都是基于 FPGA 的。

他说,FPGA 无法提供 GPU 或 ASIC 解决方案的 FLOPS,但它们具有其他优势。Sohmers 表示,公司的设备基于 Altera 的 Agilex-7M FPGA,配备 32GB HBM。

“在我们完全确定产品与市场契合之前,我们不想在构建 ASIC 上投入大量的时间和金钱,”Sohmers 说道。“虽然其他 AI 芯片公司各自都有独特的问题,但它们都存在产品与市场契合的问题,尤其是在第一代设备上。采用 FPGA 使我们能够进行非常快速的迭代,并在客户参与的情况下启动迭代。”

据报道,Positron AI 的 Atlas 以 2000 瓦的功耗搭配 BF16 计算能力运行 Llama 3.1 8B ,可实现每位用户每秒约 280 个tokens的交付。而根据 Positron AI 自己进行的比较,在相同场景下,8 路 Nvidia DGX H200 服务器每位用户每秒仅能交付约 180 个tokens,同时功耗高达 5900 瓦。这意味着 Atlas 的每瓦性能和每美元性能比是 Nvidia DGX H200 系统的三倍。当然,此说法需要第三方验证。

当前版本的 Atlas 是一个 4U 系统,在 PCIe 卡上使用四块 FPGA。它被设计为一款交钥匙设备,可以零步骤从 HuggingFace 或客户专有模型中提取二进制文件。

下一代平台将采用 Positron 的定制模块尺寸,将四 FPGA 系统缩小至 2U 空间,并显著扩展 DDR 内存。

按照Positron AI所说,公司团队之所以能实现如此高的内存带宽利用率,关键在于其核心 IP;Sohmers 表示,为了最大限度地提高矩阵乘法 阵列及其连接内存的互连密度,Positron 的工作层级低于 Altera 的 Quartus 工具。Positron 的初始原型基于上一代搭载 HBM 的 Stratix 器件,实现了理论峰值内存带宽的 65% 至 70%。但升级到 Agilex 意味着团队可以利用 Altera 全新的强化 Fabric NoC(片上网络),该 NoC 旨在支持 FPGA 存储器之间的快速传输,而无需依赖芯片其他可编程逻辑资源所使用的通道。新的 NoC 拥有从 HBM 到可编程逻辑阵列中任意位置的 SRAM 块的专用路径。

下一代产品:ASIC

前面有讲到,Positron AI 的下一代产品是ASIC 硬件。据了解,该芯片将在台积电位于亚利桑那州的 Fab 21 工厂生产的,而且这些卡也在美国组装,这使得它们几乎完全是美国制造的。不过,由于该 ASIC 配备了 32GB HBM 内存,它采用了先进的封装技术,因此很可能是在台湾组装的。

Sohmers 表示:“LPDDR 5X 和 6 能够以每 GB 成本的四分之一获得比 HBM 更高的容量。封装将采用常规的有机基板,这将大幅降低产品成本。”

他表示,虽然 LPDDR 的速度不如 HBM,但使用 Positron 的 IP 来接近理论峰值内存带宽足以弥补这一缺陷。Positron 还可以直接控制 DDR 上的内存刷新,这使得该公司能够比 HBM 更接近理论峰值性能,而无需承担 HBM 带来的功耗或成本开销。

随着竞争日趋激烈,分析师警告称,单靠提高芯片效率不足以应对AI工作负载的爆炸式增长。从历史上看,硬件性能的提升很快就会被新的用例和日益强大的模型所吞噬。

尽管如此,凭借新的资金、主要客户的关注以及高度专注的设计,Positron 已将自己定位于关于 AI 基础设施未来的关键辩论的中心。它能否兑现承诺,将决定未来几年世界如何构建、驱动和支付 AI 的费用。

今天是《半导体行业观察》为您分享的第4109期内容,欢迎关注。

加星标第一时间看推送,小号防走丢

求推荐

声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多企业信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。投资有风险,需谨慎。

猜你喜欢
凯迪拉克纯电LYRIQ锐歌:价格调整,37.97万元起,优惠抵扣高达2万元!
凯迪拉克纯电LYRIQ锐歌:价格调整,37.97万元起,优惠抵扣高
7月10日消息,凯迪拉克最新纯电动车型LYRIQ锐歌进行了价格和权益的调整。根据官方发布的信息,LYRIQ锐歌的起售价为37.97万元,并提供了多项购车优惠。此次调整的活动时间为7月10日至8月31日,期间下定可享受2000元抵扣2万元或3......
2023-07-07 12:26:00
东风风神发布全新SUV皓瀚,搭载马赫电混技术,刷新续航表现
东风风神发布全新SUV皓瀚,搭载马赫电混技术,刷新续航表现
7月10日消息,东风风神汽车正式发布了其最新款SUV车型——皓瀚,并开始接受预订。此次发布的车型名为“快舟-皓瀚号”,宛如一艘快速航行的太空飞船。与此同时,东风风神还宣布了一项重大的科技突破——快舟一号甲固体运载火箭即将进行首次发射。根据东......
2023-07-07 12:26:00
LYRIQ锐歌价格大降6万元!上汽通用凯迪拉克推出多项优惠政策
LYRIQ锐歌价格大降6万元!上汽通用凯迪拉克推出多项优惠政策
7月10日消息,上汽通用凯迪拉克对其旗下纯电车型LYRIQ锐歌进行了全面的价格和优惠政策调整,为消费者提供了更具吸引力的购车条件。首先,LYRIQ锐歌的价格调整方案已经正式推出。根据最新调整,锐歌的售价区间定格在37.97万元到41.97万......
2023-07-07 12:17:00
泰国暹罗汽车集团与中国汽车制造商洽谈高端电动汽车合作
泰国暹罗汽车集团与中国汽车制造商洽谈高端电动汽车合作
7月10日消息,泰国暹罗汽车集团副总裁SebastienDupuy在最近的一次采访中透露,该公司正在与几家中国汽车制造商就潜在的合作关系进行谈判,重点关注的领域是高端电动汽车。泰国投资促进委员会(BOI)秘书长纳里特(NaritTherds......
2023-07-07 12:17:00
吉利发布全新博越L荣耀版,智能配置升级!
吉利发布全新博越L荣耀版,智能配置升级!
7月10日消息,吉利近日发布了全新博越L荣耀版的上市消息,标价12.87万元,优惠价11.87万元。据ITBEAR科技资讯了解,这款全新博越L荣耀版在过去的六月份销量达到了10028辆,持续八个月销量突破万辆,如今荣耀版的发布更是给人一种冠......
2023-07-07 12:16:00
聚焦WAICSoul展示智能对话机器人“AI苟蛋”助力AI与兴趣社交融合
聚焦WAICSoul展示智能对话机器人“AI苟蛋”助力AI与兴趣社
7月6日-8日,主题为“智联世界,生成未来”的第六届世界人工智能大会在上海举办。据悉,今年的世界人工智能大会参展企业数量、展览面积均创历届之最,集中展现了人工智能领域创新应用落地的突破性成果。SoulApp作为社交领域代表受邀参加本次大会,......
2023-07-07 10:36:00
10家上市车企销量揭晓:理想汽车称霸榜首
10家上市车企销量揭晓:理想汽车称霸榜首
07月10日消息,车企们纷纷公布了2023年上半年的销量成绩单。根据最新数据显示,10家上市车企中,理想汽车以最高的销量完成率脱颖而出。据ITBEAR科技资讯了解,根据中国乘用车市场数据的初步统计,2023年6月,乘用车市场零售量达到了18......
2023-07-05 14:52:00
Windows 365消费者版本:云端桌面服务迎来个人用户时代
Windows 365消费者版本:云端桌面服务迎来个人用户时代
7月10日消息,微软计划推出适用于个人用户的Windows365消费者版本,以满足用户对云服务的需求。根据WindowsLatest的报道,该消费者版本预计将比商业版和企业版更为便宜,并可能在秋季正式推出。Windows365是微软提供的云......
2023-07-05 13:55:00