تراشه هوش مصنوعی Positron با قدرت بیشتر از انویدیا H200 و مصرف کمتر انرژی

«اطلس» از Positron AI، رقیبی جدی برای انویدیا.

72 خواندن این مطلب 1 دقیقه زمان میبرد

شرکت آمریکایی Positron AI اعلام کرده تراشه شتاب‌دهنده «اطلس» در عملیات استنتاج عملکردی بهتر از H200 دارد و ۳۳ درصد انرژی کمتری مصرف می‌کند.

به گزارش Tom’s Hardware، شرکت Positron که در سال ۲۰۲۳ تأسیس شده است، شتاب‌دهنده‌های هوش مصنوعی خود را با تمرکز ویژه بر بهینه‌سازی عملیات استنتاج توسعه می‌دهد. برخلاف پردازنده‌های گرافیکی که علاوه بر استنتاج، برای آموزش مدل‌ها و انجام محاسبات متنوع طراحی شده‌اند، سخت‌افزار Positron از ابتدا برای اجرای سریع‌تر و مصرف انرژی کمتر در عملیات استنتاج ساخته شده است.

Positron AI قوی‌تر و کارآمدتر از H200

راهکار نسل اول Positron برای مدل‌های بزرگ ترنسفورمر، «اطلس» نام دارد. این سیستم شامل ۸ شتاب‌دهنده «Archer» است و با هدف رقابت با سیستم‌های مبتنی بر معماری Hopper انویدیا طراحی شده، در حالی که تنها بخشی از انرژی آن‌ها را مصرف می‌کند.

بر اساس گزارش‌ها، سامانه «اطلس» شرکت Positron AI قادر است در مدل Llama 3.1 با مصرف حدود ۲۰۰۰ وات، ۸ میلیارد پارامتر و استفاده از محاسبات BF16، حدود ۲۸۰ توکن در ثانیه برای هر کاربر تولید کند. در مقابل، سرور انویدیا DGX H200 با پیکربندی ۸ کارت گرافیک و مصرف ۵۹۰۰ وات، تنها حدود ۱۸۰ توکن در ثانیه برای هر کاربر ارائه می‌دهد. این مقایسه توسط خود شرکت Positron AI انجام شده است.

ادعا می‌شود که شتاب‌دهنده «اطلس» از نظر عملکرد به ازای وات (performance-per-watt) و بهره‌وری هزینه، در مقایسه با سیستم DGX H200 انویدیا، تقریباً سه برابر بهره‌وری بالاتری دارد. البته این ادعا باید توسط یک مرجع ثالث مورد تأیید قرار گیرد.

شرکت Positron AI سخت‌افزار ASIC خود را با استفاده از فناوری ساخت N4 یا N5 در کارخانه شماره ۲۱ شرکت TSMC در آریزونا تولید می‌کند و کارت‌ها نیز در داخل ایالات متحده مونتاژ می‌شوند. با این حال، از آنجا که این تراشه‌ها با ۳۲ گیگابایت حافظه HBM ترکیب شده‌اند و از فناوری بسته‌بندی پیشرفته بهره می‌برند، احتمالاً بخشی از فرآیند مونتاژ در تایوان انجام شده است.

منبع: دیجیاتو

آقای قناعتمرداد ۸, ۱۴۰۴

72 خواندن این مطلب 1 دقیقه زمان میبرد