چرا نمی‌توانند برای اتریوم دستگاه ASIC بسازند؟

چرا نمی‌توانند برای اتریوم دستگاه ASIC بسازند؟

گمانه‌زنی‌ها درباره هزینه‌های طراحی سخت‌افزار و توسعه ماینرهای ای‌سیک الگوریتم‌های ProgPoW و Ethash همیشه با جمله‌ای این چنینی همراه است: به سازندگان اعتماد کنید، چرا که آنها در این کار تجربه دارند. حالا این کار گاهی تولید ماینرهای ای‌سیک‌ است و گاهی طراحی مدارهای مجتمع.

برای مخاطبی که شناخت او از کدنویسی بیشتر از اصطلاحات تخصصی مباحث حوزه الکترونیک مثل زمان صعود است، توضیح اینکه چرا صحبت‌های سازنده در مورد الگوریتم ProgPow به درد او نمی‌خورد، مفید خواهد بود. IfDefElse، یکی از تیم‌هایی است که بر روی الگوریتم ProgPoW کار می‌کند و در مقاله‌ای به تشریح چالش‌های ساخت ماینر برای اتریوم، رویکرد شرکت‌های مختلف در قبال این موضوع و هزینه‌ ساخت آن‌ها می‌پردازد تا نشان دهد که چرا ساخت دستگاه ASIC برای الگوریتم ProgPoW در عین امکان‌پذیر بودن، صرفه اقتصادی ندارد.

یک برنامه‌نویس می‌تواند در هر حوزه‌ای، از نوشتن اسکریپت‌ها تا نرم‌افزارهای آیفون و از سامانه‌های نهفته تا سیستم‌عامل ویندوز، ورود پیدا کند. ولی ساختن یک نرم‌افزار شما را به مسئول یا صاحب تیم برنامه‌نویسیِ بک‌اند اپ استور اپل یا بهره‌وری سیستم‌هایش تبدیل نخواهد کرد. همان‌طور که آماده کردن یک سیستم‌عاملِ بی‌درنگ (RTOS) شما را به یکی از مدیران مالی مایکروسافت بدل نمی‌کند.

البته منظور ما این نیست که طراح ویندوز یک برنامه‌نویس برتر است بلکه می‌گوییم که چنین پیشینه‌هایی ذهنی از مسائلی از این قبیل، در فهم موضوعات دیگر کمکی نخواهند کرد، مخصوصا حالا که بحث بر سر «صرفه جویی به مقیاس» (Economies of Scale) است.

بگذارید این موضوع را به یک مثال شرح دهیم: یک طراح سخت‌افزار می‌تواند از طراحی یک مدار مجتمع (IC) برای یک مسواک گرفته تا طراحی یک معماری سیلیکونی برای تجهیزات شبکه، فعالیت کند. مهندسی که ۱۰۰ هزار واحد مسواک را در ماه آماده می‌کند هیچ درکی از مفهوم صرفه‌جویی به مقیاس در خصوص مهندسِ شبکه‌ای که تعداد واحدهای آماده ارسال او ۱ میلیون واحد در ماه است، نخواهد داشت. به همین شکل، یک طراح ای‌سیک‌ِ ارزهای دیجیتال درک بسیار کمی از حوزه فعالیت یک طراح ای‌سیکِ کارت گرافیک دارد، چراکه این دو، صنایعی متفاوت عموما با ریشه‌های جغرافیایی متفاوت هستند.

Nvidia Polaris Die
تصویری از سطح دای تراشه پولاریس

البته یک نکته را نباید فراموش کرد و آن این است که برنامه‌نویسی و مهندسی هر دو یک مهارت محسوب می‌شوند؛ چنانچه شما در این زمینه‌ها به‌طور روزانه کار نکنید، در هر دو حیطه کسب دانش و توانایی عقب خواهید ماند. به همین دلیل است که یک تولید کننده ای‌سیک ارزهای دیجیتال در ورود به بازار الگوریتم SHA256d دچار مشکل خواهد شد، زیرا آن‌ها باید با مهندسینی رقابت کنند که شش سال جلوتر از او هستند.

مقالاتی مثل این اکثر اوقات از کمبود دانش سخت‌افزاری فعالان این حوزه سوءاستفاده می‌کنند. طراحی تجهیزات استخراج ارزهای دیجیتال صنعتی شدیداً نرم‌افزاری بوده و اکثر کارهای مهندسی سخت‌افزاری آن پشت درهای بسته و در شرکت‌های خصوصی انجام می‌شود.

ما در این صنعت بارها شاهد متخصصین بی‌تجربه‌ای بوده‌ایم که با تلاش بسیار سعی کرده‌اند مهندسان نرم‌افزار را نسبت به توانایی‌هایشان برای رسیدن به پیشرفت‌های اکوسیستم موجود قانع کنند. برای نمونه می‌تواند به نمونه‌هایی مثل مونرو، بیت کوین و زی کش اشاره کرد. واقعیت این است که چنین چالشی تاکنون ایجاد نشده است. طراحان هیچ‌گاه با سخت‌افزارهایی که توسط یک شرکت بزرگ با چندین دهه تجربه مهندسی ساخته شده باشند، در حال رقابت نبوده‌اند. واقعا فکر می‌کنید پردازنده‌ای که توسط بیت مین یا اینوسیلیکون ساخته شده باشد می‌توانند با اینتل یا AMD رقابت کند؟

صرفه جویی به مقیاس، چه درزمینهٔ هزینه و چه در زمینه تجربه، همیشه مسئله‌ای شایع و مهم بوده است.

استدلال‌های یک طراح مدار مجتمع

ICDesigne
الگوریتم ProgPow از نگاه یک طراح مدار مجتمع

پیش از اینکه مطلب را بخوانید، گفتن این نکته ضروری است که صحبت‌هایی که تفکیک شده‌اند، ادعاها و اظهاراتی هستند که در بخش «پاسخ» به آنها جواب خواهیم داد.

هش ریت، چه در ProgPow و چه در Ethash، توسط پهنای باند ذخیره‌سازی DRAM (حافظه تصادفی پویا) خارجی تعیین می‌شود.

پاسخ: خیر. هش ریت در الگوریتم ProgPow به دو عامل تعداد هسته‌ها و پهنای باند حافظه بستگی دارد و مغایرت‌های میان Ethash و ProgPow نیز به خاطر همین دلیل است:

مقایسه نرخ هش (AMD)
مقایسه نرخ هش (AMD)
مقایسه نرخ هش (Nvidia)
مقایسه نرخ هش (Nvidia)

همان‌طور که می‌بینید حافظه موردنیاز برای استخراج سودمندانه الگوریتم Ethash به طرز چشمگیری افزایش یافته است. این تقاضا برای حافظه‌هایی با پهنای باند بالا باعث تسریع توسعه حافظه‌های پرسرعت نسل بعد مثل GDDR6 و HMB2 شده است.

پاسخ: تمام این تقاضای گسترده برای حافظه‌های با پهنای باند بالا از Ethash با حجم بازار ۱۵ میلیارد دلاری‌اش نمی‌آیند، بلکه تنها بخشی از آن منسوب به استخراج است. عمده تقاضای آنها از جانب بازارهای اصلی نظیر کارت‌های گرافیک، هوش مصنوعی، ابررایانه‌ها، صنعت بازی‌سازی و FPGA ناشی می‌شود. تقاضای خرید تجهیزات استخراج قدرت آن را ندارد که بازارهای عظیمی مثل بازار ۱٫۲ تریلیون دلاری هوش مصنوعی، ۳۰ میلیارد دلاری بازی‌های کامپیوتری، ۳۵ میلیارد دلاری کنسول‌های بازی و ۲۹ میلیارد دلاری ابررایانه‌ها را تحت شعاع خود قرار دهد.

به دلیل تشابهات موجود بین الگوریتم‌ها و معماری ProgPow و Ethash، بر این عقیده هستم که ای‌سیک بعدی شرکت اینوسیلیکون (Innosilicon) الگوریتم ProgPow را هدف خواهد گرفت.

پاسخ: تنها تشابه بین این دو الگوریتم در میزان استفاده آن‌ها از DAG در حافظه خارج از هسته کارت گرافیک است. از دیدگاه محاسباتی، الگوریتم Ethash برای کار تنها به یک هسته ثابت Keccak_f1600 و یک عملیات پیمانه (Modulo Function) نیاز دارد. اما ProgPow احتیاج به قابلیتی دارد که بتواند ضمن اجرای یک توالی ۱۶ خطی درهمِ ریاضی به یک کش سطح یک (L1 Cache) با پهنای باند بالا هم دسترسی داشته باشد. طراحی یک هسته محاسباتی که توانایی اجرای توالی محاسباتی ProgPow را داشته باشد به‌طور حتم بسیار مشکل‌تر از پیاده‌سازی یک هش با کارکرد ثابت مثل Keccak خواهد بود.

درست است که هش ریت Ethash به‌طور چشمگیری به پهنای باند وابسته است. نکته مهم ProgPow این است که این الگوریتم برای اجرای توالی‌های تصادفی ریاضی هم به پهنای باند [بالای] حافظه و هم به محاسبات هسته وابسته است و این وجه تمایز بسیار پر اهمیت است.

هدف از اثبات کار، اثبات ریاضی [صرف] هزینه‌ها در زمینه سخت‌افزار و مصرف انرژی است. Ethash قابلیت این را نداشت که بخش بزرگی از هزینه سخت‌افزاری (موتور محاسباتی) را در اثبات ریاضی به خودش اختصاص دهد و به جای آن رابط‌های حافظه را در اختیار گرفت. به همین دلیل است که شما می‌توانستید ای‌سیکی بسازید که در آن قطعه‌ای که در محاسبات ریاضی کاربردی ندارد حذف شده باشد.

از آنجایی که کارت گرافیک، یک تراشه شتاب‌دهنده همه‌منظوره است که عملیات مربوط به طراحی، ساخت و آزمودن آن حدود ۱۲ ماه طول می‌کشد و برای این‌که بتوان از پوشش تمام سناریوهای محاسباتی توسط آن مطمئن شد باید شبیه‌سازی‌های سخت‌افزاری و توسعه‌های نرم‌افزاری زیادی روی آن انجام شود.

پاسخ: به زبان ساده الگوریتم ProgPow یعنی که تا جایی که می‌توان کلیات هزینه سخت‌افزار را کاهش داد. از آنجایی‌که بخش جدید این الگوریتم با هدف تخصیص سخت‌افزار محاسبه کننده این سناریوهای محاسباتی تا کوچک‌ترین واحدهای معماری آن ایجاد شده است، می‌توان گفت که ساخت یک ای‌سیک برای آن به زمانی بسیار بیشتر از سه تا چهار ماه احتیاج خواهد داشت.

هزینه طراحی یک سخت‌افزار ای‌سیک را از زبان سازنده آنها بخوانید
نمایی از یک کارت گرافیک انویدیا RTX ۲۰۸۰

سؤالی که اینجا باید به آن جواب داد این است که چرا عملیات ممیز شناور حذف‌شده است؟ دلیل آن ساده است: ممیزهای شناور (Floating Point) را نمی‌توان از یک تراشه به تراشه‌های دیگر منتقل کرد. تراشه‌های مختلف، موارد مرزی (Edge) مربوط به مقادیر خاص (INF، NaN و Deform) را از راه‌های متفاوتی حل می‌کنند. بزرگ‌ترین واگرایی در هنگام کار با نا اعداد (NaN) به وجود می‌آید که به‌طور طبیعی و هنگام استفاده ورودی‌های تصادفی پیش خواهد آمد. به نقل از توضیحات ویکی‌پدیا دراین‌باره:

اگر چندین ورودی مختلف نا عدد وجود داشته باشد بار مفید نا عدد باید شامل یکی از ورودی‌ها باشد و در این استاندارد مشخص نشده که کدام‌یک از آن‌ها باید انتخاب شود.

پاسخ: این یعنی اینکه برای استفاده از ممیزهای شناور، لازم است که هر عملیات ممیز شناور با یک دستور چک (if(is_special(val)) val= ۰.۰ check) جفت شود. بدیهی است که این دستور چک را می‌توان توسط خود سخت‌افزار هم انجام داد. کاری که برای یک ای‌سیک ارزهای دیجیتال بسیار سودمند خواهد بود.

حالا بگذارید ببینیم که هش ریت یا هش در ازای وات در کجای بحث ما قرار می‌گیرد.

هش ریت، مقیاس اندازه‌گیری هزینه انرژی است. تا وقتی‌که همه را با یک واحد اندازه‌گیری کنیم، واحد مصرف انرژی اهمیتی ندارد، یک ماینر همیشه حداکثر انرژی (هش ریت) ممکن را مصرف خواهد کرد. به صرفه بودن عملیات، به دلیل تغییر واحد سنجش از یک Ethash (با واحد کوچک‌تری مثل ژول) به یک ProgPow (واحد بزرگ‌تری مثل کالری)، تغییر نخواهد کرد. هش ریت کلی در واقع بیانگر هزینه اقتصادی کلی کار انجام‌شده توسط همه افراد برای تضمین امنیت شبکه است. تا هنگامی‌ که کار هر کس به طور منصفانه‌ای و با یک واحد اندازه‌گیری یکسان اندازه‌گیری شود، وضعیت برای یک ماینر معمولی تفاوتی نخواهد کرد.

یک تولیدکننده ای‌سیک با استفاده از بانک‌های کوچک‌تر GDDR6 می‌تواند ازنظر هزینه ساخت از کارت‌های گرافیک جلو بزند. با استفاده از ۱۶ تراشه ۴ گیگابایتی GDDR6 می‌توان با همان هزینه به یک پهنای باند دو برابری دست پیدا کرد.

در خصوص مزارع بزرگ استخراج، همیشه پای ProgPow وسط است؛ ما هم در جواب تکرار می‌کنیم که صرفه جویی به مقیاس یکی از واقعیت‌های زندگی است و همیشه وجود خواهد داشت.

هزینه طراحی یک سخت‌افزار ای‌سیک را از زبان سازنده آنها بخوانید

پاسخ: اول اینکه داشتن یک پهنای باند دو برابری محتاج محاسبات دو برابری هم هست. پس این یک مقیاس بندی خطی است و یک برتری محسوب نمی‌شود.

دو اینکه ما در حال حاضر تولیدکننده‌ای نداریم که خط تولید تراشه‌های ۴ گیگابایتی GDDR6 را آماده کرده باشد. شرکت میکرون (Micron) تنها تراشه‌های ۸ گیگابایتی و شرکت سامسونگ تنها تراشه‌های ۸ گیگابایتی و ۱۶ گیگابایتی تولید می‌کنند. فعلا ساخت اینترفیس ورودی و خروجی GDDR6 روی دای حافظه بسیار گران تمام می‌شود. در هر نسل، میزان فضای اشغال‌شده‌ی اینترفیس از دای در مقایسه با حافظه بیشتر می‌شود؛ چرا که سرعت طراحی PHY یا لایه فیزیکی کوچک تر نمی‌تواند با همان سرعت کوچک شدن سلول‌های حافظه در روند پردازش ، برابری کند. بازار حافظه توسط خریداران بزرگ مانند کنسول‌های بازی و کارت‌های گرافیک و در طی دوره های زمانی طولانی کنترل می‌شود که حافظه های پر ظرفیت تر را ترجیح می دهند. فروشنده‌های حافظه هم انگیزه‌ای برای ساختن قطعات ۴ گیگابیتیِ پر ریسکی که بازده میلیارد دلاری سالانه آنها را تضمین نمی کند، ندارند.

ماژول‌های زیادی در تراشه کارت گرافیک ۲۰۸۰ RTX وجود دارد که فضای زیادی از تراشه را خود اختصاص داده‌اند و هیچ کاربردی در الگوریتم ProgPow ندارند. ماژول‌هایی مثل PCIE، NVLINK، L2Cache، واحد سایه زنی ۳۰۷۲، ۶۴ واحد رندر خروجی و ۹۲ واحد نقشه‌برداری بافت و …

پاسخ: کارت ۲۰۸۰ RTX نمونه خوبی برای این بحث نیست. در سری RTX کمپانی انویدیا فضای بسیار زیادی از دای تراشه برای امکانات جدید آن مثل هسته‌های رهگیری پرتو (ray-tracing) در نظر گرفته‌شده است. ازآنجایی‌که الگوریتم ProgPow طوری طراحی شده است که بتواند با کارت‌های موجود هر دو شرکت Nvidia و AMD کار کند، نمی‌تواند از این امکانات جدید استفاده کند (زیرا کارت های AMD فاقد این هسته ها هستند). به همین دلیل مقایسه کارت‌های سری RX 5xx شرکت AMD با سری 1XXX شرکت Nvidia، مقایسه بهتری خواهد بود.

همان‌طور که قبلاً هم اشاره شد، بخش‌های از کارت گرافیک هستند که نمی‌توان آن‌ها را استفاده کرد. بخش‌هایی مثل واحدهای ممیز شناور منطقی، حافظه کش سطح ۲ و بخش‌های مختص پردازش‌های گرافیکی مثل کش های بافت (گرافیکی) و واحدهای رندر خروجی (ROP). بخشی که برای الگوریتم ProgPow بسیار حیاتی است و محاسبات وکتور در آنجا انجام می‌شود واحدهای سایه زنی هستند. یک ای‌سیک ارزهای دیجیتال علاوه بر این‌ها باید فضایی را هم برای تعبیه کارکردهای Keccak اضافه کند. ما تخمین می‌زنیم که فضای دای (سطح) تراشه‌ ای‌سیک الگوریتم ProgPow حدوداً ۳۰ درصد کوچک‌تر و میزان توان مصرفی آن در بهترین حالت تنها ۲۰ درصد از کارت گرافیک هم‌ ارز خود کمتر خواهد بود. درست است که بخش‌های غیرقابل استفاده روی دای کارت گرافیک فضای زیادی را هدر می‌رود، اما توان مصرفی آن‌ها بسیار کمتر است.

تراشه‌های کوچک در مقایسه با تراشه‌های بزرگ بازدهی بیشتری دارند.

پاسخ: این مسئله طوری مطرح شده که انگار در یک کلاس آموزشی چیپ سازی قدیمی حضور داریم. فرمول محاسبه بازدهی آن‌ها مربوط به مقاله سال ۲۰۰۶ است. یعنی در این میان ۱۳ سال نوآوری درزمینهٔ بازدهی و کنترل پروسه، نادیده گرفته شده است.

هزینه طراحی یک سخت‌افزار ای‌سیک را از زبان سازنده آنها بخوانید
چیپ گرافیکی پردازنده AMD

برای تراشه‌ای که تنها یک واحد عملکردی دارد، فضای کوچکتر دای بهره وری بهتری خواهد داشت. البته این موضوع درباره اکثر کارت گرافیک‌های امروزی صادق نیست. اجزای کارت گرافیک‌های امروزی دارای هزاران واحد هستند که در صورت نقص در عملکرد، نادیده گرفته می‌شوند و به شکل اختیاری قابل بازیابی هستند. تا زمانی که اندازه هر واحد قابل بازیابی کوچک باشد، بازدهی آن تراشه می‌تواند به همان اندازه، یا حتی بیشتر، از تراشه‌های کوچک‌تری باشد که بلاک‌های عملیاتی بیشتری دارند.

بیایید برای توضیح این مفهوم یک مثال عملی بزنیم:

  1. فرض کنید شما یک تراشه غول‌پیکر «الف» دارید که تمام سطح ویفر را اشغال کرده است. تراشه الف شما از ۱۰۰ هزار اجزای فرعی قابل بازیابی تشکیل‌شده است که برای کارکرد معمولی این تراشه باید تنها ۸۰ درصد آن‌ها بدون نقص کار کنند. اجزای فرعی معیوب در طول فرایند بازیابی به‌صورت کاربردی کنار گذاشته می‌شوند.
  2. حالا یک تراشه کوچک «ب» را در نظر بگیرید که تنها یک بلاک (واحد) کاربردی غیرقابل‌بازیابی دارد و اندازه‌اش آن‌قدر هست که ۱۰۰ هزار واحد را در همان ویفر جای بدهد. وجود تنها یک نقص در چنین تراشه‌ای به معنای ازکارافتادن کل تراشه خواهد بود.
  3. اگر شما دقیقاً ۲۰ هزار نقص را به‌طور مساوی در هر ویفر توزیع کنید، بازده تراشه غول‌پیکر الف شما ۱۰۰ درصد خواهد زیرا ۲۰ درصد بلاک‌های فرعی در روند بازیابی کنار گذاشته‌شده‌اند اما بازده تراشه کوچک ب تنها ۸۰ درصد خواهد بود زیرا برای آن هیچ بلاک قابل بازیابی پیش‌بینی‌نشده است.
تصویر یک دای کارت گرافیکی
تصویر یک دای کارت گرافیکی با تعداد زیادی از بلاک‌های فرعی قابل بازیابی

به این دلیل است که کارت‌های گرافیکی [تراشه‌های] مشابه زیادی وجود دارند که تعداد سایه زن های فعال آن‌ها با یکدیگر متفاوت است. برای نمونه می‌توانید به محصولات متنوع AMD با تراشه Polaris ۲۰ و یا محصولات Nvidia با تراشه GP104 دقت کنید. در این تصویر می‌توانید تعداد بالای بلاک‌های فرعی قابل بازیابی (قابل صرف‌نظر) یک کارت گرافیک را مشاهده کنید.

ولتاژ ای‌سیک‌ها را می‌توان به‌راحتی تا ۰.۴ ولت، یعنی نصف ولتاژ کارت‌های گرافیک، پایین آورد. این طراحی ولتاژ پایین همین‌ حالا هم در تجهیزات استخراج بیت کوین به کار می‌رود و هیچ دلیل ندارد که از آن‌ها در ای‌سیک های الگوریتم ProgPow استفاده نشود.

پاسخ: طراحی‌های ولتاژ پایین تنها وقتی کار خواهند کرد که تراشه آن، مثل ای‌سیک‌های SHA256d، تنها دارای هسته محاسباتی باشد. با ادغام سایر عناصر در این تراشه مثل SRAMها (که از ملزومات الگوریتم ProgPow به شمار می‌رود)، عملکرد مؤثر این قطعات بسیار دشوار یا کاملاً غیرممکن خواهد شد.

حافظه‌های پویای LPDDR4x DRAM هم همین سطح از صرفه‌جویی در توان مصرفی را ارائه می‌دهند و توان مصرفی آن‌ها از حافظه‌های GDDR6 هم پایین‌تر است.

پاسخ: پهنای باند حافظه‌های LPDDR4x به طرز چشمگیری (۴.۲ گیگابیت در برابر ۱۶ گیگابیت برای هر پین) پایین‌تر از GDDR6 است. یعنی برای رسیدن به همان کارایی باید تعداد تراشه‌ها و اینترفیس‌های حافظه را چهار برابر کرد. کاری که هزینه تولید را بسیار بالا خواهد برد.

البته باید این را هم در نظر داشت که تعداد اینتفریس های تراشه‌های حافظه با پهنای باند بالا محدود است. این یعنی این‌که فضای محدود دای تنها می‌تواند ناحیه‌ای را در خود جای دهد که سیگنال‌ها بتوانند از طریق آن از تراشه به برد اصلی منتقل شوند. یک طراحی که بر پایه LPDDR4x بنا شود برای دستیابی به پهنای GDDR6 باید فضای انتقال سیگنال‌های روی برد اصلی را تا ۴ برابر افزایش دهد. در این صورت هزینه تنها شامل تراشه‌های حافظه نمی‌شود بلکه فضای دای محاسباتی موردنیاز برای تغذیه حافظه‌ها را هم در بر می‌گیرد. چیزی که وضعیت را از این هم بدتر می‌کند این است که فضای دای اضافی در این عملیاتِ سرعت محور باعث به هدر رفتن توان الکتریکی بیشتری خواهد شد.

به همین دلیل است که از این نوع حافظه در کارت‌های گرافیک امروزی استفاده نمی‌شود. حافظه LPDDR4x ازنظر هزینه پهنای باند بسیار گران تمام می‌شود. پهنای باند این حافظه ۴ برابر گران‌تر است زیرا تعداد تراشه‌های موردنیاز آن ۴ برابر بیشتر است. هزینه این حافظه برای پهنای باند ۲۵۶ گیگابایت در ثانیه و ۹ وات مصرف انرژی ۱۵۰ دلار است در صورتی که GDDR6 همین پهنای باند را با ۱۱ وات مصرف و تنها ۴۰ دلار در اختیار شما می‌گذارد؛ به عبارت دیگر، با صرف هزینه بیشتر عملا هیچ صرفه جویی‌ای در مصرف صورت نمی‌گیرد. لازم به ذکر است که این هزینه برای پهنای باند است و نه برای ظرفیت.

شرکت سامسونگ

یک تولیدکننده کارت گرافیک مثل شرکت انویدیا ۸۰۰۰ نفر را برای توسعه کارت‌های گرافیکش استخدام کرده است که کار را از نقطه نظر فنی بسیار پیچیده‌تر می کند. درصورتی‌که یک تولیدکننده ای‌سیک مثل شرکت لینژی (Linzhi) با استخدام ۱۰ یا ۱۲ نفر تمرکز خود را روی ای‌سیک‌های مخصوص الگوریتم Ethash گذاشته است. هزینه کارمندان شرکت انویدیا حدود ۱۰۰ برابر شرکت لینژی است؛ بنابراین ای‌سیک‌ها از نظر هزینه و زمان لازم برای عرضه محصول به بازار از تراشه‌های کارت گرافیک بهتر عمل می‌کنند.

پاسخ: یک‌بار دیگر مزیت‌های صرفه جویی به مقیاس در اینجا اهمیت پیدا می‌کند. صنعت تولید کارت گرافیک با استفاده از کانال‌های فروش متنوع، بازار ۴۲۰ میلیارد دلاری خود را در سراسر جهان سرشکن می‌کند: شرکت AMD با ۱۱٫۶ میلیارد دلار، Nvidia با ۱۵۴٫۵ میلیارد دلار و اینتل با ۲۵۴٫۸ میلیارد دلار. این ارقام تنها مربوط به حافظه است و هزینه‌های تولید لایه فیزیکی و ویفرها هم یک صنعت ۵۰۰ میلیارد دلاری مجزا را تشکیل می‌دهد که در آن سامسونگ با ۳۲۵٫۹ میلیارد دلار و ۳۲۰,۶۷۱ کارمند، میکرون با ۶۰٫۱ میلیارد دلار و ۳۴,۱۰۰ کارمند و هاینیکس (Hynix)با ۵۶٫۸ میلیارد دلار و ۱۸۷,۹۰۳ کارمند، سردمداران این صنعت محسوب می‌شوند. شرکت سامسونگ بزرگ‌ترین خریدار حق ثبت اختراعات آمریکا در جهان است و میکرون اولین شرکتی بود که به سرعت سرسام‌آور ۲۰ گیگابیت در ثانیه در حافظه‌های GDDR6 رسید. در مقابل ارزش بازار صنعت تولید ای‌سیک ارزهای دیجیتال تنها ۱۴۶ میلیارد دلار است که ۷۶ میلیارد دلار آن را بیت کوین در اختیار دارد.

با در نظر گرفتن زمان آماده شدن محصول برای عرضه بازار و بازار در اختیار آن، می‌توانیم زمان موردنیاز برای توسعه جانشین ماینر محبوب S۹ را محاسبه کنیم. با این حساب ساخت یک ماینر نسبتاً ساده که تحقیقات لازم برای آن به‌خوبی انجام‌شده باشد، سه سال زمان خواهد برد. حالا چه تضمینی وجود دارد که بتوان بر اساس آن گفت ای‌سیک‌های PogPoW که به کارت گرافیک شباهت دارند به سرعت مورد استفاده قرار خواهند گرفت؟

از طرف دیگر می‌توان نگاهی هم به ای‌سیک‌های اتریوم انداخت و نحوه کار آنها را بررسی کرد. با گذشت یک سال از عرضه نمونه‌های GDDR6، چه مدت طول خواهید کشید که این نوع از چیپ‌ها همه‌گیر شوند؟

سخن آخر

الگوریتم ProgPow بر اساس ایده ساده‌ی ارائه هزینه واقعی و دقیق (اثبات) کار را با استفاده از سخت‌افزارهای موجود و قابل‌دسترس برای همه، توسعه‌یافته است. [ما در تیم‌مان] سخت‌افزاری را هدف قرار دادیم که از پشتیبانی صرفه جویی به مقیاس بالا برخوردار است و کارایی بالایی دارد و از طرف دیگر در فضای رقابتیِ پویایی نیز فعالیت می‌کند.

ما یک گروه توسعه کوچک هستیم که شغل اصلی هر کدام‌مان چیز دیگری است و قادر نیستیم تا به‌موقع به تمام این بیانیه‌ها، مقالات و بحث‌هایی که در تالارهای گفتگو منتشر می‌شود پاسخ دهیم. ما از مشاهده کنجکاوی شما درباره طراحی و توسعه سخت‌افزار خوشحال هستیم اما به شما توصیه می‌کنیم که محتاطانه عمل کنید. سخت‌افزار هم مانند نرم‌افزار یک حوزه بسیار متنوع است و دانش شما در مورد ای‌سیک‌های ارزهای دیجیتال شما را یک شبه تبدیل به یک متخصص در حوزه اسیک‌های کارت گرافیک نخواهد کرد.

guest

استفاده از محتوای توهین‌آمیز، غیراخلاقی، دیدگاه‌های غیراقتصادی، تبلیغات و اطلاعات تماس یا لینک‌های نامرتبط ممنوع است.

نقض قوانین ممکن است منجر به عدم تأیید دیدگاه‌ها یا مسدودسازی حساب کاربران شود.

2 دیدگاه
من قانون هستم
من قانون هستم
4 سال و 3 ماه قبل

خلاصه مطلب این هست که در الگوریتم جدید گرافیکهای RTX به صرفه نیستن و گرافیکهای AMD ضعیف هستن...در نتیجه از الان به بعد تا میتونین گرافیکهای gtx1070 بخرین و انبار کنین...یک نگاه دقیق به چارت prog pow بندازین خودتون متوجه ماجرا میشین ...یا علی

temp
temp
4 سال و 3 ماه قبل

ترجمه بسیار بدی بود.
به سختی می تونستم بفهمم