هوش مصنوعی Deepseek

چرا Deepsek تاثیر شگرفی بر ریزش بازارهای مالی داشت؟
برای ارائه پیش زمینه باید بدانید که شرکت Deepseek یک استارت آپ چینی در حوزه هوش مصنوعی است که به طور ناگهانی ظهور کرده است. این شرکت با ChatGPT رقابت می کند و هزینه توسعه آن کمتر از ۱۰ میلیون دلار بوده است. Deepseek با استفاده از تراشه هایی توسعه یافته، که به مراتب پیشرفته تر از تراشه های مورد استفاده شرکت های آمریکایی هستند.
کاربران تست های مختلفی را بین Deepseek و ChatGPT انجام داده اند و در بسیاری از دسته بندی ها، Deepseek عملکرد بهتری نسبت به ChatGPT نشان داده است. این موضوع برای محصولی که در عرض چند ماه توسعه یافته، بسیار شگفت انگیز است. سوال این است که آیا فناوری های بزرگ در آمریکا در حال از دست دادن سلطه خود بر بازارها هستند؟
برای درک بهتر، OpenAI، شرکت مادر ChatGPT، مبلغ ۱۷٫۹ میلیارد دلار سرمایه در ۱۰ دور سرمایه گذاری جذب کرده و ارزش آن در اکتبر ۲۰۲۴ حدود ۱۵۷ میلیارد دلار بوده است. OpenAI تقریبا ۲۲ برابر بیشتر از Deepseek کارمند دارد. این موضوع باعث شگفتی بازارها شده است.
حال Deepseek در معیارهای AIME، MATH-500 و GPQA عملکرد برتری دارد. ChatGPT هنوز در تست های کدنویسی بهتر عمل می کند، اما فاصله آن با Deepseek در حال کاهش است.
سرعت توسعه Deepseek نشان می دهد که سلطه آمریکا در حوزه هوش مصنوعی در خطر است.
علاوه بر این، Deepseek به عنوان پر دانلود ترین اپلیکیشن رایگان در اپ استور شناخته شده است. کاربران گزارش می دهند که تجربه استفاده از API آن کاربرپسند است، محدودیت های تعداد استفاده مشکلی ایجاد نمی کند و احتمالا در هوش مصنوعی عامل محور(Agentic AI) ادغام خواهد شد. هوش مصنوعی عامل محور چیزی است که Nvidia آن را به عنوان تحول بزرگ بعدی معرفی کرده است.
موضوع جالب تر این است که Deepseek تقریبا ۹۶ درصد ارزان تر از ChatGPT است. همچنین Deepseek RI کاملا متن باز است و هزینه آن کسری از ChatGPT است. بدون شک، سرمایه گذاران در فناوری های بزرگ آمریکا نگران هستند. سهام های Magnificent 7( هفت شرکت بزرگ فناوری) حدود ۲ انحراف معیار بالاتر از سطح سال ۲۰۰۱ در مقایسه با سهام جهانی معامله می شوند. بخش عمده ای از رشد بازار در دو سال گذشته بر اساس سخت افزار و هوش مصنوعی بوده است.
این موضوع عملکرد Nasdaq futres را در هفته ی گذشته توضیح می دهد. Nasdaq تقریبا دو برابر بیش تر از S&P 500 کاهش یافته است. بازار های سهام آمریکا در حال حذف بیش از ۱ تریلیون دلار از ارزش بازر بودند. این در حالی است که Magnificent 7 اکنون ۳۴ درصد از S&P 500 را تشکیل می دهد. این شرکت ها از ابتدای سال گذشته ۵ تریلیون دلار به ارزش بازار خود افزوده اند. ارزش این
شرکت ها اکنون تقریبا به اندازه کل بازارهای سهام چین و هنگ کنگ است. علاوه بر تهدید سلطه فناوری آمریکا، شاهد تشدید جنگ های تجاری با تعرفه های جدید هستیم. این موضوع پس از آن رخ داده که رییس جمهور آمریکا ترامپ پروژه Storage را اعلام کرد، پروژه ای با سرمایه گذاری ۵۰۰ میلیارد دلاری در حوزه هوش مصنوعی آمریکا. اگر Deepseek بتواند هوش مصنوعی را با کمتر از ۱ درصد هزینه توسعه دهد، آیا واقعا به ۵۰۰ میلیارد دلار نیاز است.
انقلاب در دنیای هوش مصنوعی: چگونه DeepSeek تغییرات شگرفی در زمینه آموزش مدلهای AI ایجاد کرده است؟
اختراعات شرکت DeepSeek در دنیای هوش مصنوعی توانستهاند توجه بسیاری از کارشناسان و علاقهمندان را به خود جلب کنند. این شرکت با کاهش هزینههای آموزشی مدلهای AI و بهبود کارایی آنها، توانسته است رقابت را در بازارهای بزرگ AI به چالش بکشد.
مشکل کنونی
در حال حاضر، فرآیند آموزش مدلهای هوش مصنوعی به شدت پرهزینه است. شرکتهای بزرگی مانند OpenAI و Anthropic هزینههای زیادی را برای محاسبات و زیرساختهای مورد نیاز خود صرف میکنند. به عنوان مثال، این شرکتها نیازمند مراکز داده بسیار بزرگی با هزاران GPU پرقدرت هستند که هزینه هر یک از این GPUها بالغ بر ۴۰ هزار دلار است. این موضوع به قدری پرهزینه است که میتوان آن را با ساخت یک نیروگاه برق برای راهاندازی یک کارخانه مقایسه کرد.
راهحل DeepSeek
شرکت DeepSeek با یک راهحل نوآورانه، توانسته است هزینههای آموزش مدلهای هوش مصنوعی را به شدت کاهش دهد. این شرکت ادعا کرده است که میتواند تمامی این مراحل را با صرف هزینهای کمتر از ۵ میلیون دلار انجام دهد و این ادعا را با نتایج عملی خود ثابت کرده است. مدلهای این شرکت توانستهاند در تسکهای زیادی مدلهای مطرحی مانند GPT-4 و Claude را شکست دهند.
نوآوریهای DeepSeek
رمز موفقیت DeepSeek در بازاندیشی کامل فرآیندهای سنتی هوش مصنوعی است. به عنوان مثال، در حالی که هوش مصنوعیهای سنتی هر عدد را با ۳۲ اعشار مینویسند، DeepSeek با استفاده از اعداد ۸ اعشاری به همان دقت دست پیدا کرده است. این کار باعث کاهش ۷۵٪ حافظه مورد نیاز شده است.
علاوه بر این، سیستم Multi Token مورد استفاده DeepSeek نیز بسیار کارآمد است. در حالی که هوش مصنوعیهای معمولی متنها را به صورت کلمه به کلمه تحلیل میکنند، DeepSeek کل جمله را به صورت یکجا و با دقت ۹۰٪ تحلیل میکند. این روش باعث افزایش سرعت پردازش و کاهش هزینهها میشود.
سیستم تخصصی DeepSeek
یکی از هوشمندانهترین اقدامات DeepSeek، ایجاد یک سیستم تخصصی است. به جای اینکه یک مدل هوش مصنوعی غولآسا همه چیز را بداند، این شرکت از متخصصین در مواقع نیاز استفاده میکند. مدلهای سنتی تمام پارامترهای خود را در لحظه فعال میکنند، اما DeepSeek تنها از پارامترهای مورد نیاز استفاده میکند. این کار باعث کاهش هزینهها و افزایش کارایی میشود.
نتایج حیرتانگیز
نتایج این اقدامات نوآورانه حیرتانگیز است. هزینه آموزش مدل از ۱۰۰ میلیون دلار به ۵ میلیون دلار کاهش یافته است. تعداد GPUهای مورد نیاز از صد هزار به دو هزار کاهش یافته است. هزینه API ۹۵ درصد ارزانتر شده است. مدلهای DeepSeek میتوانند روی کارتهای گرافیک گیمینگ نیز اجرا شوند.
اهمیت این دستاوردها
این دستاوردها فرضیهای را که تنها شرکتهای بزرگ میتوانند در عرصه AI رقابت کنند، به چالش کشیده است. برای شرکتهایی مانند انویدیا، این موضوع ترسناک است، زیرا کل مدل کسب و کار آنها بر فروش GPUهای پرهزینه با حاشیه سود بالا بنا شده است. اگر همه بتوانند مدلهای هوش مصنوعی را با GPUهای گیمینگ بسازند، این معادله تغییر خواهد کرد.
نتیجهگیری
DeepSeek با تیمی کمتر از ۲۰۰ نفر توانسته است دستاوردهایی بزرگتر از بسیاری از شرکتهای بزرگ داشته باشد. این موضوع نشاندهنده یک داستان کلاسیک از شکستن وضع موجود است. در حالی که شرکتهای مستقر فرآیندهای موجود خود را بهینهسازی میکنند، نوآوران فرآیندها را از ابتدا بازاندیشی میکنند.
تأثیرات این دستاوردها چشمگیر خواهد بود. دسترسی بیشتر به توسعه هوش مصنوعی/ افزایش شدید رقابت/ کاهش نیازهای سختافزاری و هزینهها
در پایان این مقاله شما رو دعوت به گوش دادن پادکست ایمان فانی با موضوع زلزله DeepSeek می کنم.