DeepSeek یک استارتاپ هوش مصنوعی چینی است که یک چتبات به نام خود دارد. این شرکت در سال ۲۰۲۳ توسط لیانگ ونفنگ تاسیس شد و دفتر مرکزی آن در هانگژو، ژجیانگ قرار دارد. DeepSeek از سوی صندوق پوشش ریسک High-Flyer حمایت مالی میشود. ماموریت اصلی این کمپانی توسعهی هوش مصنوعی AGI از طریق تحقیقات و توسعهی متنباز است. این شرکت به دنبال فراگیرتر کردن فناوری هوش مصنوعی برای استفادههای تجاری و علمی است. تمرکز آن روی توسعهی مدلهای زبانی بزرگ (LLM) است که از نظر عملکرد و هزینه، با پیشروهای صنعت رقابت کرده یا از آنها فراتر میروند. در این مطلب به بررسی این که هوش مصنوعی DeepSeek چیست و چه تاثیری بر صنعت هوش مصنوعی داشته است میپردازیم. همچنین آن را با مدلهای زبانی دیگر مانند Chatgpt کمپانی Open AI مقایسه خواهیم کرد.
هوش مصنوعی DeepSeek چیست؟
دیپسیک یک شرکت توسعه هوش مصنوعی مستقر در هانگژو، چین است. این شرکت در ماه مه ۲۰۲۳ توسط لیانگ ونفنگ، فارغالتحصیل از دانشگاه ژجیانگ، تاسیس شد. ونفنگ همچنین از موسسان مشترک شرکت High-Flyer است؛ صندوق سرمایهگذاری کمیتدبیر چینی که مالک DeepSeek است. در حال حاضر، دیپسیک به عنوان یک آزمایشگاه تحقیقاتی مستقل در زمینه هوش مصنوعی تحت نظر High-Flyer فعالیت میکند. مبلغ کل سرمایهگذاری و ارزشگذاری دیپسیک به صورت عمومی اعلام نشده است.
دیپسیک بر توسعه مدلهای زبانی متنباز (LLM) متمرکز شده است. اولین مدل این شرکت در نوامبر ۲۰۲۳ عرضه گردید. این شرکت چندین بار مدل اصلی خود را بهروزرسانی کرده و نسخههای متنوعی از آن را توسعه داده است. با این حال، تا ژانویه ۲۰۲۵ و پس از عرضه مدل استدلال R1، شرکت به شهرت جهانی دست نیافت.
این شرکت خدمات متعددی را برای مدلهای خود ارائه میدهد که شامل رابط کاربری وب، اپلیکیشن موبایل و دسترسی از طریق API میشود.
مقایسهی DeepSeek با سایر مدلهای هوش مصنوعی
مدلهای هوش مصنوعی DeepSeek به دلیل مقرونبهصرفه بودن و کارایی بالا در مقایسه با سایر مدلها متمایز هستند. برای مثال، مدل DeepSeek-V3 با استفاده از تقریبا ۲۰۰۰ تراشهی Nvidia H800 طی ۵۵ روز آموزش داده شده که هزینهی آن حدود ۵.۵۸ میلیون دلار بوده است. این رقم به طور قابلتوجهی کمتر از هزینهی مدلهای مشابه سایر شرکتها است و باعث شده که شرکتهای فناوری بزرگ در مورد سرمایهگذاریهای بزرگ خود در زیرساختهای هوش مصنوعی تجدیدنظر کنند.
مقایسهی DeepSeek و ChatGPT
متنباز بودن
OpenAI معماری داخلی ChatGPT را مخفی نگه میدارد و فقط نسخههای محدود آن را در اختیار کاربران قرار میدهد.
در مقابل، DeepSeek متنباز است و به کاربران اجازه میدهد که به کدهای آن دسترسی داشته باشند و در توسعهی آن مشارکت کنند. این رویکرد، مزایای زیادی از جمله همکاریهای گستردهتر را دارد اما نگرانیهایی دربارهی سوءاستفادههای احتمالی از این مدل نیز ایجاد کرده است.
مقایسهی عملکرد و هزینهها
هر دو مدل در زمینههایی مانند کدنویسی و تولید متن عملکرد بسیار خوبی دارند.
مدل DeepSeek-R1 از نظر کیفیت خروجی با جدیدترین نسخههای ChatGPT رقابت میکند. برتری بزرگ DeepSeek در هزینهی پایین توسعهی آن است؛ این شرکت نشان داده که میتوان مدلهای قدرتمند هوش مصنوعی را با هزینهای بسیار کمتر توسعه داد.
دسترسی و محبوبیت
ChatGPT دارای نسخهی رایگان است اما برای استفاده از ویژگیهای پیشرفته، کاربران باید اشتراک ماهانه بخرند.
DeepSeek میخواهد استفاده از هوش مصنوعی را برای همه آسان و فراگیر کند و این سیاست موجب رشد سریع آن و حتی سبقت از ChatGPT در برخی فروشگاههای اپلیکیشن شده است.
با این حال، دسترسی گسترده به این فناوری ممکن است خطرات امنیتی از جمله تهدیدات سایبری و ایمنی کاربران را به همراه داشته باشد.
معماری مدل
ChatGPT از یک معماری پیچیده استفاده میکند که پردازش سنگینی دارد.
در مقابل، DeepSeek از معماری کارآمدتر MOE بهره میبرد که عملکردی بسیار قوی با منابع محاسباتی کمتر ارائه میدهد.
آزادی بیان و سانسور محتوا
DeepSeek تحت قوانین دولت چین فعالیت میکند و پاسخهای آن روی موضوعات حساس سانسور میشود.
در مقابل، ChatGPT هرچند دارای محدودیتهای نظارتی و کنترل محتوا است، اما در بحثهای گستردهتری اجازهی مشارکت را میدهد.
این تفاوت، سوالات اخلاقی مهمی دربارهی آزادی اطلاعات و امکان بروز سوگیری در مدلهای هوش مصنوعی DeepSeek ایجاد کرده است.
مسائل حریم خصوصی و امنیت ملی
DeepSeek به دلیل ذخیرهسازی دادهها در چین، نگرانیهایی در زمینهی حریم خصوصی و امنیت ملی ایجاد کرده است.
این بحثها مشابه نگرانیهایی است که پیرامون سایر شرکتهای فناوری چینی مانند TikTok وجود دارد.
نحوه پیوستن به DeepSeek
از طریق مرورگر خود، وارد وبسایت DeepSeek شوید.
در اینجا میتوانید از مدل DeepSeek-V3 بهصورت رایگان استفاده کنید. احتمالا برای استفاده از امکانات پیشرفتهتر نیاز به ثبتنام خواهید داشت. میتوانید با ایمیل یا شماره تلفن یک حساب کاربری ایجاد کنید.
اگر میخواهید از اپلیکیشن موبایل استفاده کنید، میتوانید آن را از فروشگاههای رسمی مانند App Store یا Google Play دانلود کنید. پس از نصب، میتوانید از مدلهای هوش مصنوعی DeepSeek در تلفن همراه خود استفاده کنید.
پیشنیازهای نصب DeepSeek به صورت محلی
اگر قصد دارید DeepSeek را روی سیستم شخصی خود نصب و اجرا کنید، باید توجه داشته باشید که این مدل حجم بسیار بالایی دارد و ممکن است سختافزار سیستم شما برای اجرای آن کافی نباشد. پردازش مدلهای زبانی بزرگ (LLM) به میزان بالایی از توان پردازشی، حافظه رم و فضای ذخیرهسازی نیاز دارد. در صورتی که سیستم شما قدرت پردازش کافی را نداشته باشد، ممکن است با کندی شدید، کرش کردن سیستم یا حتی ناتوانی در اجرا مواجه شوید.
یکی از گزینههای مناسب برای اجرای DeepSeek، استفاده از سرور مجازی اختصاصی با سرور اختصاصی منابع بالا است. این سرورها دارای پردازندههای قدرتمند، رم بالا و منابع پیشرفته هستند که میتوانند عملکرد بهتری در پردازش مدلهای هوش مصنوعی داشته باشند. انتخاب یک سرور مناسب نه تنها به اجرای سریعتر و پایدارتر مدل کمک میکند، بلکه باعث صرفهجویی در هزینههای سختافزاری و نگهداری سیستم نیز میشود.
مدلهای زبانی DeepSeek
از زمان تاسیس شرکت در سال ۲۰۲۳، DeepSeek مجموعهای از مدلهای هوش مصنوعی مولد را منتشر کرده است. با هر نسل جدید، این شرکت تلاش کرده است تا قابلیتها و عملکرد مدلهای قبلی خود را ارتقا دهد:
- DeepSeek Coder: منتشر شده در نوامبر ۲۰۲۳، این مدل نخستین مدل متنباز شرکت است که برای وظایف مرتبط با کدنویسی طراحی شده است.
- DeepSeek LLM: منتشر شده در دسامبر ۲۰۲۳، نخستین نسخه از مدل مناسب برای مکالمات عمومی این شرکت محسوب میشود.
- DeepSeek-V2: منتشر شده در مه ۲۰۲۴، دومین نسخه از مدل LLM این شرکت است که بر بهبود عملکرد و کاهش هزینههای آموزش تمرکز دارد.
- DeepSeek-Coder-V2: منتشر شده در ژوئیه ۲۰۲۴، مدلی با ۲۳۶ میلیارد پارامتر و یک کادر متنی ۱۲۸,۰۰۰ توکنی است که برای چالشهای پیچیدهی کدنویسی طراحی شده است.
- DeepSeek-V3: منتشر شده در دسامبر ۲۰۲۴، این مدل از معماری MOE بهره میبرد و قادر به انجام طیف وسیعی از وظایف است. این مدل دارای ۶۷۱ میلیارد پارامتر و یک پنجرهی متنی ۱۲۸,۰۰۰ توکنی است.
- DeepSeek-R1: منتشر شده در ژانویه ۲۰۲۵، این مدل مبتنی بر DeepSeek-V3 است و بر استدلال پیشرفته تمرکز دارد. این مدل بهطور مستقیم با مدل o1 شرکت OpenAI رقابت میکند و در عین حال، ساختار هزینهای بهمراتب پایینتری دارد. همانند DeepSeek-V3، این مدل نیز دارای ۶۷۱ میلیارد پارامتر و کادر متنی ۱۲۸,۰۰۰ توکنی است.
- Janus-Pro-7B: منتشر شده در ژانویه ۲۰۲۵، Janus-Pro-7B یک Vision Model است که قابلیت درک و تولید تصاویر را دارد.
آیا هوش مصنوعی DeepSeek متنباز است؟
DeepSeek تمامی مدلهای خود را بهصورت متنباز و تحت مجوز MIT منتشر کرده است. این مجوز به کاربران اجازه میدهد که مدلها را بدون هیچ محدودیتی برای استفادهی تجاری و دانشگاهی به کار ببرند. تعهد DeepSeek به شفافیت و متنباز بودن، آن را از برخی رقبایی که مدلهای خود را بهصورت انحصاری عرضه میکنند، متمایز کرده و نقش مهمی در رشد سریع محبوبیت آن داشته است.
DeepSeek نشان داده است که آزمایشگاههای متن باز اکنون توانایی بالایی در مهندسی معکوس دارند. هرگونه برتری که آزمایشگاههای هوش مصنوعی آمریکایی به دست آورند، اکنون میتواند تنها در چند ماه از بین برود. این مسئله، چالشی جدی برای شرکتهایی است که مدلهای خود را بهعنوان یک محصول میفروشند، زیرا توسعهدهندگان بهراحتی میتوانند مدلهای خود را تغییر دهند و بهینهسازیهای DeepSeek موجب صرفهجویی قابل توجهی در هزینهها میشود.
تاثیر DeepSeek بر صنعت هوش مصنوعی
پیشرفتهای DeepSeek تحولات چشمگیری در صنعت هوش مصنوعی ایجاد کرده و واکنشهای شدیدی را در بازارهای مالی برانگیخته است. این استارتاپ چینی با معرفی هوش مصنوعی جدید خود، دنیای فناوری را تکان داد و موجب کاهش نزدیک به ۶۰۰ میلیارد دلاری ارزش سهام انویدیا شد.
عامل اصلی سقوط ارزش سهام انویدیا
معرفی مدل DeepSeek-V3 که با هزینهای بسیار کمتر از مدلهای مشابه آمریکایی توسعه یافته است، نگرانیهایی را درباره کاهش تقاضا برای پردازندههای گرافیکی پیشرفتهی انویدیا ایجاد کرد. این ترس، فروش گستردهی سهام انویدیا را در روز دوشنبه در پی داشت و موجب بزرگترین افت ارزش یکروزه در تاریخ شرکتهای آمریکایی شد. این روند نزولی، سایر غولهای فناوری از جمله Broadcom و مایکروسافت را نیز تحت تاثیر قرار داد.
بازگشت اعتماد به انویدیا
با این حال، این تکاپو در بازار دوام چندانی نداشت. روز سهشنبه، سهام انویدیا نزدیک به ۹ درصد افزایش یافت و نشان داد که سرمایهگذاران همچنان به آیندهی این شرکت امیدوارند. کارشناسان تاکید میکنند که هرچند مدل DeepSeek-V3 از نظر هزینه و کارایی بسیار بهینه است، اما نقش حیاتی سختافزارهای انویدیا در توسعهی هوش مصنوعی همچنان پابرجاست.
واکنشهای متفاوت به موفقیت DeepSeek
نوآوری DeepSeek واکنشهای گوناگونی را در میان بزرگان فناوری به همراه داشته است. مدیران عامل مایکروسافت و OpenAI از این پیشرفت استقبال کردند، اما ایلان ماسک نسبت به دوام و آیندهی این فناوری ابراز تردید کرده است. انویدیا نیز این دستاورد را به رسمیت شناخت و اعلام کرد که این مدل با مقررات کنترل صادرات ایالات متحده سازگار است و نشاندهندهی روشهای جدیدی در توسعهی مدلهای هوش مصنوعی است.
چشمانداز آیندهی صنعت هوش مصنوعی
با وجود رقابت شدید، مرحلهی استنتاج یا inference در اجرای مدلهای هوش مصنوعی هنوز بهشدت به تراشههای انویدیا وابسته است. تحولات اخیر بار دیگر نشان داد که صنعت هوش مصنوعی ناپایدار و بهشدت پویا است. نوآوریهایی مانند DeepSeek ممکن است بازارها را دچار نوسان کنند، اما در عین حال سرعت پیشرفت این صنعت و رقابت شدید میان شرکتهای پیشرو را نیز نشان میدهند.
جمع بندی
DeepSeek یک استارتاپ چینی در حوزهی هوش مصنوعی متنباز است که در سال ۲۰۲۳ تاسیس شد و به سرعت به یکی از بازیگران کلیدی این صنعت تبدیل شده است. این شرکت با هدف توسعهی هوش مصنوعی عمومی یا AGI و دموکراتیکسازی فناوری، مدلهای زبانی بزرگ (LLM) را معرفی کرده که هم از نظر عملکرد و هم هزینه با رقبای قدرتمندی مانند OpenAI و ChatGPT رقابت میکنند. به طور کلی، DeepSeek یک رقیب جدی برای OpenAI و سایر شرکتهای غربی محسوب میشود و چالشهای جدیدی برای مدلهای انحصاری و پرهزینه ایجاد کرده است. در حالی که برخی آن را گامی رو به جلو برای هوش مصنوعی میدانند، برخی دیگر معتقدند که پتانسیل این فناوری برای ایجاد تغییرات گسترده در صنعت و امنیت جهانی، نیازمند نظارت و کنترل بیشتری است.