دیپ سیک؛ هوش مصنوعی ارزان قیمت چینی

 

 

دیپ سیک، یک استارت‌آپ چینی متخصص در هوش مصنوعی است که دنیای از قبل هیپرتروفی و عصبی هوش مصنوعی را متزلزل می‌کند، دنیایی که تاکنون تقریباً به طور کامل آمریکایی با OpenAI ، Google Gemini ، Anthropic  و Meta  بوده است . تقریباً تا ماه گذشته برای عموم مردم ناشناخته بود، دو مدل را ظرف چند هفته منتشر کرد که می‌توان از طریق یک برنامه چت بات استفاده کرد : اول، در ماه دسامبر، مدلی به نام V3. و سپس، فقط در 20 ژانویه گذشته، R1 .  اینها مدلهای زبان بزرگ LLM  هستند که تا حدی با مدلهایی که ما به آنها عادت کرده ایم متفاوت هستند زیرا استدلال صریح را با جستجوی وب بلادرنگ ترکیب می کنند . بنابراین می‌توان پاسخ‌هایی را که به کاربران ارائه می‌دهند با اطلاعات تازه به‌روزرسانی کرد. ظرف چند روز DeepSeek به پربارگیری ترین برنامه در بسیاری از کشورها از جمله ایالات متحده تبدیل شد. همه اینها با وجود نگرانی در مورد پردازش مبهم داده های مشترک و مهمتر از همه در مورد نوع اطلاعاتی که چت بات قادر به بازگرداندن آنها است، کاملاً مطابق با سانسور دولت چین است .

دیپ سیک

 دبپ سیکچگونه توسعه یافت و چقدر هزینه دارد؟

 از طریق تکنیک های به اصطلاح یادگیری تقویتی توسعه یافته است، عملکرد قابل مقایسه با مدل های شاخص OpenAI  مانند o1 و o1-mini را نشان داده است، به ویژه در ریاضیات و برنامه نویسی کامپیوتر. این را «رتبه‌بندی هوش مصنوعی»، یعنی نظراتی که توسط کاربران Chatbot Arena  تهیه شده است، گفته می‌شود ، جایی که DeepSeek با Gemini 2.0 Flash Thinking by Google، ChatGPT 4o و o1 mini توسط OpenAI برای مکان‌های برتر رقابت می‌کند. یکی از ویژگی های متمایز R1 همچنینشفافیت " در فرآیند تصمیم گیری است: صرف نظر از محتوایی که ارائه می دهد، به کاربر توضیح می دهد که چگونه آن را ایجاد کرده است.

جنبه دیگری که این بخش را تکان می دهد مربوط به هزینه های آموزش DeepSeek است که تنها چند سال پیش توسط کارآفرین لیانگ ونفنگ، مدیر یک صندوق تامینی کمی چینی راه اندازی شد که با جمع آوری حدود 15 میلیارد دلار به یک داستان موفقیت مالی تبدیل شده است. این صندوق تامینی عمدتاً بر مدل‌های آماری و الگوریتم‌های پیچیده برای ایجاد تصمیمات تجاری خود متکی بود و به نوعی هسته اصلی یک پروژه هوش مصنوعی بود که اکنون اساساً هر حوزه از دانش بشری را هدف قرار می‌دهد.

آموزش، گفته شد. شرکت‌ها در ایالات متحده هزینه‌های زیادی را برای آموزش LLM (مدل‌های زبان بزرگ) خود - که عمدتاً منبع باز نیستند ، مانند DeepSeek، یکی دیگر از اخلالگران صنعت جدا از Lllama 3.1 متا - تا صدها میلیون دلار با چشم‌اندازهای گران‌تر هزینه می‌کنند. پلتفرم چینی ادعا می کند که مدل V3 خود را که از 671 میلیارد پارامتر تشکیل شده است نه تنها در 55 روز بلکه با هزینه ای کمتر از 6 میلیون دلار آموزش داده است . کاهش سرمایه‌گذاری‌های ضروری که هم به استفاده از کارت‌های گرافیکی انویدیا با کارایی کمتر مانند H800 مرتبط است، هم به دلیل ممنوعیت ایالات متحده در زمینه فناوری‌ها در بخش هوش مصنوعی و هم به توانایی جبران کمبود قدرت محاسباتی. با راه حل های نرم افزاری اما همچنین یک جنبه حیاتی از نظر سودآوری: اگر آموزش هوش مصنوعی هزینه کمتری داشته باشد، برای شرکت‌ها و توسعه‌دهندگانی که می‌خواهند آن را در محصولات خود ادغام کنند نیز هزینه کمتری خواهد داشت و شاید بتوانند تعادل سودآوری بین سرمایه‌گذاری و بازده را پیدا کنند. در حال حاضر، جدا از گروه‌های آمریکایی که شانه‌های پهنی دارند مانند جمینی، از گروه‌های آمریکایی فرار می‌کند.

محدودیت ها: سانسور دولتی و جمع آوری داده ها

موفقیت  دیپ سیک، همانطور که گفتیم، طبیعتاً سؤالاتی را در مورد محدودیت های اخلاقی و تأثیرات احتمالی دولت ایجاد می کند . با وجود نوآوری های آن، نگرانی هایی در مورد سانسور و کنترل توسط دولت چین وجود دارد که می تواند بر عملکرد و تکامل این فناوری تأثیر بگذارد . با این وجود، تنها در چند روز، برنامه رایگان DeepSeek به بدترین کابوس فناوری بزرگ آمریکایی تبدیل شده است و به سرعت در رتبه بندی App Store در ایالات متحدهو همچنین در ایتالیا - که برای مثال در رتبه اول در بین برنامه های رایگان قرار دارد، صعود می کند. و تبدیل شدن به هدف حملات بدافزارهایی که هدفشان سوء استفاده از قابلیت های آن است.