دیپ سیک؛ هوش مصنوعی ارزان قیمت چینی
دیپ سیک، یک استارتآپ چینی متخصص در هوش مصنوعی است که دنیای از قبل هیپرتروفی و عصبی هوش مصنوعی را متزلزل میکند، دنیایی که تاکنون تقریباً به طور کامل آمریکایی با OpenAI ، Google Gemini ، Anthropic و Meta بوده است . تقریباً تا ماه گذشته برای عموم مردم ناشناخته بود، دو مدل را ظرف چند هفته منتشر کرد که میتوان از طریق یک برنامه چت بات استفاده کرد : اول، در ماه دسامبر، مدلی به نام V3. و سپس، فقط در 20 ژانویه گذشته، R1 . اینها مدلهای زبان بزرگ LLM هستند که تا حدی با مدلهایی که ما به آنها عادت کرده ایم متفاوت هستند زیرا استدلال صریح را با جستجوی وب بلادرنگ ترکیب می کنند . بنابراین میتوان پاسخهایی را که به کاربران ارائه میدهند با اطلاعات تازه بهروزرسانی کرد. ظرف چند روز DeepSeek به پربارگیری ترین برنامه در بسیاری از کشورها از جمله ایالات متحده تبدیل شد. همه اینها با وجود نگرانی در مورد پردازش مبهم داده های مشترک و مهمتر از همه در مورد نوع اطلاعاتی که چت بات قادر به بازگرداندن آنها است، کاملاً مطابق با سانسور دولت چین است .
دبپ سیکچگونه توسعه یافت و چقدر هزینه دارد؟
از طریق تکنیک های به اصطلاح یادگیری تقویتی توسعه یافته است، عملکرد قابل مقایسه با مدل های شاخص OpenAI مانند o1 و o1-mini را نشان داده است، به ویژه در ریاضیات و برنامه نویسی کامپیوتر. این را «رتبهبندی هوش مصنوعی»، یعنی نظراتی که توسط کاربران Chatbot Arena تهیه شده است، گفته میشود ، جایی که DeepSeek با Gemini 2.0 Flash Thinking by Google، ChatGPT 4o و o1 mini توسط OpenAI برای مکانهای برتر رقابت میکند. یکی از ویژگی های متمایز R1 همچنین " شفافیت " در فرآیند تصمیم گیری است: صرف نظر از محتوایی که ارائه می دهد، به کاربر توضیح می دهد که چگونه آن را ایجاد کرده است.
جنبه دیگری که این بخش را تکان می دهد مربوط به هزینه های آموزش DeepSeek است که تنها چند سال پیش توسط کارآفرین لیانگ ونفنگ، مدیر یک صندوق تامینی کمی چینی راه اندازی شد که با جمع آوری حدود 15 میلیارد دلار به یک داستان موفقیت مالی تبدیل شده است. این صندوق تامینی عمدتاً بر مدلهای آماری و الگوریتمهای پیچیده برای ایجاد تصمیمات تجاری خود متکی بود و به نوعی هسته اصلی یک پروژه هوش مصنوعی بود که اکنون اساساً هر حوزه از دانش بشری را هدف قرار میدهد.
آموزش، گفته شد. شرکتها در ایالات متحده هزینههای زیادی را برای آموزش LLM (مدلهای زبان بزرگ) خود - که عمدتاً منبع باز نیستند ، مانند DeepSeek، یکی دیگر از اخلالگران صنعت جدا از Lllama 3.1 متا - تا صدها میلیون دلار با چشماندازهای گرانتر هزینه میکنند. پلتفرم چینی ادعا می کند که مدل V3 خود را که از 671 میلیارد پارامتر تشکیل شده است نه تنها در 55 روز بلکه با هزینه ای کمتر از 6 میلیون دلار آموزش داده است . کاهش سرمایهگذاریهای ضروری که هم به استفاده از کارتهای گرافیکی انویدیا با کارایی کمتر مانند H800 مرتبط است، هم به دلیل ممنوعیت ایالات متحده در زمینه فناوریها در بخش هوش مصنوعی و هم به توانایی جبران کمبود قدرت محاسباتی. با راه حل های نرم افزاری اما همچنین یک جنبه حیاتی از نظر سودآوری: اگر آموزش هوش مصنوعی هزینه کمتری داشته باشد، برای شرکتها و توسعهدهندگانی که میخواهند آن را در محصولات خود ادغام کنند نیز هزینه کمتری خواهد داشت و شاید بتوانند تعادل سودآوری بین سرمایهگذاری و بازده را پیدا کنند. در حال حاضر، جدا از گروههای آمریکایی که شانههای پهنی دارند مانند جمینی، از گروههای آمریکایی فرار میکند.
محدودیت ها: سانسور دولتی و جمع آوری داده ها
موفقیت دیپ سیک، همانطور که گفتیم، طبیعتاً سؤالاتی را در مورد محدودیت های اخلاقی و تأثیرات احتمالی دولت ایجاد می کند . با وجود نوآوری های آن، نگرانی هایی در مورد سانسور و کنترل توسط دولت چین وجود دارد که می تواند بر عملکرد و تکامل این فناوری تأثیر بگذارد . با این وجود، تنها در چند روز، برنامه رایگان DeepSeek به بدترین کابوس فناوری بزرگ آمریکایی تبدیل شده است و به سرعت در رتبه بندی App Store در ایالات متحده - و همچنین در ایتالیا - که برای مثال در رتبه اول در بین برنامه های رایگان قرار دارد، صعود می کند. و تبدیل شدن به هدف حملات بدافزارهایی که هدفشان سوء استفاده از قابلیت های آن است.