DeepSeek to chiński startup, który w rozwoju dużych modeli językowych postawił na open source. Głównymi zaletami jego rozwiązań mają być ekonomiczny koszt i duża wydajność w porównaniu z innymi graczami rynku.
DeepSeek to chiński startup, który w rozwoju dużych modeli językowych postawił na open-source. Głównymi zaletami jego rozwiązań mają być ekonomiczny koszt i duża wydajność w porównaniu z innymi graczami rynku.
Charakterystyka modelu DeepSeek V3
Model, który spółka wypuściła na rynek – DeepSeek V3 – posiada 671 miliardów parametrów i został wytrenowany w ciągu dwóch miesięcy. Koszt tego przedsięwzięcia wyniósł 5,58 miliona dolarów, co stanowi stosunkowo niską kwotę w porównaniu do projektów realizowanych przez inne firmy z branży, takie jak OpenAI czy Meta Platforms. Parametry modelu wskazują na jego zdolność do analizy skomplikowanych danych i generowania precyzyjnych odpowiedzi.
Wyzwania DeepSeek
DeepSeek rozwija swoją technologię w warunkach ograniczeń dostępu do zaawansowanych półprzewodników, które wynikają z sankcji nałożonych przez Stany Zjednoczone na chiński sektor technologiczny. Pomimo tych restrykcji, DeepSeek opracował model, który przyciągnął uwagę specjalistów z branży – pisze dziennik „South China Morning Post”.
Według starszego naukowca w firmie Nvidia Jima Fana, przypadek DeepSeek pokazuje możliwość realizacji zaawansowanych projektów przy wykorzystaniu ograniczonych zasobów. W poście opublikowanym na platformie społecznościowej X wskazał on na znaczenie innowacyjnego podejścia w warunkach ograniczeń finansowych i technologicznych.
DeepSeek V3 został opracowany jako projekt open-source, co oznacza, że jego kod źródłowy jest dostępny publicznie. Pozwala to programistom na modyfikację i dostosowywanie modelu do różnych zastosowań oraz na dalszy rozwój technologii.
Model został opracowany z wykorzystaniem zoptymalizowanych technik trenowania, co umożliwiło zmniejszenie kosztów infrastruktury obliczeniowej. Proces szkolenia wymagał znacznie mniejszej liczby procesorów graficznych niż projekty realizowane przez duże korporacje technologiczne
Jaką przyszłość ma DeepSeek?
Przede wszystkim, rozmawiając o rozwoju tej firmy jak i jej podobnych projektów, warto pamiętać o rywalizacji na polu rozwoju sztucznej inteligencji pomiędzy Chinami i USA.
Jest to dziś, w początku 2025 r., jeden z kluczowych elementów globalnego krajobrazu technologicznego. Oba kraje inwestują znaczne środki w rozwój tej dziedziny, koncentrując się na zastosowaniach komercyjnych, wojskowych i strategicznych.
Chiny stawiają na wspieranie zarówno rodzimych czempionów, jak i lokalnych startupów, takich jak DeepSeek, oraz rozwój infrastruktury obliczeniowej. Z kolei USA dominują w zakresie dostępu do zaawansowanych technologii półprzewodnikowych i globalnego ekosystemu współpracy badawczej.
Sankcje i ograniczenia w handlu technologiami dodatkowo zaostrzają tę rywalizację, przyczyniając się do dynamicznego rozwoju alternatywnych rozwiązań technologicznych po obu stronach – ale i np. do zwiększenia intensywności działań cyberszpiegowskich.