DeepSeek. Chiński startup buduje otwartoźródłową AI

DeepSeek to chiński startup, który w rozwoju dużych modeli językowych postawił na open source. Głównymi zaletami jego rozwiązań mają być ekonomiczny koszt i duża wydajność w porównaniu z innymi graczami rynku.

przezTECHSPRESSO.CAFE

07/01/2025

2 minute read

Fot. vackground.com / Unsplash

DeepSeek to chiński startup, który w rozwoju dużych modeli językowych postawił na open source. Głównymi zaletami jego rozwiązań mają być ekonomiczny koszt i duża wydajność w porównaniu z innymi graczami rynku.

DeepSeek to chiński startup, który w rozwoju dużych modeli językowych postawił na open-source. Głównymi zaletami jego rozwiązań mają być ekonomiczny koszt i duża wydajność w porównaniu z innymi graczami rynku.

Charakterystyka modelu DeepSeek V3

Model, który spółka wypuściła na rynek – DeepSeek V3 – posiada 671 miliardów parametrów i został wytrenowany w ciągu dwóch miesięcy. Koszt tego przedsięwzięcia wyniósł 5,58 miliona dolarów, co stanowi stosunkowo niską kwotę w porównaniu do projektów realizowanych przez inne firmy z branży, takie jak OpenAI czy Meta Platforms. Parametry modelu wskazują na jego zdolność do analizy skomplikowanych danych i generowania precyzyjnych odpowiedzi.

Wyzwania DeepSeek

DeepSeek rozwija swoją technologię w warunkach ograniczeń dostępu do zaawansowanych półprzewodników, które wynikają z sankcji nałożonych przez Stany Zjednoczone na chiński sektor technologiczny. Pomimo tych restrykcji, DeepSeek opracował model, który przyciągnął uwagę specjalistów z branży – pisze dziennik „South China Morning Post”.

Według starszego naukowca w firmie Nvidia Jima Fana, przypadek DeepSeek pokazuje możliwość realizacji zaawansowanych projektów przy wykorzystaniu ograniczonych zasobów. W poście opublikowanym na platformie społecznościowej X wskazał on na znaczenie innowacyjnego podejścia w warunkach ograniczeń finansowych i technologicznych.

https://twitter.com/DrJimFan/status/1872436577181614521

DeepSeek V3 został opracowany jako projekt open-source, co oznacza, że jego kod źródłowy jest dostępny publicznie. Pozwala to programistom na modyfikację i dostosowywanie modelu do różnych zastosowań oraz na dalszy rozwój technologii.

Model został opracowany z wykorzystaniem zoptymalizowanych technik trenowania, co umożliwiło zmniejszenie kosztów infrastruktury obliczeniowej. Proces szkolenia wymagał znacznie mniejszej liczby procesorów graficznych niż projekty realizowane przez duże korporacje technologiczne

Jaką przyszłość ma DeepSeek?

Przede wszystkim, rozmawiając o rozwoju tej firmy jak i jej podobnych projektów, warto pamiętać o rywalizacji na polu rozwoju sztucznej inteligencji pomiędzy Chinami i USA.

Jest to dziś, w początku 2025 r., jeden z kluczowych elementów globalnego krajobrazu technologicznego. Oba kraje inwestują znaczne środki w rozwój tej dziedziny, koncentrując się na zastosowaniach komercyjnych, wojskowych i strategicznych.

Chiny stawiają na wspieranie zarówno rodzimych czempionów, jak i lokalnych startupów, takich jak DeepSeek, oraz rozwój infrastruktury obliczeniowej. Z kolei USA dominują w zakresie dostępu do zaawansowanych technologii półprzewodnikowych i globalnego ekosystemu współpracy badawczej.

Sankcje i ograniczenia w handlu technologiami dodatkowo zaostrzają tę rywalizację, przyczyniając się do dynamicznego rozwoju alternatywnych rozwiązań technologicznych po obu stronach – ale i np. do zwiększenia intensywności działań cyberszpiegowskich.

Dodaj komentarz Anuluj pisanie odpowiedzi

Powiązane teksty

Czatboty będą same do nas pisać / Fot. Mariia Shalabaieva / Unsplash

Czytaj dalej

Niechciane wiadomości od czatbotów? Meta twierdzi, że to świetny plan

Meta pracuje nad nową funkcjonalnością platformy AI. Czatboty tworzone w oparciu o sztuczną inteligencję koncernu mają same pisać do użytkowników w popularnych komunikatorach, takich jak Messenger czy WhatsApp.

przezTECHSPRESSO.CAFE

Huawei idzie w samowystarczalność technologiczną

Czytaj dalej

HarmonyOS Next. Huawei rozstaje się z Linuksem

Kolejna wersja systemu HarmonyOS koncernu Huawei będzie oznaczała rozstanie się z ekosystemem Linuksa. Firma twierdzi, że zbudowała własne jądro systemu, które ma działać wydajniej, niż Linux - m.in. w zakresie zarządzania pamięcią.

przezTECHSPRESSO.CAFE

Czytaj dalej

Chiny zachęcają swoich gigantów, by byli filarami samowystarczalności

Chiny zachęcają swoje największe przedsiębiorstwa, by były „filarami” samowystarczalności, która jest celem gospodarczym Pekinu w erze nowej zimnej wojny z Zachodem. Rolę „filarów” mają w tej koncepcji pełnić przedsiębiorstwa państwowe.

przezGosia Fraser

Czytaj dalej

Meta chce wciągnąć dzieci do VR mimo coraz większej krytyki i ostrożności

Meta (Facebook) chce, aby z wirtualnej rzeczywistości mogły korzystać już dziesięcioletnie dzieci. Ma służyć temu urządzenie Meta Quest. Koncern zdaje się nie zauważać rosnącej krytyki i sceptycyzmu wokół swoich działań i uzależnienia najmłodszych od technologii cyfrowych.

przezGosia Fraser

Ostatnio dodane:

Indie biorą suwerenność technologiczną na serio. Co za tym stoi?

Europa ugina się pod presją Trumpa i klęka przed Big Techami

Cyfrowy Omnibus. Kontrowersje i zmiany w ochronie danych

Minister obrony Włoch chce nowej jednostki do przeciwdziałania wojnie hybrydowej

DeepSeek. Chiński startup buduje otwartoźródłową AI

Charakterystyka modelu DeepSeek V3

Wyzwania DeepSeek

Jaką przyszłość ma DeepSeek?

Dodaj komentarz Anuluj pisanie odpowiedzi