DeepSeek, la start-up cinese fondata nel 2023, ha sconvolto il mercato globale con il lancio di un modello di IA avanzato ed economicamente competitivo. Con un approccio open-source, costi di sviluppo ridotti e prestazioni eccezionali, DeepSeek ha destabilizzato le big tech occidentali e causato un calo record nelle borse. Mentre le azioni Nvidia crollano, le preoccupazioni su censura e privacy alimentano il dibattito globale sulla leadership nellโIA.
DeepSeek: la start-up che ha sconvolto il mondo
Fondata nel 2023 a Hangzhou da Liang Wenfeng, DeepSeek รจ rapidamente salita alla ribalta grazie a un approccio open-source e a costi di sviluppo incredibilmente bassi. Il modello DeepSeek-R1 ha messo in discussione la leadership delle Big Tech occidentali, dimostrando che prestazioni avanzate possono essere ottenute con risorse limitate, rendendo la startup un caso unico nel panorama globale dellโintelligenza artificiale.
A differenza di OpenAI o Google, che utilizzano chip di ultima generazione come gli Nvidia H100, DeepSeek ha dimostrato che รจ possibile ottenere risultati simili utilizzando hardware meno avanzato. DeepSeek-V3 รจ stato addestrato con soli 6 milioni di dollari, una frazione delle risorse impiegate dai competitor statunitensi, mostrando che efficienza e innovazione possono battere i grandi budget.
ร interessante notare che DeepSeek rappresenta un cambio di paradigma nello sviluppo dellโIA. Invece di concentrarsi sullโaumento della potenza di calcolo, DeepSeek si รจ focalizzata sullโefficienza nellโaddestramento e nellโinferenza, aprendo la strada a risultati superiori con un utilizzo piรน oculato delle risorse .
La storia di DeepSeek
- Novembre 2023:
- DeepSeek Coder: Il primo modello, DeepSeek Coder, รจ stato reso disponibile gratuitamente per ricercatori e utenti commerciali. Il codice del modello รจ stato reso open-source con licenza Mit.
- DeepSeek LLM: Con 67 miliardi di parametri, DeepSeek Llm รจ stato sviluppato per competere con altri Llm disponibili al momento, con prestazioni vicine a quelle di Gpt-4.
- Maggio 2024:
- DeepSeek-V2: Piรน economico dei suoi concorrenti, con un prezzo di 2 RMB per ogni milione di token di output.
- Dicembre 2024:
- DeepSeek-V3: Con 671 miliardi di parametri, DeepSeek-V3 รจ stato addestrato in circa 55 giorni a un costo di 5,58 milioni di dollari, utilizzando significativamente meno risorse rispetto ai suoi pari. Prima delle restrizioni allโesportazione di chip imposte dagli Stati Uniti, DeepSeek รจ riuscita ad accumulare circa 10.000 chip Nvidia H100 per lโaddestramento dei suoi modelli.
- Gennaio 2025:
- DeepSeek-R1: Un modello di ragionamento migliorato che afferma di superare gli standard attuali su diversi compiti cruciali . Il rilascio di R1 durante lโinsediamento del presidente Trump รจ stato un momento strategico, volto a mettere in discussione la fiducia del pubblico nella leadership degli Stati Uniti nel campo dellโIA .
Il debutto di DeepSeek ha avuto un impatto immediato sui mercati globali. Nel pre-market, le azioni Nvidia sono scese del 12%, registrando il peggior calo giornaliero della sua storia in termini di capitalizzazione (il che potrebbe tradursi in una riduzione del valore di mercato di oltre 400 miliardi di dollari). Anche Meta, Microsoft e Alphabet hanno subito perdite significative. Il Nasdaq 100 ha perso oltre il 2,6%, mentre in Europa i listini sono stati trascinati al ribasso dai tecnologici e dai semiconduttori.
Cina vs Stati Uniti: un cambio di paradigma tecnologico
DeepSeek non rappresenta solo una sfida economica, ma anche geopolitica. Mentre gli Stati Uniti limitano lโaccesso cinese ai chip piรน avanzati, DeepSeek ha dimostrato che tali restrizioni non fermano lโinnovazione. ร importante notare che le restrizioni allโesportazione di chip imposte dagli Stati Uniti hanno un impatto maggiore sullโecosistema dellโIA nel suo complesso piuttosto che sui singoli cicli di addestramento. Con un modello open-source, infatti, la start-up ha potuto sviluppare tecnologie competitive sfruttando la collaborazione internazionale e superando i limiti delle sanzioni statunitensi. DeepSeek offre il suo modello gratuitamente agli utenti individuali e addebita solo 0,14 dollari per milione di token agli sviluppatori (quando la Api di OpenAI, per la medesima quantitร di token, ne chiede 15 di dollari).
Nonostante il successo, DeepSeek deve affrontare critiche legate alla censura governativa e alla gestione dei dati degli utenti. Il chatbot si rifiuta di rispondere a domande sensibili, come quelle relative a Piazza Tienanmen, mentre la politica sulla privacy consente la condivisione dei dati raccolti con il governo cinese. Questi aspetti sollevano dubbi sulla trasparenza e sullโaffidabilitร della piattaforma ma altrettanto si potrebbe dire per le IA occidentali. Lโascesa di DeepSeek mette in luce un confronto tra due modelli di sviluppo: lโopen-source, trasparente e collaborativo, contro il modello chiuso e proprietario delle Big Tech americane. Yann LeCun, celebre esperto di IA di Meta, ha sottolineato lโimportanza della ricerca aperta, evidenziando come DeepSeek abbia beneficiato dellโaccesso alle tecnologie open-source come PyTorch e Llama.
Una sfida inaspettata per la Silicon Valley
DeepSeek rappresenta una sveglia per la Silicon Valley, costringendo le aziende occidentali a ripensare le loro strategie. La combinazione di efficienza, accessibilitร e innovazione della startup cinese sta ridefinendo la competizione globale nellโIA. DeepSeek ha scosso il mercato azionario dimostrando che รจ possibile sviluppare modelli di IA potenti ed efficienti a costi inferiori rispetto ai concorrenti occidentali. Questo ha portato gli investitori a rivalutare le prospettive di crescita e le valutazioni delle aziende di IA statunitensi, innescando un calo significativo dei titoli tecnologici.
Tuttavia, per mantenere il suo slancio, DeepSeek dovrร affrontare le sfide legate alla privacy, alla censura e alla crescente competizione tecnologica internazionale nonchรฉ ai sempre piรน corposi finanziamenti di cui godranno le IA occidentali come il progetto Stargate da 100 e piรน miliardi di dollari.
DeepSeek | IA occidentali | |
Costo di sviluppo | $5.6 milioni per DeepSeek-V3 | Miliardi di dollari |
Approccio | Open-source | Proprietario |
Efficienza | Alta, utilizza solo il 6% dei parametri | Bassa, richiede piรน risorse |
Capacitร di ragionamento | Avanzate, paragonabili a OpenAI o1 | Avanzate |
Gestione del contesto | Supporta fino a 128.000 token | Generalmente inferiore |
Apprendimento | Apprendimento per rinforzo (RL) puro | Principalmente apprendimento supervisionato |
Attenzione | Multi-Head Latent Attention (MLA) | Vari meccanismi di attenzione |
Framework etico | Confuciano-benthamita | Vari framework etici |
Prezzo API | $0.14 per milione di token per gli sviluppatori | Piรน costoso, ad esempio $15 per milione di token per OpenAI |
Impatto sul mercato | Dirompente, ha causato cali azionari | Consolidato |
Cultura aziendale | Piatta, focalizzata sullโautonomia e la collaborazione | Tipicamente gerarchica e competitiva |
***** lโarticolo pubblicato รจ ritenuto affidabile e di qualitร *****
Visita il sito e gli articoli pubblicati cliccando sul seguente link