Ho provato DeepSeek in locale sul mio PC e...

Reply to Ho provato DeepSeek in locale sul mio PC e... on Fri, 31 Jan 2025 13:51:50 GMT

giorgiotave — Fri, 31 Jan 2025 13:51:50 GMT

@kal ha detto in Ho provato DeepSeek in locale sul mio PC e...:

ADORO che ci scambiamo le specs dei PC come sui forum di appassionati di informatica/gaming nella decade degli anni 2000 quando la domanda era "OK MA CI GIRA CRYSIS"

Reply to Ho provato DeepSeek in locale sul mio PC e... on Fri, 31 Jan 2025 13:46:47 GMT

kal — Fri, 31 Jan 2025 13:46:47 GMT

Fantastico.

Due cose, la prima stupida:

@alepom ha detto in Ho provato DeepSeek in locale sul mio PC e...:

(i7, 16 GB di RAM, RTX 3050Ti)

ADORO che ci scambiamo le specs dei PC come sui forum di appassionati di informatica/gaming nella decade degli anni 2000 quando la domanda era "OK MA CI GIRA CRYSIS"

La seconda cosa un po' più seria: credo ci siano ancora ampissimi margini di ottimizzazione e miglioramento. Non credo di fare una scommessa ardita se dico che la stragrande maggioranza dei pesi nei modelli oggi siano in realtà delle zavorre dovute al fatto che per addestrare i macromodelli si sia preso letteralmente tutto lo scibile umano senza badare alla qualità. Servivano testi e si sono presi, letteralmente, TUTTI i testi. Inclusa roba tipo le trascrizioni dei video che testi non erano ma ce li hanno fatti diventare (firulì Whisper firulà)

Il risultato è che c'è una percentuale più che rilevante di porcheria, che tuttavia pesa sulle risorse di calcolo necessarie per l'inferenza.

Sinceramente mi aspetto molti passi avanti su quest'ambito... anche perché, oramai si è capito, aumentare la scala non porta a modelli più avanzati. O meglio non COSÌ TANTO più avanzati da giustificare la spesa "muscolare".

E quindi largo ai team di ricerca e all'ingegno umano tra matematica teorica e ingegneria del software...

Reply to Ho provato DeepSeek in locale sul mio PC e... on Fri, 31 Jan 2025 13:21:49 GMT

alepom — Fri, 31 Jan 2025 13:21:49 GMT

Grande @kal,
riporto qui anche il mio test, sul quale abbiamo scambiato dei commenti su Linkedin.
Stessa configurazione di modello, ma su un laptop (i7, 16 GB di RAM, RTX 3050Ti).

Eseguo de task: uno di classificazione e uno di sintesi.
Sinceramente, sono molto soddisfatto.
E fa capire che, in locale (o su una struttura personalizzata), con un hardware adeguato, si riescono a creare progetti molto interessanti.