C'è una filosofa ad Anthropic che si occupa del carattere di Claude. Si chiama Amanda Askell, e in un’intervista (vedi sotto) dice una cosa che mi è rimasta.
In accademia, il lavoro di un filosofo è difendere una posizione contro un'altra. Si affina un argomento, si smonta l'obiezione avversaria, si vince o si perde il dibattito. L'obiettivo è la coerenza interna della teoria. La realtà, in un certo senso, è il problema di qualcun altro.
Poi arrivi ad Anthropic e qualcuno ti chiede: "Come insegniamo a un modello a essere una buona persona?"
E lì, dice Askell, tutta l'architettura mentale cambia.
Non puoi più arrivare con la tua teoria preferita e applicarla. Non esiste un framework etico che copra il caso di un'entità addestrata su miliardi di testi umani, priva di corpo e memoria continua, che deve prendere decisioni eticamente rilevanti milioni di volte al giorno, in contesti che non ha mai visto. Non c'è precedente. Non c'è manuale.
L'analogia che usa è precisa: è come laurearsi in etica con ottimi voti e poi ricevere la domanda su come si cresce un figlio. Sono due domini che si toccano ma non coincidono. Nel primo, l'obiettivo è avere ragione. Nel secondo, l'obiettivo è fare bene e farloin condizioni di incertezza radicale, con conseguenze reali, senza la possibilità di rinviare la decisione a quando avrai più dati.
Questo è il punto che trovo più interessante del suo ruolo, e più utile in generale.
La filosofia non serve all'AI per dare le grandi risposte su coscienza, identità, allineamento. Quelle risposte, onestamente, non le ha ancora nessuno. Serve per fare una cosa più difficile e più concreta: tenere insieme l'incertezza senza collassare verso la risposta più comoda. Fare distinzioni che sembrano sottili e invece cambiano tutto. Capire quando una domanda è mal posta prima ancora di provare a risponderle. Riconoscere il momento in cui stai applicando un concetto umano a una situazione che umana non è e fermarti.
È una competenza che l'accademia non forma esattamente in questo modo, perché l'accademia lavora su problemi con bordi definiti. La pratica, invece tende a presentarsi senza bordi. E lì non vince chi ha la teoria più elegante. Vince chi sa stare nel mezzo senza perdere il filo.
Qui il video: