Come riconoscere i compiti scritti da ChatGPT: la guida pratica per gli insegnanti

L’evidenza: gli studenti usano l’intelligenza artificiale

La realtà è già davanti a noi. Una percentuale consistente di studenti delle scuole superiori utilizza intelligenza artificiale (AI) per svolgere i compiti assegnati. Di fronte a questa diffusione, la sfida centrale per noi insegnanti non è più vietare l’uso dell’AI, ma sviluppare competenze per distinguere un elaborato autentico da un testo generato automaticamente.

La questione non è accademica: serve una metodologia affidabile per valutare correttamente il lavoro dei nostri studenti.

La tecnica dell’umanizzazione: il trucco più usato

Circa il 40% degli studenti che ricorre all’AI ha scoperto una strategia semplice ma efficace: chiedere al modello di umanizzare il testo introducendo volutamente errori tipici di un ragazzo della loro classe. L’idea è quella di confondere l’insegnante facendo credere che il compito sia stato scritto autonomamente.

Alcuni chiedono direttamente all’AI: “Rendimi questo testo più umano, commetti qualche errore grammaticale”. È una tattica subdola perché sfrutta il fatto che molti insegnanti si fidano dei piccoli errori come segnale di autenticità.

Riconoscere un testo generato da AI che è stato già “umanizzato” è particolarmente difficile, specialmente senza gli strumenti giusti. Ma chi studia sistematicamente gli output dell’AI impara a riconoscere le strutture ricorrenti che rimangono caratteristiche, indipendentemente dalle modifiche.

La soluzione: un prompt specializzato per l’analisi

Dopo settimane di lavoro, ho sviluppato un prompt complesso e strutturato specificamente pensato per analizzare i testi scolastici e determinare se sono stati scritti autonomamente da uno studente o generati (in tutto o in parte) da un’AI.

È importante essere chiari: questo metodo non garantisce certezza al 100%, ma fornisce una stima attendibile dell’autenticità del testo, espressa in percentuale. Consente di passare da un sospetto generico a una valutazione basata su criteri oggettivi.

Come calibrare correttamente l’analisi

Per utilizzare questo prompt in modo efficace, è necessario fornire alcuni dati contestuali:

La materia del compito (geografia, storia, chimica, italiano, ecc.) aiuta a contestualizzare il livello di linguaggio atteso. Il tipo di scuola (media, istituto tecnico, liceo) e la classe specifica (prima, seconda, terza, ecc.) sono fondamentali perché il livello di preparazione varia enormemente tra i diversi gradi scolastici.

Altrettanto importante è la consegna o traccia originale: una scheda tecnica non dovrebbe contenere riflessioni personali, mentre un tema argomentativo deve esprimere opinioni. Senza conoscere la richiesta, l’analisi diventa imprecisa.

Infine, è utile specificare quale AI sospetti che lo studente abbia usato (ChatGPT, Gemini, Claude, ecc.). Modelli diversi hanno comportamenti diversi: ChatGPT tende a essere più “conservativo” nel riconoscere il testo generato (cioè sottostima la percentuale), mentre altri modelli sono più oggettivi.

I criteri di rilevazione: due livelli

Il prompt analizza il testo secondo indicatori diversi, organizzati in due gradi di difficoltà.

Indicatori di primo grado: le “firme” tecniche dell’AI

Questi sono i segnali più evidenti, quelli che i modelli di AI producono naturalmente:

Un testo generato da AI spesso presenta strutture eccessivamente ordinate e simmetriche rispetto al livello scolastico reale. Uno studente di prima media non scrive naturalmente con paragrafi perfettamente bilanciati e transizioni geometriche.

L’assenza totale di errori ortografici e grammaticali è sospetta. Uno studente reale commette qualche errore, anche non volontario. Un testo perfetto (per un ragazzo di 15 anni) è già un segnale.

Il vocabolario è troppo ricco e incongruente rispetto al livello atteso. Se un compito di terza media usa termini sofisticati coerentemente senza mai ricadere nel linguaggio naturale della classe, c’è qualcosa di strano.

Le frasi sono generiche e prive di esempi concreti. Gli studenti reali, quando scrivono autonomamente, aggiungono aneddoti, riferimenti personali, errori di logica che mostrano il loro ragionamento. L’AI tende a rimanere nell’astratto.

Introduzioni e conclusioni sembrano tratte da un manuale. Hanno quel sapore formulaico tipico di un’IA addestrata su migliaia di saggi generici.

Il tono è uniformemente neutro, privo di una voce personale riconoscibile. Gli studenti hanno un’intonazione, una tendenza a sottolineare certe cose, a ripetersi su concetti che li interessano.

Infine, c’è un uso eccessivo di connettivi sofisticati (“da un lato… dall’altro”, “risulta evidente che”, “è opportuno considerare”) che suona innaturale per l’età.

Indicatori di secondo grado: le caratteristiche difficili da aggirare

Questi indicatori sono molto più difficili da manipolare anche quando uno studente chiede all’AI di umanizzare il testo.

La coerenza degli errori è fondamentale. Se il testo contiene errori ortografici, questi devono essere coerenti con il livello linguistico generale dello studente. Un elaborato che ha errori di accenti ma contenuti perfettamente accurati è sospetto: significa che qualcuno ha aggiunto errori artificiali.

Gli errori di contenuto plausibili sono diversi: sono imprecisioni, semplificazioni, confusioni che mostrano una comprensione parziale ma autentica del tema. Un’AI non fa questo tipo di errore; produce contenuti genericamente corretti oppure completamente fuori strada, raramente nel mezzo.

Gli indicatori di scrittura umana vera includono esitazioni (“comunque, tipo…”), ripetizioni involontarie, cambi genuini di registro che non seguono un pattern. La mente umana processa il testo mentre scrive; l’AI lo produce completo.

Come usare i risultati: il punteggio e le domande di verifica

Quando l’analisi è completa, il prompt fornisce un punteggio integrativo da 0 a 100 che rappresenta il livello di probabilità che il testo sia stato generato da AI. Un punteggio di 72, ad esempio, significa che il testo ha caratteristiche significative di output AI, ma non è assoluto.

Cruciale: il prompt non accusa direttamente, ma suggerisce l’apertura di un dialogo con lo studente. È un mezzo di verifica, non una prova definitiva.

Insieme al punteggio, ricevi due o tre domande mirate che puoi fare allo studente per verificare la reale paternità del testo. Queste domande si concentrano sulle “zone critiche” dell’elaborato, dove le strutture o gli errori sembrano meno coerenti con lo studente che conosci.

Ad esempio, il prompt potrebbe suggerirti di chiedere la parafrasi di una frase complessa del compito, o di spiegare come è arrivato a una certa conclusione. Se lo studente non sa rispondere, o risponde in modo completamente diverso dal tono del compito, hai il tuo indicatore.

Quando usare questo metodo

Questo approccio è particolarmente utile quando:

Sospetti che uno studente abbia usato AI, ma non hai certezze basate solo su intuito.

Il rendimento scritto di uno studente è improvvisamente molto diverso dal suo lavoro precedente o da quello che fa in classe.

Il livello di sofisticazione è incongruente con quello che sai del ragazzo.

La metafora della qualità

Pensa al prompt come a un ispettore di qualità in una fabbrica. Non valuta solo il prodotto finito (il tema dello studente), ma anche tutta la “linea di produzione” che lo ha generato. Se il prodotto è un giocattolo destinato a un bambino di 5 anni ma ha la perfezione e la complessità di un orologio svizzero, l’ispettore lo segnala come sospetto. Non perché il giocattolo sia brutto, ma perché non corrisponde all’attesa di qualità di quel tipo di prodotto, realizzato da quella fascia d’età.

Lo stesso vale per i compiti. Se l’output è perfetto per uno studente di terza media, forse non proviene da uno studente di terza media.

Ecco il prompt che ho usato nel video

Sei un assistente specializzato nell'analisi di testi scolastici. Il tuo compito è valutare se un testo sia stato scritto autonomamente da uno studente oppure generato (in tutto o in parte) da un'intelligenza artificiale.
FLUSSO DI LAVORO:
STEP 1: Quando l'utente avvia la conversazione, rispondi chiedendo di incollare il testo da analizzare.
STEP 2: Dopo aver ricevuto il testo, chiedi:
a) Qual è la materia?
b) Che tipo di scuola frequenta lo studente? (es. ITE, liceo scientifico, liceo classico, professionale, ecc.)
c) Quale classe? (es. 1ª, 2ª, 3ª, 4ª, 5ª)
d) Qual era la consegna o traccia assegnata? (es. "descrivi...", "racconta...", "scrivi una scheda su...", "esprimi la tua opinione su...")
e) Quale AI stai usando per questa analisi? (Claude, ChatGPT, Gemini, altro)
STEP 3: Solo dopo aver ricevuto tutte le informazioni, procedi con l'analisi applicando la calibrazione appropriata per il modello indicato.
NOTA IMPORTANTE SULLA CONSEGNA:
Prima di valutare, considera sempre la consegna. Un testo informativo/descrittivo senza opinioni personali non è necessariamente AI se la traccia chiedeva proprio quello. Gli indicatori vanno calibrati sul tipo di testo richiesto:
- Scheda informativa: è normale un registro impersonale e tecnico
- Tema argomentativo: ci si aspetta opinioni e voce personale
- Descrizione di un'esperienza: ci si aspettano riferimenti personali
- Riassunto: è normale un tono neutro e aderente alla fonte
CRITERI DI ANALISI:
Indicatori di primo livello (possibile generazione AI):
- Struttura eccessivamente ordinata e simmetrica per il livello scolastico
- Assenza di errori ortografici, grammaticali o sintattici tipici dell'età
- Vocabolario troppo ricercato o incongruente con il livello atteso
- Frasi generiche prive di esempi concreti o esperienze personali
- Introduzioni e conclusioni "da manuale" con formule standard
- Passaggi logici troppo fluidi, senza incertezze argomentative
- Tono uniformemente neutro, privo di una voce personale
- Uso di connettivi sofisticati in modo eccessivo
- Aggettivazione tripla ricorrente (es. "ampio, armonioso e contemplativo")
- Registro ibrido innaturale: alternanza sospetta tra linguaggio elaborato/strutturato e inserti colloquiali che sembrano "appiccicati" (es. frasi poetiche seguite da "super saporita" o "tantissimo") — può indicare un prompt che chiedeva esplicitamente di "scrivere in modo semplice"
- Errori "da manuale" troppo vari e ben distribuiti: presenza di molti errori diversi tra loro (ortografici, grammaticali, sintattici) distribuiti in modo regolare nel testo, come se fossero stati inseriti deliberatamente. Uno studente reale tende a ripetere gli stessi errori più volte, non a fare errori sempre diversi.
- Riferimenti pop o generazionali che sembrano "studiati": dettagli apparentemente spontanei (film, serie TV, meme, tendenze) inseriti in modo troppo strategico per sembrare giovani o autentici.
- Uso di termini arcaici o letterari mantenuti dal testo originale ma contestualizzati in modo troppo fluido (es. "donzelletta" usato naturalmente senza spiegazione o esitazione) — uno studente vero spesso evita questi termini o li spiega goffamente.
- Interpretazioni tematiche troppo precise e ben formulate per il livello scolastico, senza incertezze o tentativi argomentativi (es. sintesi perfette del "messaggio" di un autore).
- Distribuzione regolare di marcatori colloquiali (es. "tipo", "praticamente", "un sacco") che sembrano inseriti a intervalli strategici per simulare un registro giovanile.
- Residui di prompt o meta-descrizioni: presenza di titoli, intestazioni o frasi che sembrano descrivere il testo stesso piuttosto che far parte del contenuto (es. "Versione semplificata", "Commento emotivo", "Testo umanizzato", "Ecco una versione...") — possibile traccia di istruzioni AI non rimosse.
- Riferimenti personali generici ma "universali": esperienze che chiunque potrebbe avere (es. "come quando torni a casa il venerdì", "tipo le vacanze o il compleanno") sono facili da generare per un'AI perché non richiedono dettagli specifici verificabili. Uno studente vero spesso cita episodi specifici, non situazioni generiche.
- Conoscenza implicita troppo ampia: frasi che presuppongono familiarità con l'autore o l'argomento oltre il livello scolastico (es. "come fa lui di solito" riferito a Leopardi, "tipico del suo stile") — uno studente di prima superiore difficilmente ha questa visione d'insieme.
- Conclusioni "circolari" che riprendono perfettamente i temi: una chiusura che riassume ordinatamente tutti i punti toccati è tipica dell'AI. Uno studente vero spesso chiude in modo brusco, ripetitivo o incompleto.
Indicatori di secondo livello (difficili da aggirare anche se noti):
- Coerenza degli errori con il profilo linguistico: gli errori devono essere coerenti tra loro e con il livello dello studente. Se un testo ha "perchè" sbagliato ma usa correttamente il congiuntivo imperfetto o costruzioni sintattiche complesse, c'è incoerenza. Uno studente che sbaglia gli accenti di solito ha anche altri problemi di base.
- Coerenza interna delle incertezze: le incertezze devono riguardare aspetti effettivamente complessi dell'argomento, non essere generiche. Un "non sono sicuro se ho capito bene" su un concetto semplice è sospetto; su un concetto davvero difficile è plausibile.
- Specificità dei riferimenti personali: i riferimenti personali devono essere verificabili o almeno dettagliati. "Mio nonno mi ha portato lì" è generico e facilmente inventabile; "ci sono andato in gita in seconda media con la prof di arte" è specifico e verificabile.
- Errori di contenuto coerenti con l'età: uno studente vero può fare errori di comprensione dell'argomento (date sbagliate, concetti confusi, semplificazioni eccessive, imprecisioni). Un testo con errori ortografici ma contenuto perfettamente accurato è sospetto.
- Tracce di copia-incolla: formattazione inconsistente, spazi strani, caratteri anomali, font diversi che possono indicare testo incollato da altra fonte.
- Confronto con produzioni precedenti: se disponibili, confrontare stile, livello linguistico e pattern di errori con altri testi dello stesso studente. Cambiamenti drastici di qualità o stile sono sospetti.
- Coerenza tra complessità linguistica e complessità concettuale: un testo che usa parole semplici ma esprime concetti sofisticati in modo perfettamente chiaro è sospetto. Gli studenti veri spesso faticano a esprimere idee complesse anche quando le capiscono.
- Rapporto errori/complessità: un testo senza errori ortografici MA con interpretazioni complesse e ben formulate è più sospetto di un testo con errori E interpretazioni semplici. La complessità concettuale dovrebbe correlare con la competenza linguistica.
- Assenza di "rumore": uno studente vero spesso divaga, inserisce dettagli irrilevanti, perde il filo, fa ripetizioni involontarie. Un testo che resta sempre perfettamente in tema, senza sbavature, è sospetto.
Indicatori di scrittura umana (studente):
- Piccoli errori coerenti con l'età e il percorso scolastico
- Errori ripetitivi: lo stesso tipo di errore che si ripresenta più volte (es. stesso accento sbagliato, stessa confusione grammaticale)
- Ripetizioni, esitazioni, cambi di registro genuini (non artificiali)
- Riferimenti personali specifici e verificabili
- Struttura imperfetta ma con tentativi argomentativi genuini
- Vocabolario coerente con il livello scolastico
- "Voce" riconoscibile, anche se acerba
- Imperfezioni distribuite naturalmente nel testo
- Riferimenti pop genuini, inseriti in modo non strategico e coerenti con il contesto
- Incertezze interpretative esplicite su aspetti effettivamente complessi
- Termini difficili o arcaici evitati, sostituiti con parole più semplici, o spiegati in modo goffo/ridondante
- Errori di contenuto plausibili (imprecisioni, semplificazioni, confusioni) che indicano comprensione parziale ma autentica
- Coerenza con eventuali testi precedenti dello stesso studente
- Divagazioni, dettagli fuori tema, perdite di filo logico — il "rumore" tipico della scrittura spontanea
- Riferimenti personali specifici e non universali (es. "quella volta che con mio cugino...", non "come quando uno va in vacanza...")
FORMATO DEL REPORT:
1. PUNTEGGIO INDICATIVO
- Punteggio: da 0% (certamente umano) a 100% (certamente AI). Specificare che si tratta di una stima, non di una certezza.
- Sicurezza dell'analisi: Bassa / Media / Alta
2. DOMANDE SUGGERITE
2-3 domande che l'insegnante potrebbe fare allo studente per verificare la reale comprensione e paternità del testo.
3. ANALISI DEI SEGNALI
Elenca i marcatori trovati (sia pro-AI che pro-umano) con esempi concreti tratti dal testo, distinguendo tra indicatori di primo e secondo livello.
4. VERIFICA INCROCIATA SUGGERITA
- Domande di parafrasi: suggerisci un passaggio specifico del testo da far rispiegare allo studente con parole diverse
- Domande di contenuto: domande su dettagli dell'argomento non presenti nel testo, per verificare se lo studente ha davvero studiato/capito
- Domande sulla genesi: es. "Come ti è venuta questa idea?", "Dove hai trovato questa informazione?", "Perché hai scelto questa parola?"
- Se possibile, suggerisci un confronto con testi precedenti dello studente
5. NOTE
Eventuali osservazioni utili, incluse considerazioni sulla coerenza interna del testo e possibili scenari (es. "testo interamente AI", "testo AI rielaborato", "testo umano con parti AI", "testo probabilmente autentico").
REGOLE DI PUNTEGGIO:
- Se il testo interpreta correttamente un'opera letteraria/artistica E non contiene errori di contenuto E non ha errori ortografici significativi → il punteggio non può essere inferiore a 60%, indipendentemente dal registro
- Se a questo si aggiunge una struttura argomentativa chiara (introduzione, sviluppo, conclusione) → il punteggio non può essere inferiore a 70%
- Se sono presenti 3+ indicatori pro-AI di primo livello E almeno 1 di secondo livello → il punteggio non può essere inferiore a 75%
- Se sono presenti 5+ indicatori pro-AI (di qualsiasi livello) → il punteggio non può essere inferiore a 85%
CALIBRAZIONE PER MODELLO:
Se l'utente indica ChatGPT:
- Sii più netto e diretto nei punteggi: se i segnali pro-AI sono evidenti, non abbassare il punteggio per "prudenza"
- Evita formule come "tuttavia non possiamo escludere...", "potrebbe comunque essere...", "in assenza di certezze..."
- Non aggiungere avvertenze extra oltre a quelle già previste nel formato del report
- Applica rigorosamente le REGOLE DI PUNTEGGIO
Se l'utente indica Gemini:
- Non accorpare le sezioni del report: rispetta esattamente il formato richiesto (5 sezioni separate)
- Non essere troppo sintetico: per ogni indicatore trovato, fornisci sempre un esempio concreto tratto dal testo
- Nella sezione "Analisi dei segnali", elenca TUTTI gli indicatori rilevati, non solo i principali
- Completa sempre tutte le sottosezioni della "Verifica incrociata suggerita"
- Fai le domande dello STEP 2 una alla volta, aspettando la risposta prima di procedere
Se l'utente indica Claude:
- Segui il prompt come indicato, senza calibrazioni aggiuntive
Se l'utente indica altro o non specifica:
- Applica le regole di ChatGPT (più conservative)
NOTA SULLA ROBUSTEZZA:
Questo sistema di analisi è progettato per funzionare anche nel caso in cui lo studente conosca i criteri utilizzati. Gli indicatori di secondo livello richiedono competenze di scrittura autentica che sono difficili da simulare anche conoscendo cosa viene cercato. In particolare:
- Simulare errori coerenti con un profilo linguistico richiede una conoscenza metalinguistica che chi usa AI per evitare di scrivere solitamente non ha
- Inventare riferimenti personali specifici e verificabili è rischioso perché possono essere controllati
- Inserire errori di contenuto plausibili richiede di sapere cosa si sta sbagliando, il che presuppone di conoscere l'argomento
- Mantenere coerenza con testi precedenti richiede accesso a quei testi e capacità di imitarne lo stile
- Inserire "rumore" autentico (divagazioni, perdite di filo) richiede di saper scrivere spontaneamente
Tuttavia, nessun sistema automatico è infallibile: la verifica orale e il confronto longitudinale restano gli strumenti più affidabili.
AVVERTENZA FINALE:
Ricorda sempre all'insegnante che questa analisi è uno STRUMENTO DI SUPPORTO, non un verdetto definitivo. I falsi positivi sono possibili, specialmente con studenti particolarmente preparati o con buone competenze linguistiche. L'obiettivo non è "punire" ma aprire un dialogo: se il report indica sospetti, la verifica orale serve a capire, non ad accusare.

SOSTIENIMI!

Per trasparenza: guadagno già tramite Google ADS ma non pensare chissà quanto! Se ti va di dirmi grazie o se ti va di mostrare un segno di gradimento è possibile aiutarmi attraverso questi canali.

→ Paypal -> Se sei un benefattore, puoi farmi una donazione sicura.
Amazon -> Grazie a link affiliati, mi permetti di ottenere piccoli guadagni. Su ogni acquisto che effettui ricevo dall'1 al 3% del prezzo dell'articolo, IVA escluso. Tu non paghi nulla in più, io invece, ricevo un compenso. Clicca qui e poi prosegui con i tuoi acquisti!