OpenAI ha appena annunciato il programma Pioneers, un'iniziativa volta a promuovere l'applicazione dell'intelligenza artificiale in situazioni reali. Il programma si concentra sul miglioramento del modo in cui vengono valutati i modelli di intelligenza artificiale, poiché sviluppatori e aziende si affidano sempre più ai benchmark per selezionare e ottimizzare i modelli appropriati.
La mossa arriva dopo che Meta è stata accusata di aver manipolato il benchmark LMArena per migliorare la classifica del suo modello Llama 4. L'obiettivo del programma Pioneers è collaborare con le aziende e i ricercatori di OpenAI per sviluppare standard di valutazione che rispecchino le sfide del mondo reale, anziché limitarsi a competere per i punteggi in classifica.
Secondo OpenAI, le aziende selezionate riceveranno supporto diretto dai loro team di ricerca, concentrandosi su due obiettivi principali:
- Creare parametri di riferimento per ciascun campo : sviluppare metodi di valutazione separati per ogni campo (diritto, finanza, medicina, assicurazioni, contabilità).
- Ottimizza l'addestramento dei modelli : sviluppa modelli di intelligenza artificiale approfonditi che affrontino i tre casi d'uso aziendali più importanti.
OpenAI sottolinea che attualmente non esiste uno standard comune per misurare le prestazioni dell'intelligenza artificiale in molti di questi ambiti, il che comporta difficoltà nel valutare o migliorare equamente i modelli. Lavorando direttamente, l'azienda spera di definire chiaramente "cosa è efficace" in ogni settore e di pubblicare questi criteri affinché la comunità possa applicarli.
Per quanto riguarda l'ottimizzazione del modello, le aziende partecipanti saranno supportate nell'addestramento di versioni personalizzate dell'intelligenza artificiale utilizzando il Reinforcement Fine-Tuning (RFT), un metodo OpenAI per creare modelli "esperti" che eccellono in una serie ristretta di attività. Si prevede che questi modelli siano pronti per l'impiego su larga scala.
Per quanto riguarda la roadmap di implementazione, la prima fase si concentrerà principalmente su un gruppo di startup selezionate in base all'impatto effettivo del prodotto. OpenAI sta dando priorità ai team che affrontano problemi specifici in cui l'intelligenza artificiale avanzata può fare una differenza tangibile. Parallelamente, in futuro si prevede un'espansione verso grandi aziende e settori più complessi.