Video di YouTube sulla formazione sull’intelligenza artificiale: Apple Intelligence senza dati da “The Pile”

Date:

Share post:

Giampaolo Lettiere
Giampaolo Lettiere
"Esperto di birra per tutta la vita. Appassionato di viaggi in generale. Appassionato di social media. Esperto di zombi. Comunicatore."

Apple Intelligence non è stata addestrata sul database gratuito The Pile, che contiene i sottotitoli per migliaia di video di YouTube senza una richiesta da parte dei loro creatori. L’azienda lo ha annunciato al blog Apple 9to5Mac. L’azienda aveva scritto in un articolo scientifico sui suoi modelli ad alta efficienza della serie OpenELM che era stato utilizzato il set di dati. Tuttavia, OpenELM è esattamente questo Non fa parte dei sistemi di intelligenza artificiale utilizzati dall’aziendainclusa Apple Intelligence o altre tecnologie di machine learning.

annuncio


Secondo il sito web 9to5Mac Apple ha affermato di aver sviluppato OpenELM come contributo alla ricerca sull’intelligenza artificiale e allo sviluppo di modelli linguistici open source. All’epoca, l’azienda descrisse la tecnologia come un “modello di linguaggio aperto all’avanguardia”. Tuttavia, OpenELM è stato sviluppato esclusivamente per scopi di ricerca e non per alimentare funzioni di intelligence per Apple. OpenELM è ancora in circolazione Sul sito web di ricerca sull’intelligenza artificiale di Apple disponibile.

Ci sono state critiche al set di dati di formazione “The Pile”, che proviene dall’organizzazione no-profit EleutherAI In un rapporto di The Proof Di conseguenza, anche altre grandi aziende come Nvidia, Anthropic e Salesforce utilizzano le informazioni. Dovrebbe essere un “mucchio” tra le altre cose Con sottotitoli per 170.000 video di YouTube Mi hanno dato da mangiare. Si dice che non ci sia stata alcuna approvazione per questo.

Non è ancora chiaro esattamente quali e quanti dati di addestramento Apple utilizzi per Apple Intelligence. L’azienda afferma solo di utilizzare “contenuti concessi in licenza, inclusi dati che migliorano funzionalità specifiche”. Tuttavia, ci sono anche dati che Apple stessa sembra aver ottenuto dall’Internet pubblico utilizzando il proprio web crawler.

Per rinunciare, gli operatori del sito web devono istruire un Applebot Extended privato a ignorare il loro contenuto. I siti web continuano ad essere scansionati da AppleBot (che non viene utilizzato per scopi di intelligenza artificiale, ma per altri servizi) anche dopo la disattivazione, se non viene rifiutato contemporaneamente nel file “robots.txt”, scrive. L’azienda è su Apple.com. È noto inoltre che il gruppo non include i dati personali degli utenti o le “interazioni degli utenti” nella formazione. Esistono anche filtri per informazioni sulla carta di credito o “oscenità”, nonché contenuti di bassa qualità, anche se non è chiaro come questi vengano esclusi.


(Laurea triennale)

Related articles