Intel aggiorna il driver NPU per migliorare i carichi IA

Intel aggiorna il driver NPU per migliorare i carichi IA

Intel apporta una nuova serie di patch volte a migliorare il carico di lavoro IA nelle NPU dei processori Meteor Lake e i futuri Panther Lake.
Intel aggiorna il driver NPU per migliorare i carichi IA
Intel apporta una nuova serie di patch volte a migliorare il carico di lavoro IA nelle NPU dei processori Meteor Lake e i futuri Panther Lake.

A seguito della patch rilasciata dall’azienda di Santa Clara, per il supporto riguardo le prossime NPU di quinta generazione che saranno integrate nei futuri processori Panther Lake, Intel ha anche rilasciato una nuova serie di patch che ha l’obiettivo di apportare diversi miglioramenti per l’attuale driver NPU, al fine di aumentare le prestazioni per quanto riguarda i carichi di lavoro che interessano l’intelligenza artificiale.

Intel: capacità di gestire carichi di lavoro più grandi con le nuove patch per le NPU

Le nuova patch pubblicate da Intel consentono ora al driver di gestire meglio i carichi e aumentare le prestazioni con carichi di lavoro IA più grandi e impegnativi. Le modifiche riguardano nello specifico la rimozione del supporto del motore di copia, non più usato e deprecato, oltre a migliori prestazioni di open() attraverso le tabelle di pagina MMU con allocazione differita e correzioni per quanto riguarda la gestione degli errori. L’aumento della capacità del carico di lavoro sulla NPU comporta anche un’estensione degli intervalli degli indirizzi VPU.

Poiché il motore di copia è ora stato deprecato direttamente dal firmware, questo non è più utilizzabile e non sarà più supportato. Tutte le funzionalità del motore di copia sono state integrate direttamente nel motore di calcolo.

Intel

Tornando alla capacità di eseguire carichi di lavoro più grandi con la NPU, Intel ha aumentato l’intervallo di indirizzi DMA incrementandoli fino a 128GB nelle CPU Meteor Lake, per via delle limitazioni MMU, mentre sulle altre generazioni di NPU l’incremento sale a 256GB. Vengono poi uniti gli intervalli utente e DMA su 40xx e generazioni superiori, così da rendere possibile l’accesso completo a 256GB di memoria sia da FW che da DMA. L’intervallo utente viene infine aumentato.

Un’altra patch, infine, sposta l’allocazione del buffer di prelazione secondario all’intervallo DMA, in modo da consentire l’allocazione di più code di comando con buffer di prelazione senza che venga esaurito l’intervallo di indirizzi.

Le recenti patch Intel dovrebbero essere implementate a breve nel kernel Linux. Tutti i dettagli sono consultabili nella pagina dedicata.

Link copiato negli appunti

Ti potrebbe interessare

Pubblicato il
18 ott 2024
Link copiato negli appunti