Baidu ha deciso di trasformare la sua piattaforma di machine learning in un progetto open source distribuito su GitHub, iniziativa che arriva un po’ in ritardo su quanto già fatto dalle concorrenti occidentali ma che agli sviluppatori vuole offrire un approccio orientato alla semplificazione del lavoro.
PaddlePaddle o PArallel Distributed Deep LEarning, questo il nome della piattaforma deep learning di Baidu, arriverà su GitHub il prossimo 30 settembre sotto licenza Apache ed è già utilizzata internamente per gestire il ranking nei risultati delle ricerche Web dei netizen cinesi, il riconoscimento e la classificazione delle immagini, OCR, traduzione automatica e advertising .
Diversamente da Google TensorFlow , Microsoft CNTK e altri, PaddlePaddle offrirebbe secondo Baidu la possibilità di ridurre il numero di linee di codice necessarie agli sviluppatori per adattare i propri “task” e obiettivi alla piattaforma base.
La tecnologia cinese vuole insomma ritagliarsi uno spazio in un settore che si fa sempre più affollato, garantendo al contempo tutta una serie di funzionalità avanzate come il supporto agli standard di reti neurali più popolari, l’utilizzo contemporaneo di un gran numero di unità computazionali (CPU e/o GPU) e via elencando.
Anche da Facebook arriva poi una nuova offerta open source, sebbene in questo caso non si parli di IA o di machine learning bensì di compressione dei dati : Zstandard è un nuovo algoritmo di compressione che il social network in blu propone come alternative alle librerie classiche come zlib, un’implementazione che offre miglioramenti soprattutto sul fronte della velocità di compressione.
Zstandard è in grado di ottenere la stessa percentuale di compressione di zlib ma in un quinto del tempo, sostiene Facebook , oppure di ridurre le dimensioni dei file del 10 per cento a parità di tempo. È infine open source anche MyRocks, una tecnologia pensata per migliorare l’archiviazione di dati su database relazionali (MySQL) occupando metà dello spazio su server necessario alle soluzioni concorrenti (InnoDB).
Alfonso Maruccia