Luca Annunziata

Il pasticciaccio brutto delle fotocopiatrici Xerox

Ci sarebbe un problema di compressione delle immagini all'origine del bug scovato su alcuni modelli della linea WorkCentre. Ma il problema potrebbe non essere isolato. Il produttore indaga

Roma - David Kriesel, Germania, l'ha scoperto per caso: copiando delle planimetrie, degli schemi relativi a degli appartamenti, si è accorto che le cifre riportate sul disegno erano significativamente diverse sull'originale e sulla versione digitalizzata. La faccenda potrebbe essere in circolazione da anni, e le prime indagini sull'accaduto parrebbero condurre verso la compressione utilizzata da Xerox nelle macchine della popolare linea WorkCentre. Ma la questione potrebbe riguardare molti altri modelli e marchi.

una delle tabelle con artefattiNon è questione di OCR, si affretta a precisare Kriesel che ha segnalato il problema a Xerox e ha chiesto aiuto alla Rete per cercare di capire se la sua fosse una scoperta isolata, frutto magari di un problema della sua fotocopiatrice, o se si trattasse invece di una questione generale. Xerox, a dirla tutta, all'inizio non ha preso molto sul serio la faccenda: ma il riscontro ottenuto da David online, unito alla serietà delle indagini da lui condotte, ha convinto l'azienda a prendersi carico del problema e avviare un'indagine per scovare una soluzione.

Stando a quanto dedotto da Kriesel e contribuito dalla Rete, l'origine della cattiva copia delle informazioni risiederebbe nell'algoritmo JBIG2 utilizzato in alcune fotocopiatrici/scanner. In presenza di caratteri piccoli (ad esempio Arial 7-8m nelle prove eseguite) il sistema mal disporrebbe i pixel nell'immagine digitalizzata e compressa per essere trasformata in un PDF. Non di OCR si tratta, di semplice digitalizzazione e compressione in un file: se come output si sceglie un file TIF nessun problema, nel caso si opti per un formato compresso ecco nascere gli artefatti.
Grazie ai contributi e le verifiche pervenute tramite Internet, la lista degli apparecchi affetti dal bug si è allungata: oltre alle WorkCentre 7535 e 7556 controllate dall'autore della scoperta, anche altri modell come la WorkCentre 7530, 7328, 7346, 7545, 7545 e le ColorQube 9201 e 9203 sembrerebbero coinvolte nel problema. Ma qualsiasi apparecchio che impieghi JBIG2 potrebbe essere affetto dai medesimi artefatti nelle copie digitali compresse.

una delle tabelle con artefattiIl problema è tanto più evidente quando Kriesel mostra una tabella di costi digitalizzata con la sua WorkCentre 7535: 65,40 euro diventano 85,40, un problema non da poco in prospettiva di macchine impiegate in ambienti di lavoro. Naturalmente non è escluso che in realtà gli errori possano essere introdotti dall'utilizzo all'interno del software della macchina di un OCR anche quando l'utente lo tiene disabilitato: la natura chiusa dei sorgenti non permette di verificarlo, ma i tecnici Xerox sono al lavoro per tentare di capire cosa stia succedendo. E auspicabilmente saranno in grado di fornire al più presto una patch per gli apparecchi incriminati.

Luca Annunziata
Notizie collegate
  • AttualitàQuegli spioni dei puntini gialliSi nascondono nel testo di molte stampanti laser a colori. EFF sostiene si tratti di un codice segreto del governo USA. Ma compaiono anche nelle stampanti teutoniche. Si indaga
26 Commenti alla Notizia Il pasticciaccio brutto delle fotocopiatrici Xerox
Ordina
  • Il danno è peggio di un danno evidente, perchè potrebbero morire persone per una cosa del genere in ambiente ospedaliero, mentre in altri campi potrebbero esserci ponti che crollano apparecchiature che bruciano, tutto per dati sbagliati che sono stati immessi in circolo in certo momento del processo produttivo.
    I documenti spesso passano da un formato all'altro fogli->pdf->word poi di nuovo stampa->scannerizzazione->pdf->word immaginate la somma degli errori !
    Essendo così occulto il problema i danni si potrebbero essere già verificati basta solo ricostruire la catena degli eventi per accertarlo.
    non+autenticato
  • > Il danno è peggio di un danno evidente, perchè
    > potrebbero morire persone per una cosa del genere
    > in ambiente ospedaliero, mentre in altri campi
    > potrebbero esserci ponti che crollano
    > apparecchiature che bruciano, tutto per dati
    > sbagliati che sono stati immessi in circolo in
    > certo momento del processo
    > produttivo.

    È già successo con i fogli di calcolo Excel di Microsft, nel 2007:
    goo.gl/8nr44s
    Non mi risultano danni o cause in tribunale.
    Capisco la legge di Murphy: se qualcosa può andare storto allora andrà storto, ma talvolta va tutto per la retta via. E non nel senso di via del retto del consumatore. Occhiolino
    non+autenticato
  • - Scritto da: Jimmi Onano
    > > Il danno è peggio di un danno evidente,
    > perchè
    > > potrebbero morire persone per una cosa del
    > genere
    > > in ambiente ospedaliero, mentre in altri
    > campi
    > > potrebbero esserci ponti che crollano
    > > apparecchiature che bruciano, tutto per dati
    > > sbagliati che sono stati immessi in circolo
    > in
    > > certo momento del processo
    > > produttivo.
    >
    > È già successo con i fogli di calcolo Excel
    > di Microsft, nel
    > 2007:
    > goo.gl/8nr44s
    > Non mi risultano danni o cause in tribunale.
    la questione e' pertinente... e in effetti non ricordo cause.

    PERO' M$ spieggo' che il pasticciaccio, anche se brutto, e' soltanto visivo (cio che viene VISUALIZZATO nella cella) ma non internamente.. ergo se quella particolare moltiplicazione era parte di una serie di operazione alla fine il calcolo non ne veniva inficiato.
    Dio sa' cmq quali contorsionismi interni faccia quell'excel per tirare fuori in uno specifico ristretto range di floating point moltiplicati, quel "100000" invece di "65535". Cmq queste furono le spiegazioni di M$.


    > Capisco la legge di Murphy: se qualcosa può
    > andare storto allora andrà storto, ma talvolta va
    > tutto per la retta via. E non nel senso di via
    > del retto del consumatore.
    > Occhiolino
    non+autenticato
  • > > È già successo con i fogli di calcolo Excel
    > > di Microsft, nel
    > > 2007:
    > > goo.gl/8nr44s
    > > Non mi risultano danni o cause in tribunale.
    > la questione e' pertinente... e in effetti non
    > ricordo
    > cause.
    >
    > PERO' M$ spieggo' che il pasticciaccio, anche se
    > brutto, e' soltanto visivo (cio che viene
    > VISUALIZZATO nella cella) ma non internamente..
    > ergo se quella particolare moltiplicazione era
    > parte di una serie di operazione alla fine il
    > calcolo non ne veniva
    > inficiato.

    Ma sai, anche in questo caso la questione è confinata ai file in formato PDF. La macchina Xerox non risulta che faccia questo errore quando viene usata come fotocopiatrice, né che la cosa avvenga con formati diversi dal PDF, ad esempio il TIFF.
    Io non credo che una scansione di un documento che contiene numeri venga usata come documento legale e/o ufficiale. Chi ha l'originale di quel documento, qualsiasi programma usi, lo salva direttamente in PDF se deve spedirlo in quel formato, e caso mai se lo stampa dopo, per archiviazione interna.
    non+autenticato
  • - Scritto da: Jimmi Onano
    > > > È già successo con i fogli di
    > calcolo
    > Excel
    > > > di Microsft, nel
    > > > 2007:
    > > > goo.gl/8nr44s
    > > > Non mi risultano danni o cause in
    > tribunale.
    >
    > > la questione e' pertinente... e in effetti
    > non
    > > ricordo
    > > cause.
    > >
    > > PERO' M$ spieggo' che il pasticciaccio,
    > anche
    > se
    > > brutto, e' soltanto visivo (cio che viene
    > > VISUALIZZATO nella cella) ma non
    > internamente..
    > > ergo se quella particolare moltiplicazione
    > era
    > > parte di una serie di operazione alla fine il
    > > calcolo non ne veniva
    > > inficiato.
    >
    > Ma sai, anche in questo caso la questione è
    > confinata ai file in formato PDF. La macchina
    > Xerox non risulta che faccia questo errore quando
    > viene usata come fotocopiatrice, né che la cosa
    > avvenga con formati diversi dal PDF, ad esempio
    > il
    > TIFF.
    non capisco da dove ti venga sta fissazione sui PDF...
    Rewind... ste bestione xerox sono delle fotocopiatrici digitali alias scanner, che processano pacchi di fogli, stampano, mandano/ricevono fax ed email e delle digitalizzazioni possono generare file tiff, jpg (altri?) (incapsulandoli anche nei pdf o xps) e fare ocr generando dei pdf searchable.
    il tizio scopre la cosa scansionando delle planimetrie e generando dei pdf. Si, vero, ma il pdf in se non c'entra nulla.
    La bega va ricercata nel segmento "qualita' della scansione".. in uno dei -mila settaggi [presente anche nella sezione FAX, per es], c'e' questo menu "quality/file size" con opzioni [normal/high/higher]. Il normal viene consigliato se devi spedire via internet i files. Ed e' l'opzione famigerata che fa uso -all'evidenza dei fatti scoperti, ma nessuna menzione nella documentazione e men che meno nei menu- dell'algoritmo JBIC2 compresso. Il quale usa un meccanismo di pattern per ricostruire i caratteri. e lo fa MALE.
    Ora alla fine della girandola di mail, customer care (che nulla sapevano), e videoconferenza con 2 dirigenti (che si barcamenano) si puo concludere che come chiappe stanno a posto (nella web interface delle xerox c'e' una nota e anche nel manuale).
    La nota, stante le possibili implicazioni, e' imboscata e sopratutto sottotono (nei man ci sono 3 sezioni sul troubleshooting e nessuna ne parla), ma c'e'. Ovviamente non parla di jbig2, ma non ha importanza.

    E' un problema DECISAMENTE subdolo (il blurring o gli altri effetti da 'scarsa risoluzione' sono immediatamente evidenti, perche non ci leggi una mazza, e rifai la scansione, MENTRE qui il testo e' buono MA TAROCCATO) e imho farebbero bene a TOGLIERE direttamente l'opzione. O almeno a cacciarci un bel BIG RED WARNING.

    > Io non credo che una scansione di un documento
    > che contiene numeri venga usata come documento
    > legale e/o ufficiale. Chi ha l'originale di quel
    > documento, qualsiasi programma usi, lo salva
    > direttamente in PDF se deve spedirlo in quel
    > formato, e caso mai se lo stampa dopo, per
    > archiviazione
    > interna.
    hun?
    questo e' hardware per grandi uffici, non di rado burocratici, dove e' abituale cacciare torme di fogli e farne la fotocopia (opps.. scansione)... per ricavarci poi delle stampe o dei files o delle faxate. Visto che il jbig2 e' usato internamente quando metti in normal, non mi stupirei se venisse usato anche per le faxate e per altre operazioni.
    non+autenticato
  • - Scritto da: bubba
    > questo e' hardware per grandi uffici, non di rado
    > burocratici, dove e' abituale cacciare torme di
    > fogli e farne la fotocopia (opps.. scansione)...
    > per ricavarci poi delle stampe o dei files o
    > delle faxate. Visto che il jbig2 e' usato
    > internamente quando metti in normal, non mi
    > stupirei se venisse usato anche per le faxate e
    > per altre
    > operazioni.

    Ecco dove spariscono i soldi! Tutti gli ordini e finanziamenti che contengono 6 diventano 8!
    Teo_
    2638
  • - Scritto da: Teo_
    > - Scritto da: bubba
    > > questo e' hardware per grandi uffici, non di
    > rado
    > > burocratici, dove e' abituale cacciare torme
    > di
    > > fogli e farne la fotocopia (opps..
    > scansione)...
    > > per ricavarci poi delle stampe o dei files o
    > > delle faxate. Visto che il jbig2 e' usato
    > > internamente quando metti in normal, non mi
    > > stupirei se venisse usato anche per le
    > faxate
    > e
    > > per altre
    > > operazioni.
    >
    > Ecco dove spariscono i soldi! Tutti gli ordini e
    > finanziamenti che contengono 6 diventano
    > 8!
    ehehe.. beh puo' valere anche al contrario. non e' che ci sia un bug specifico sul 6/8.Occhiolino
    Cmq mi pare di capire dall'articolo di oggi, che genereranno una patch per SEGARE direttamente l'opzione. Mi pare una buona idea.
    non+autenticato
  • > Cmq mi pare di capire dall'articolo di oggi, che
    > genereranno una patch per SEGARE direttamente
    > l'opzione.

    Ma segano dalla Xerox anche il responsabile di questo pasticcio?!?
    non+autenticato
  • "OCR ON"/"OCR OFF" è sufficiente implementarla e verificarla. Alla fine evoluta quanto si vuole è sempre solo una stampante. Ma non hanno procedure di test di progettazione ? Questa sarebbe una grave non conformità del prodotto. A questo punto sarebbe più serio disabilitare l'opzione ed evedenziare che la stampante ha l'OCR sempre abilitato. Questo non è un lavoretto fatto a scuola dove l'ultimo che ci "mette mano" decide se l'OCR deve essere abilitato sempre e comunque lasciando l'opzione come un fake ... Xerox, aveva in mano i sistemi che avrebbero cambiato il mondo, adesso gravi problemi con le stampanti ....
    non+autenticato
  • contenuto non disponibile
  • Se addirittura è involontario vuol dire che hanno gravi problemi di test di prodotto a livello di progettazione e/o produzione. Spero per loro che non sia così. Questi sono carrozzoni che hanno elenchi di responsabili dallo stipendio di giada ma che non sanno come funziona in generale una stampante e nel dettaglio quelle progettate da loro. Queste multinazionali sono tutte alle frutta, dinosauri che annaspano in un mondo che è completamente cambiato. Le aziende a struttura piramidale capovolta sono destinate all'estinzione.
    non+autenticato
  • E questo sarà un baco nel loro firmware per ciucciare i documenti altrui.
    Facciamoci un thread e diciamolo chiaramente senza girarci intorno.
    Pfui. [faccina che vomita]
    non+autenticato
  • Ricorda qualcosa ?

    One of the bugging methods mentioned is codenamed Dropmire, which, according to a 2007 document, is "implanted on the Cryptofax at the EU embassy, DC" – an apparent reference to a bug placed in a commercially available encrypted fax machine used at the mission. The NSA documents note the machine is used to send cables back to foreign affairs ministries in European capitals
    http://www.theguardian.com/world/2013/jun/30/nsa-l...
    non+autenticato
  • non capisco come un algoritmo di compressione possa trasformare un numero in un altro: al massimo si vedrebbe qualcosa che non assomiglia né ad un "6" né ad un "8", con dei pixel "spostati"... secondo me c'è di mezzo un bug (più o meno voluto) che abilita l'OCR anche se non richiesto: magari, per fare delle copie migliori, qualcuno ha pensato che fosse meglio abilitarlo più spesso
    non+autenticato
  • contenuto non disponibile
  • - Scritto da: Nome e cognome
    > non capisco come un algoritmo di compressione
    > possa trasformare un numero in un altro: al
    > massimo si vedrebbe qualcosa che non assomiglia
    > né ad un "6" né ad un "8", con dei pixel
    > "spostati"...
    non capisci perche' non e' semplicemente mera compressione... con quel settaggio applica un algoritmo lossy, e dopo ricostruisce "intelligenetemente" i caratteri sulla base di pattern.

    > secondo me c'è di mezzo un bug (più
    > o meno voluto) che abilita l'OCR anche se non
    > richiesto: magari, per fare delle copie migliori,
    no non pare proprio. tant'e' che la questione era in effetti gia nota, solo che NESSUNO del customer care ne aveva idea. e a quanto pare, anche gli utenti.
    non+autenticato
  • giocattolini da $12000 con un opzione di compressione lossy che, per non mostrarsi tale, applica un "algoritmo intelligente" di ricostruzione.. ricostruendo MALE (quando i caratteri sono piccoli). E lo fa da anni, pare.

    Gli avvocati amanti delle class action, ho paura si stiano fregando le mani... e anche Terry Gilliams ridera' (chi ha mai visto "Brazil".. dove i casini iniziano con mosca(!) che rovina un carattere di un testo "dattiloscritto" )
    Forse magari l'opzione lossy andrebbe tolta o piazzata con un BIG warning.. e pazienza se i PDF vengono piu grossiCon la lingua fuori

    Anche fixare il problema nel jbig2 non sarebbe male, sempre che sia possibile (se una roba e' lossy, e applichi un algoritmo di pattern reconition e blabla, e' chiaro che presto o tardi qualcosa verra' ricostruito alterato).
    non+autenticato
  • montagne e montagne di caause per danni in arrivo contro xerox?
    non+autenticato
  • A naso, non direi, i danni vanno dimostrati. Non è il massimo trovarsi una fotocopia con un 8 al posto di un 6, sempre tenendo presente che in una fattura fa fede l'originale... e finché non trascriverà "troia" al posto di "trova" non credo si possa parlare di conseguenze gravi. Sorride
    non+autenticato
  • Qui non si parla di fotocopie ma di scansioni e trasformazioni in pdf (in tiff nessun problema)
    non+autenticato
  • È vero... A bocca storta
    Il discorso generale mi pare rimanga: quali danni reali si possono dimostrare?
    non+autenticato
  • - Scritto da: Cristiano Metz
    > È vero... A bocca storta
    > Il discorso generale mi pare rimanga: quali danni
    > reali si possono
    > dimostrare?
    beh in realta' sono gia stati dimostrati.
    Per il tizio che, essendosi accorto del problema, non ci sono stati 'danni reali' (a parte la perdita di tempo), perche' appunto se n'e' accorto.
    Avesse lavorato con le planimetrie con numeri errati, magari produceva un disastro.

    Non e' difficile immaginare ospedali che fotocopiano dati clinici, dove un 8 diventa un 6 e viceversa...
    non+autenticato
  • - Scritto da: bubba
    ...
    > Avesse lavorato con le planimetrie con numeri
    > errati, magari produceva un
    > disastro.
    >
    > Non e' difficile immaginare ospedali che
    > fotocopiano dati clinici, dove un 8 diventa un 6
    > e
    > viceversa...
    C'è poco da immaginare, è reale.
    Ora che finalmente i fax stanno andando in pensione, si usa il pdf. Se invii un ordine con un disegno tecnico in PDF, il tuo fornitore ti realizza dei pezzi con misure sbagliate.

    PS: Annunziata, se ti manda in crisi, puoi cancellare anche questo commento.
    non+autenticato
  • - Scritto da: Cristiano Metz
    > È vero... A bocca storta
    > Il discorso generale mi pare rimanga: quali danni
    > reali si possono
    > dimostrare?

    Pensa ad un errore così nel progetto di un aeroplano...
    Izio01
    4027
  • - Scritto da: Cristiano Metz
    > A naso, non direi, i danni vanno dimostrati. Non
    > è il massimo trovarsi una fotocopia con un 8 al
    > posto di un 6, sempre tenendo presente che in una
    > fattura fa fede l'originale... e finché non

    per varie definizioni di originale: cos'è originale?

    Ricevo una fattura via email in PDF, ormai tutte le ditte fanno così. La stampo e ho l'originale. La ristampo e ho due originali.

    Originale quindi vuol dire veramente poco.

    Senza contare tutte le ditte che fanno la scansione della fattura e te la mandano anziché generarla direttamente col pc.
    non+autenticato
  • > > A naso, non direi, i danni vanno dimostrati. Non
    > > è il massimo trovarsi una fotocopia con un 8 al
    > > posto di un 6, sempre tenendo presente che in
    > una
    > > fattura fa fede l'originale... e finché non
    >
    > per varie definizioni di originale: cos'è
    > originale?

    Una definizione generale, nel mondo digitale, non credo che esista.
    Nel caso di planimetrie, quella stampata la prima volta, e mai più modificata.
    Nel caso di fatture, quella generata dal PC, e salvata nel formato deciso dall'utente.

    > Ricevo una fattura via email in PDF, ormai tutte
    > le ditte fanno così. La stampo e ho l'originale.
    > La ristampo e ho due
    > originali.

    Se vuoi chiamarle così...
    Il fatto che siano copie identiche non significa che siano originali. Non è la stessa cosa.


    > Originale quindi vuol dire veramente poco.
    >
    > Senza contare tutte le ditte che fanno la
    > scansione della fattura e te la mandano anziché
    > generarla direttamente col
    > pc.

    Ecco, questo mi pare un passaggio inutile. Oramai tutti i programmi salvano anche in PDF. Che senso ha stampare la fattura e poi fare la scansione, e magari stamparla di nuovo, se va mandata per posta?
    Non si fa prima a stampare due (o più) copie?
    non+autenticato