Ciao,
devo leggere del testo in un file PDF, ho provato con qualche libreria, ma non ha funzionato affatto sinora. Qualcuno conosce qualche funzione / classe che può convertire il PDF in txt?
Grazie
Ciao,
devo leggere del testo in un file PDF, ho provato con qualche libreria, ma non ha funzionato affatto sinora. Qualcuno conosce qualche funzione / classe che può convertire il PDF in txt?
Grazie
Matando la culebra
php già implementa delle built in functions
Ultima modifica di Gavin Bous; 1-01-2012 alle 21:59:53
Queste riguardano però soprattutto la creazione di pdf, e non la lettura.
In ogni caso sono riuscito con questa funzione:
Codice PHP:
function decomprimiPDF($pdfdata) { //funzione per leggere testo in un file pdf
if (strlen ($pdfdata) < 1000 && file_exists ($pdfdata))
$pdfdata = file_get_contents ($pdfdata);
if (!trim ($pdfdata)); //se vero => messaggio di errore opzionale: echo "errore";
$result = ''; //il testo letto è decodificato e letto fra le parentesi () []
if (preg_match_all ('/<<[^>]*FlateDecode[^>]*>>\s*stream(.+)endstream/Uis', $pdfdata, $m))
foreach ($m[1] as $chunk) {
$chunk = gzuncompress(ltrim ($chunk)); //decomprimi pdf
$a = preg_match_all ('/\[([^\]]+)\]/', $chunk, $m2) ? $m2[1] : array ($chunk);
foreach ($a as $subchunk)
if (preg_match_all ('/\(([^\)]+)\)/', $subchunk, $m3))
$result .= (join ('', $m3[1]) . '*'); //carattere separatore *
}
return $result;
}
Matando la culebra
Non so se dovrei aprire un nuovo thread, comunque ho un nuovo problema, questa volta con Zend Gdata.
Ho letto questo articolo: http://www.ibm.com/developerworks/li...-googledata2/:
"Keys of the row array should not be uppercase, as this format usually generates a server error and row insertion fails."
Esiste un modo per poter utilizzare namespace a caratteri maiuscoli?
edit: ci sono riuscito, basta lasciare nel codice tutto minuscolo, e nel foglio di lavoro mettere a piacere o maiuscolo o minuscolo; inoltre se ci sono spazi, nel codice bisogna lasciare la key dell'array in questo modo:
per es. QUALITA' MERCE nel foglio di lavoro -> nel codice: ['qualitamerce'] (l'apostrofo non è considerato).
Inoltre volendo si può accedere al feed per maggior chiarezza:
https://spreadsheets.google.com/feed...*/private/full
Ultima modifica di pokepower; 4-01-2012 alle 09:37:42
Matando la culebra