finalmentes...
deu trabalho fazer isso, a extensão COM é ate bem documentada, mas os objetos e propriedades que posso acessar nos objetos é algo quase impossivel de ser achado... criar um documento novo ou edita-lo é facil, com varios exemplos... mas pegar o conteudo e jogar numa string que foi dificil achar algum material
o que fiz foi abrir o "Visual Basic Script Editor" do MS WORD ( abrir WORD > ALT+F11 > F2), ali achei ums lista dos metodos disponiveis em documentos WORD, que poderia acessar via COM
duas soluções me atendiam:
- salvar o documento como .txt
- pegar o conteudo (essa eu acabei de achar... por isso o esse texto estra estranho... era o que eu queria dede o inicio, mas coloco a outra opção tb)
seguem as soluções
pegar o conteudo numa string:
$word = new COM("word.application") or die ("Could not initialise MS Word object.");
$word->Documents->Open(realpath("documento.doc"));
// Extrai o conteudo
$conteudo = (string) $word->ActiveDocument->Content;
echo $conteudo;
$word->ActiveDocument->Close(false);
$word->Quit();
$word = null;
unset($word);
salvar como txt
$arquivo = realpath("documento.doc");
$word = new COM("word.application") or die("Não foi possível iniciar o MS Word");
$word->Documents->Open($arquivo);
$novo_arquivo = substr($arquivo,0,-4) . ".txt";
// o parametro '2' especifica salvar no formato txt
$word->Documents[1]->SaveAs($novo_arquivo,2);
$word->Documents[1]->Close(false);
$word->Quit();
$word->Release();
$word = NULL;
unset($word);
$fh = fopen($novo_arquivo, 'r');
$contenteudo = fread($fh, filesize($novo_arquivo));
fclose($fh);
unlink($novo_arquivo);
acho que é isso... estou tendo alguns problemas ainda mas ja resolveu esse caso
e para que tem servidor linux
Luiz Tanure