terça-feira, 7 de junho de 2022

A evolução do PDF e seus tipos, versões, etc


 A evolução do PDF é uma história que poucos conhecem e que começou com a necessidade de se poder visualizar documentos em qualquer computador, com aparência absolutamente idêntica ao que era visto no computador de origem. A partir dessa necessidade surgiu o formato que se tornou padrão mundial, tornando a história por trás dessa ideia uma das mais empolgantes do mundo da tecnologia.

Tudo começou no ano 1982, quando ano uma empresa recém-criada dentro de uma garagem da cidade de San Jose, Califórnia, Estados Unidos, apareceu com algumas novidades para lá de interessantes. Como resultado, ela começou a chamar a atenção do mundo dos documentos impressos e digitais. O  nome da empresa: Adobe Inc.


O início de tudo


Quando a Adobe começou a dar seus primeiros passos, mesmo sendo desconhecida do público, ela já estudava algo ambicioso. Em princípio, a Adobe buscava uma forma de criar um tipo de arquivo que fosse capaz de permitir o compartilhamento de documentos de maneira que o visual e toda formatação de origem permanecessem preservados.

Entretanto, esse objeto de tornar a impressão de documentos mais fácil era uma ideia ousada para a época. A magnitude que essa evolução estava prestes a provocar traria mudanças profundas no conceito de mídia impressa e abalaria os alicerces da indústria gráfica.

Interesse em fotocópias


Toda a história da Adobe, assim como a evolução do PDF e a biografia de seus fundadores estão entrelaçados com a demanda da impressão de documentos. Para compreendermos essa relação, precisamos retornar até dezembro de 1982, quando John Warnock e Charles Geschke se reuniram em torno de uma ideia em comum.

John Warnock foi engenheiro na Xerox Corporation, chegando a alcançar a presidência da empresa durante dois anos. Além disso, Warnock foi CEO por 16 anos, se aposentando no ano de 2000.

John Edward Warnock

John Edward Warnock



Semelhantemente, o seu colega Charles Geschke foi membro do Xerox Palo Alto Research Center – PARC, tido como um dos laboratórios mais importantes da história da tecnologia. Geschke comandou as operações da Adobe por 8 anos, sendo presidente da empresa durante 11 anos. Por fim também se aposentou no ano 2000.

Charles Geschke


Inicialmente Warnock e Geschke estavam interessados em abrir um serviço de fotocópias e impressões para escritórios, cuja demanda era enorme naquela época. Nesse sentido, eles conheciam bastante as necessidades e desafios dessa área. Mas por fim, ao invés do serviço de fotocópias e impressões, o destino os conduziu a fundar uma empresa de softwares. Jamais eles poderiam imaginar que, muito em breve, a Adobe seria a proprietária de softwares lendários como o Photoshop e o Illustrator.
PostScript, versátil e eficaz

O primeiro produto lançado pela Adobe foi formato PostScript. Era, em síntese, um software capaz de descrever, nos mínimos detalhes, o posicionamento de letras, figuras e outros elementos gráficos em uma “folha de papel virtual”. Como resultado o formato rapidamente se tornou um padrão seguro para impressão em diversos dispositivos e foi igualmente recebido como uma inovação fantástica. Dessa forma, não demorou muito para que o PostScript começasse a ser utilizado em larga escala pelo mundo afora.

Todo esse sucesso começou a atrair as atenções de outra gigante da tecnologia – a Apple. Através de uma parceria com a Adobe em 1985, a Apple lançou sua impressora LaserWriter já com o PostScrit incorporado.

Definitivamente o formato PostScript foi uma revolução tão eficaz que até hoje é usado devido a sua enorme flexibilidade. Sem ele, as coisas que você imprime não ficariam iguais ao que se vê no monitor.


O nascimento do PDF


Em 1991, John Warnock anunciou outra novidade e, surpreendentemente, prometeu uma nova evolução nos documentos impressos e digitais. Dessa vez, algo mais ousado que o PostScript. Ele chamou de “The Camelot Project“, ou “Projeto Camelot”. Em síntese, a proposta era poder captar documentos de qualquer proveniência e enviar versões eletrônicas desses documentos para qualquer lugar do mundo, exibi-los e imprimi-los em qualquer computador. Tudo isso preservando as características visuais do documento com absoluta fidelidade.

Em 1992 o Projeto Camelot se tornou o formato PDF (Portable Document Format ou, em português, formato de documento portátil), sendo de fato uma evolução do PostScript, conforme Warnock prometera. A principal diferença era que o PDF podia ser visualizado e compartilhado para outras pessoas. Já o PostScript não, ele era interpretado somente nas impressoras.


Começo difícil


Contudo, apesar de possuir vantagens inquestionáveis, o PDF não foi muito popular no começo. O  principal fator era que o próprio PostScript já era visto como satisfatório, funcional e, sobretudo “leve”. Nesse sentido, os documentos em PDF eram considerados demasiadamente “pesados”, consumindo kilobytes preciosos para os padrões da época.


Disquetes

Os discos flexíveis foram uma das tecnologias que mais perduraram no universo dos computadores, porém sua capacidade limitada era um empecilho para.a evolução do PDF.

Só para exemplificar, até início dos anos 2000 a mídia de armazenamento removível mais popular eram os disquetes de 3½ polegadas, cuja capacidade era de 1,44 MB. Não raro, uma dezena de PDFs era suficiente para abarrotar tais mídias. Semelhantemente também havia computadores com discos de 5¼, com capacidade de 720 KB. Hoje, uma única foto de celular ultrapassa esse limite.

Quantos aos Discos Rígidos, ainda eram itens caros, fisicamente grandes e com uma capacidade que chega a parecer piada nos dias atuais. Computadores com HDs de 500 MB eram modelos tops de linha. Aliás você não leu errado, os 500 MB são 500 megabytes mesmo.


Bytes preciosos demais


A garimpagem de bytes para se conseguir espaço livre perdurou durante toda a década de 1990. Em virtude disso, softwares como o Norton Utilities ganharam fama ao realizar limpeza do lixo imprestável das unidades de armazenamento, garantindo algum espaço livre. Essa era a vida de quem lidou com computadores até por volta do ano 2000.


Cartão de Memória


Hoje um minúsculo cartão de memória é capaz de guardar o conteúdo equivalente a centenas de Discos Rígidos da época.

A título de comparação, atualmente um cartão de memória com 64 GB que você compra baratinho, é capaz de guardar com folga o conteúdo equivalente a 120 HDs daquela época. Porém, na década de 1990, cada byte de espaço era algo cobiçado. Por isso, arquivos grandalhões, nem pensar. Ninguém podia se dar a esse luxo, sob o risco de ver o espaço livre minguar em pouquíssimo tempo.

Aliás, até a mesmo a internet como forma de compartilhamento de arquivos ainda era algo embrionário, mesmo dentro dos círculos corporativos e acadêmicos. Apesar dela existir desde 1969, somente em 1987 que a internet foi liberada para uso comercial e em 1992 surgiu os primeiros provedores de acesso.


Haja paciência!


Movida à conexão discada ou conexão dial-up, a internet se revelava lentamente nos monitores como bloquinhos de um quebra cabeças. Isso, nas melhores conexões, à velocidade de 56 kbit/s. Dessa forma, receber algum e-mail contendo um anexo de apenas 1 MB poderia significar uma espera angustiante de 2 ou 3 minutos para o download.

Por fim, para piorar ainda mais a situação, o próprio PDF possuía concorrentes como DjVu, Envoy, Common Ground Digital Paper, Farallon Replica e até mesmo o formato PostScript da própria Adobe.

Em virtude de toda essa conjuntura de fatores negativos, os arquivos PDF permaneceram algum tempo no limbo da computação, sem que sua utilidade atraísse maiores atenções.
Reviravolta

Na chegada do ano 2000, mudanças significativas surgiam a cada instante, sobretudo no mundo da tecnologia. As profecias tecno-apocalípticas referentes ao temível bug do milênio não se concretizaram. Definitivamente o caminho para o PDF se estabelecer se mostrava favorável.

Nesse meio tempo, a conexão banda larga começava a dar as caras. No universo do armazenamento, unidades capazes de guardar mais de 1 gigabyte já estavam populares, os pendrives apareciam pela primeira vez e os CDs graváveis (CD-R, Compact Disc Recordable) estavam em todas as lojas.

Da mesma forma, a editoração eletrônica voltada para a produção gráfica também experimentava grandes avanços. Sobretudo alavancado por técnicas de fotocomposição gráfica, que vieram somar ao sucesso de softwares como o Adobe Indesign que, essencialmente, gerava um PDF pronto para impressão comercial. Isso era uma evolução magnífica dentro dos ambientes editoriais e, como resultado, o formato acabou sendo adotado em massa pela indústria gráfica.

Por fim, a evolução do PDF também alcançou novos serviços online, como bancos, corretoras, agências de turismo e companhias aéreas, por exemplo. Tais empresas passaram a gerar PDFs para quase tudo destinado à impressão. Como resultado, em 2002 os PDFs já estavam totalmente integrados à sociedade de todos os países. O formato passou a fazer a fazer parte de livros digitais, manuais de instruções, boletos de pagamento, documentos oficiais de governos e uma gama infinita de utilidades. Definitivamente, o formato dominou o mundo.


Novos recursos de incorporação


Por consequência de sua imensa versatilidade de uso, o próprio PDF também sofreu um evolução constante com o passar dos anos e veio a ganhar novos recursos e características.

Com efeito, atualmente o formato tem a capacidade de incorporar recursos multimídia (áudio, vídeo e animações), funções de formulários (botões de ação e campos para preenchimento), recursos de internet (hiperlinks, downloads de arquivos), anotações, comentários de revisão, assinaturas digitais, proteção com senha e muitas outras coisas interessantes.

Apesar dos recursos de incorporação serem muito bem vindos, o excesso de funções agregadas passou a ser um problema. A presença de determinadas funcionalidades frequentemente se tornavam uma armadilha, principalmente quando havia uma finalidade muito específica para determinado documento.

Por exemplo, em um PDF destinado para impressão comercial, não faz sentido haver um hiperlink no meio do texto, do mesmo modo fotos com cores RGB ou um vídeo incorporado. A existência desses elementos indesejados no PDF inviabilizava o trabalho de pós processamento, causando atrasos e erros na geração das placas de impressão.


Confiabilidade total nos arquivos


A fim de solucionar todos esses entraves, foram desenvolvidas algumas “famílias de PDF”, contendo padrões e especificações técnicas para serventia exclusiva de determinados usos. Para impressão comercial, por exemplo, foi criado o padrão denominado PDF/X que nada mais é do que uma família de PDF mais “enxuto”, especializado para o ramo gráfico.

Nesse tipo de PDF, são eliminados qualquer recurso ou elemento inútil para impressão gráfica. Além disso os arquivos são construídos conforme especificações técnicas rígidas, baseadas em normalização da International Organization for Standardization (Organização Internacional de Normalização – ISO). Logo, o resultado é um PDF extremamente poderoso e absolutamente confiável para impressão.

Aliás essa confiabilidade do arquivo final é tão absurda que o seu compartilhamento é conhecido como “troca cega” (blind exchange). Isso porque o criador do arquivo não precisa conferir se o documento será visualizado corretamente no sistema de destino (bureau de serviços, gráfica, editora, etc.). De maneira idêntica, o destinatário não precisa ter a mínima preocupação de como o proprietário criou o documento.


Versões do PDF


Vejamos abaixo uma rápida visão das versões em PDF desenvolvidas pela Adobe.


PDF 1.0


A primeira versão foi anunciada em novembro de 1992 e o primeiro software para manuseá-la foi lançado em junho de 1993. Era básico, mas cumpria o prometido.


PDF 1.1


Em novembro de 1994, a versão 1.1 foi lançada, introduzindo suporte para hiperlinks integrados e recursos de segurança (proteção por senha).


PDF 1.2


O PDF 1.2 foi lançado em novembro de 1996. Algumas das adições em termos de recursos permitiam aos usuários usar o PDF como formulário eletrônico, estendendo conjuntos de caracteres, cores e suporte a elementos interativos.


PDF 1.3


A terceira versão lançada em abril de 1999, introduziu sombreamento suave, anotações em PDF, assinaturas digitais, ações JavaScript e criptografia aprimorada de documentos.


PDF 1.4


Lançada em maio de 2001, os novos recursos mais notáveis ​​do PDF 1.4 foram o suporte para imagens com transparências e uso de metadados – ou seja, informações incorporadas ao arquivo, que podem ser usadas para classificar, organizar e fazer pesquisas em documentos.


PDF 1.5


Em abril de 2003, a versão 1.5 trouxe compressão aprimorada, suporte para camadas, controle de abertura do documento em tela cheia, avanço automático de páginas e efeitos de transição de páginas.


PDF 1.6


Em janeiro de 2005, o PDF incrementou sistema de criptografia, incorporação de fontes OpenType, exibição de conteúdo em 3D, combinação de vários documentos (planilhas, fotos, anexos de e-mail) em um único PDF, bem como suporte para formulários XML.


PDF 1.7


Nessa versão lançada em outubro de 2006, foram aprimorados o sistema de comentários, recursos de segurança, controle sobre animações 3D e configurações de impressora.


PDF 2.0


Ao publicar PDF 2.0 (ISO 32000-2 ), em julho de 2017, o grupo de trabalho ISO estabeleceu regras mais aprimoradas após 9 anos de trabalho. Basicamente trata-se de um refinamento do PDF 1.7.

Algumas das melhorias introduzidas estão relacionadas à impressão, renderização, criptografia, assinatura digital, anotação e incorporação de arquivos. O objetivo é facilitar desenvolvedores em todo o mundo a encontrar novas aplicações para o Portable Document Format em diferentes áreas que façam uso de documentos digitais.

Com o PDF 2.0 veio outro subconjunto de PDF – o PDF/Raster 1.0. É usado para armazenar, transportar e trocar documentos de imagem rasterizadas de várias páginas (especialmente documentos digitalizados).


Padronização ISO PDF

Organização Internacional para Padronização


O PDF era um formato proprietário controlado pela Adobe até ser lançado como um padrão aberto em 1 de julho de 2008 (época em que o PDF estava no formato 1.7), quando o controle da especificação foi passada para um Comitê ISO de especialistas voluntários da indústria. Em suma, o PDF tornou-se um padrão ISO International (ISO 32000-1) e, portanto, tornou-se um formato de documento eletrônico totalmente aberto.

Ainda em 2008 a Adobe publicou uma Licença Pública de Patente para ISO 32000-1, concedendo direitos livres de royalties para todas as patentes de propriedade da Adobe que são necessárias para fazer, usar, vender e distribuir implementações em conformidade com PDF.

A uniformização do PDF regulamentadas dentro de normas rígidas do padrão ISO, estabeleceu de vez o PDF como o topo do formato digital de documentos. Dessa forma, ficou aberto o caminho para melhorias rápidas desse formato, que beneficiou tanto usuários quanto desenvolvedores de softwares PDF em todo o mundo.


Subconjuntos de PDF


O padrão ISO 32000-1 é relevante para a versão PDF 1.7 e cobre 5 subconjuntos de PDF. Vamos dar uma olhada rápida em cada um deles cronologicamente.


PDF/X – Impressão


O Comitê de Padrões de Tecnologia de Artes Gráficas (CGATS) introduziu o PDF/X (formalizado nos padrões ISO 15929 e 15930) em 2001. Esse padrão garante que o material impresso espelhe exatamente sua contraparte digital.

As condições de impressão precisam ser especificadas no arquivo PDF/X (perfis de impressão) e o conteúdo ativo (formulários, assinaturas, comentários e multimídia incorporada) não é permitido.

Extensões e revisões para este padrão em termos de requisitos relacionados à impressão foram implementadas regularmente conforme o próprio PDF mudava.


O que é o PDF/X-1a?


O formato PDF/X-1a é uma das variações do PDF/X e gera um arquivo de tamanho compactado bastante atrativo para o compartilhamento. É inegavelmente muito usado e aceito no meio gráfico. Algumas características do PDF/X-1a são:
 

  • Ele requer que a cor de todos os objetos do arquivo esteja em CMYK ou escala de cinza;
  • As tipografias (fontes) utilizadas na arte devem estar incorporadas ao arquivo;
  • O arquivo não pode conter informações inúteis para a impressão (como informações multimídia);
  • Anotações e comentários não imprimíveis só podem estar presentes se estiverem posicionadas fora da área de impressão;
  • Ele não permite transparências.


Limitações do PDF/X-1a


Apesar dos aspectos positivos, o PDF/X-1a não permite o uso de perfis ICC e o fato de exigir que todas as cores estejam em CMYK se torna uma preocupação a mais para o designer. Isso porque é necessário converter todas as fotos e ilustrações para CMYK antes de gerar o trabalho. Além disso, as cores exatas também devem ser CMYK.

Outro problema é que a documentação do Ghostscript não fala sobre geração de PDF/X-1a. Para quem não sabe o GhostScript é uma ferramenta totalmente livre para processar, converter e gerar PDF a partir de qualquer outro software.

A Adobe, por exemplo, se utiliza do Acrobat nativamente em seus softwares, o que inclui uma “impressora virtual” capaz de gerar o PDF a partir de qualquer programa com capacidade de imprimir. É uma solução simples e eficiente, entretanto o Acrobat possui um custo de assinatura mensal. Já o GhostScript é totalmente grátis, disponibilizado sob a GNU General Public License.

Isso torna o PDF/X-1a uma alternativa não tão adequada. Na verdade, o PDF/X-1a é um subproduto do PDF/X-3.


O que é o PDF/X-3?


O PDF/X-3 é outra variação do PDF/X. Este é o padrão da indústria gráfica, estabelecida pela norma ISO 15930-3. É, sem dúvida, o melhor formato para impressão profissional em gráficas comerciais.


PDF/A – Arquivo


PDF / A (um subtipo de PDF 1.4) é um formato de arquivo para arquivamento de longo prazo de documentos eletrônicos, lançado em outubro de 2005. É definido pela norma ISO 19005-1:2005. Os documentos em conformidade com esse padrão seguem regras rígidas que possibilitam manter seu layout original por anos.

No PDF/A todas as informações necessárias para exibir o documento da mesma maneira são incorporadas ao arquivo. Isso assegura que os documentos fiquem preservados com total segurança e acessibilidade, sem cair em obsolescência ou incompatibilidades devido a mudanças tecnológicas.

Dessa forma não é permitido que um documento PDF/A dependa de fontes externas (por exemplo, fontes e hiperlinks), incorporação de arquivos de áudio e vídeo, utilizar JavaScript ou executar arquivos e uso de criptografia. Além disso, todas as fontes do documento devem estar integradas e não devem ter quaisquer restrições que possam causar problemas legais no futuro.


PDF/E – Engenharia


Este é um subconjunto do PDF 1.6, publicado em 2008. O padrão foi desenvolvido para documentação técnica e de engenharia, com suporte para mídia interativa, como animações, renderizações 2D e modelos 3D.


PDF/VT – Impressão Variável e Transacional


Usado para impressão variável e transacional, este subconjunto baseia-se no PDF/X-4 (uma das implementações do PDF/X) e introduzido em 2010.

A impressão de dados variáveis, por exemplo, permite que os usuários imprimam várias cartas de convite enquanto alteram automaticamente apenas os nomes e endereços dos destinatários.

A impressão transacional refere-se à impressão de formulários (como uma conta de telefone, por exemplo) com dados diferentes dependendo das informações do cliente.


PDF/UA – Acessibilidade universal


PDF/UA (ISO 14289) é o padrão internacional, lançado em 2012, que garante a acessibilidade do PDF para pessoas com deficiência que usam tecnologia assistiva para consumir conteúdo eletrônico.