PNLD 2023 – O formato do livro digital: ePub3 x HTML5

Share on facebook
Share on twitter
Share on linkedin
Share on whatsapp
Share on email

Em artigo especialmente escrito para o PN, Pedro Milliet analisa as duas opções de formatos e explica as suas razões para apoiar o HTML5 como solução ideal para o PNLD digital.

O PNLD 2023 requisita pela primeira vez das editoras participantes a entrega dos livros didáticos em formato digital. O desafio é proporcional ao salto de qualidade que se pode prever no futuro, mas há muita insegurança por parte dos profissionais do campo editorial. Essa insegurança, em parte derivada das especificações que ainda não estão completamente definidas, em parte devida à dificuldade inerente à produção do livro digital com a complexidade do livro didático, pode e deve ser superada com informação consistente e uma especificação precisa.

A perspectiva inicial do PNLD seria a entrega dos livros em formato ePub 3, mas há uma tendência em adotar-se o HTML5 como formato base.

Discutiremos a seguir as duas opções e porque apoiamos a escolha do HTML5 como solução mais adequada para o PNLD digital.

Procuramos simplificar os termos técnicos, ou ao menos referenciá-los em contexto, por extenso. No entanto acreditamos que essas são referências importantes para entender melhor as diferenças entre os formatos.

O ePub 3

O formato ePub 3 deriva do anterior ePub 2, cuja versão inicial surgiu em 2007. Em 2010, a versão ePub 3 traz mudanças significativas, como a adoção do HTML5 e CSS3 como linguagens para a composição do livro, assim como recursos de sincronização de áudio e texto para acessibilidade. Em 2016 ocorreu a fusão do IDPF com o W3C, instituição mundial responsável pelas especificações das linguagens da Web, como HTML, CSS, XML entre outros. Em 2019 foi lançada a versão 3.2 com novidades mais relacionadas à metadados e acessibilidade.

Após a versão 3.2 e a fusão com o W3C, o formato entrou em estado de manutenção e hoje não se prevê uma nova versão 4. O grupo de trabalho responsável pelo standard ePub hoje está mais focado em ajustes menores e melhorar a acessibilidade.

Por dentro do ePub

O livro ePub é um pacote de arquivos zipados.

Se trocamos a terminação .epub por .zip, podemos abrir o arquivo com qualquer gerenciador de zips.

Agora vamos abrir o zip e ver o conteúdo: META-INF, OEBPS.

O diretório META-INF é obrigatório e o diretório OEBPS (exceto pelo diretório META-INF, todos os outros tem nomes arbitrários) é onde armazenamos os arquivos do livro. Na raiz há um arquivo de texto que define o tipo de arquivo ePub, chamado mimetype. Seu conteúdo é somente a definição do tipo de arquivo: application/epub+zip.

Dentro do diretório META-INF vemos somente o arquivo container.xml, que é um arquivo de texto em linguagem xml para indicar onde está o arquivo base do ePub, em formato de texto xml, com extensão .opf, que indica todos os arquivos contidos no ePub, com seus formatos e localizações, define os metadados do livro e apresenta a ordem inicial dos arquivos de conteúdo do livro. Normalmente o arquivo .opf é armazenado no diretório OEBPS.

A estrutura que vemos é livre e é reconhecida pela aplicação de leitura por estar definida no arquivo .opf (em nosso caso package.opf). O diretório audio contém os arquivos de áudio, que devem ser em formato mp3. Em img temos as imagens, que podem ser em jpg, png ou svg. No diretório mo estão os arquivos de sincronização do áudio com o texto, que permitem a navegação com destaque para as palavras ou frases que estão sendo narradas, quando a narração está embarcada no livro em arquivos de áudio. Estes arquivos são arquivos de texto em formato smil (Synchronized Multimedia Integration Language). Seu conteúdo indica para cada frase do livro (ou quebra de narração) o arquivo de áudio correspondente, e os pontos de entrada e saída da narração do trecho.

A tag indica ocorrência em paralelo do texto, definido a seguir na tag pela sua origem src e o identificador de posição (#dtb2338), e do áudio da narração, definido na tag

O arquivo de navegação do livro é o nav.xhtml e os arquivos de conteúdo são os arquivos com extensão .xhtml. O XHTML é uma versão de HTML com uma sintaxe mais estrita. O conteúdo, portanto, é todo em HTML.

Opcionalmente pode-se usar arquivos de estilo em CSS3, como em nosso exemplo o arquivo base.css, e incluir a capa do livro.

O formato LPF é uma proposição do Publishing Working Group do W3C para a distribuição de livros ou documentos estruturados para leitura on e off-line, baseados em HTML5, enquanto o PWA é um modelo de organização de conteúdo HTML que permite a leitura on e off-line (diretamente no browser), assim como uma série de outros recursos de comunicação com a Web e com o usuário.

O LPF foi proposto para viabilizar a distribuição em pacote de um conjunto de arquivos HTML, e todos os recursos anexos, como vídeos, áudio, imagens, scripts, outros formatos de arquivo, etc. Sua composição é bem mais simples do que a do ePub 3 que vimos acima, sendo obrigatório somente o arquivo manifest.json, que veremos a seguir. O pacote é zipado, e da mesma forma que o ePub, que é um zip com a extensão .epub, a extensão .zip é trocada pela extensão .lpf.

O LPF é, portanto, um perfil de uma publicação Web, estruturada por um manifesto de publicação. Todas as informações relativas aos arquivos do pacote, que incluem metadados, ordem inicial de leitura, conteúdos alternativos, são definidas no arquivo publication.json. A utilização do manifesto em formato json amplia de forma significativa a flexibilidade para inclusão futura de recursos e funções e mesmo sua interoperabilidade com outros perfis de publicação (como audiolivros, graphic novels, etc.).

Dessa forma, o único arquivo estrutural cuja definição e especificação é fixa e restrita, é o arquivo manifesto ou publication.json. E mesmo esse pode ser substituído por um manifesto incluído em um arquivo index.html na raiz do pacote, ou um arquivo de manifesto referenciado por um link no mesmo arquivo da raiz. A simplicidade dessa montagem torna a produção mais simples e efetiva.

Há uma especificação de um novo modelo de sincronização texto-áudio (Media Overlay), baseado no formato json. Além de sincronizar áudio e texto, pode ser utilizada para outras sincronias, como vídeo e texto.

A mudança é consistente com a migração para json em todos os arquivos de suporte e configuração em perfil LPF. Além disso, está incluída no desenvolvimento do Readium-2, que é a base para a criação de aplicativos de leitura de livros ePub, LPF e audiobooks.

O PWA não é uma especificação W3C. Nasce de uma iniciativa de dois dos maiores atores da web, o Google e a Apple. Visa simplificar a instalação de aplicativos web nos sistemas operacionais a partir dos sites e através dos browsers e permitir seu uso off-line, e é totalmente multiplataforma. Além desta função, estabelece modelos de atualização de conteúdos, comunicação entre os aplicativos e as aplicações nos servidores remotos, e com o sistema operacional local. O PWA é constituído por arquivos em HTML e seus correlatos de estilo (CSS), interatividade (Javascript), e acessórios como vídeos, áudios e outros. Para criar um PWA, a obrigatoriedade se resume a um arquivo de conteúdo em HTML, um manifesto em json e um arquivo de serviço em Javascript. Com a configuração criada, o conjunto de arquivos transforma-se em um aplicativo que pode ser armazenado localmente, executado on e off-line, atualizar partes de seu conjunto, enviar e receber mensagens da aplicação na Web.

Um livro criado como PWA pode conter toda a programação de leitura incluída em si mesmo, de forma encapsulada. Quer dizer, não necessita de uma outra aplicação de leitura para ser consumido. Pode mesmo conter em si a função de leitura por voz sintetizada, com controles avançados de navegação, anotações, etc. Ao mesmo tempo, a estrutura do PWA permite que facilmente seja convertido em um modelo LPF ou mesmo ePub.

Porque escolher o HTML5 (LPF) como formato para a publicação de livros didáticos universais

• A variedade e maturidade das ferramentas de software para autoria e edição de documentos em formato HTML5. Pode-se criar um livro em HTML5 (LPF) utilizando desde aplicativos como Notepad++, escrevendo o código manualmente, até com ferramentas sofisticadas como Visual Studio Code, DreamWeaver, ou mesmo partir de um livro produzido em InDesign (desde que seguindo as práticas corretas de concepção e composição) para depois editar ou enriquecer o livro.

• A leitura do livro em HTML5 não demanda a utilização de um leitor específico durante sua produção, e não exige a compilação no pacote zip (.epub) para ser lido e revisto. Já um ePub, para ser verificado, precisa ser compilado e lido em uma aplicação dedicada.

• Há restrições ao uso de Javascript no livro ePub, principalmente por parte dos aplicativos de leitura. No caso de um livro em HTML5 pode-se utilizar códigos em Javascript e incluir todos os tipos de interatividade compatíveis com os browsers atuais. Assim, na evolução dos livros em HTML5, quando da universalização dos livros didáticos digitais, está garantida a possibilidade de uso de interatividades sofisticadas (simuladores, acesso em rede, compartilhamento de conteúdos, atualização remota, etc.)

• A evolução do standard em HTML5 está garantida pela contínua discussão e elaboração de novos recursos e métodos, controlada e coordenada pelo W3C. O EPub 4 não está previsto, e a informação corrente é de que não haverá uma nova versão do ePub.

• Não há restrições de uso de standards como SSML no livro em HTML5, como há no ePub. Dessa forma, substituições fonéticas inseridas no código do livro podem ser feitas em ter que utilizar alfabetos fonéticos como X-SAMPA e IPA, podendo ser realizada diretamente por substituição pelo termo desejado (como, por exemplo, substituir “Freud” por “Fróide”, sem necessidade de escrever “fɾˈɔjdʒi”). Essa característica permite a distribuição dos livros sem a narração em áudio embarcado, diminuindo significativamente o tamanho do arquivo (em média, para um livro de aluno de Fundamental 2, de 300 Mb para 15 Mb).

• A conversão de um livro em HTML5 para ePub pode ser feita de forma automática. O livro em HTML5, utilizando o standard o dominante na Web, é sem dúvida a melhor opção como matriz de o armazenamento do conteúdo.

• Finalmente, a produção do livro em HTML pode ser utilizada de forma direta, com os procedimentos corretos, como matriz e base da produção em outros formatos, tais como ePub, PWA, Texto puro, Braille, docx, InDesign e outros.

• O custo de produção de livros em HTML5 é no mínimo competitivo com o custo de produção em ePub 3. Como mencionamos acima, o fato dessa opção oferecer vantagens de simplicidade de produção, armazenamento de matriz otimizada, compatibilidade e usabilidade universal, e garantia de evolução consistente com a Web, aumenta ainda mais sua competitividade a longo prazo.

Conclusão

Pelos argumentos e fatos expostos, pensamos que a escolha do formato HTML5, em sua versão de distribuição LPF, é a melhor opção para a produção dos livros didáticos digitais em formato universal, preservando características de design visual avançado, responsivo e com acessibilidade. Tanto pelo aspecto dos produtores de livros quanto pelo dos usuários, nos parece que as vantagens são significativas.