Liane TTS: Apenas mais um sintetizador de Vóz

Domingo, 2 de Outubro de 2011 por ruibatista

O LianeTTS é um sintetizador de voz, para o português do Brasil, desenvolvido pelas instituições Brasileiras Serpro e UFRJ. Este programa, software livre sob a licença GPL V3 (indicada apenas nos ficheiros do código fonte), tem a única função de transformar texto – conjuntos de caracteres que forma palavras que, por sua vez forma frases – em saída sonora de voz sintetizada. Este é o Liane TTS, mais um sintetizador de voz para português do Brasil. Aliás TTS significa exactamente Text to Speech – Texto para fala.

Mas parece que não é bem assim

A publicidade que se faz em torno do mesmo omite descaradamente o que é o Liane TTS. Atente-se a sua descrição, na Página do Produto:

[..] LianeTTS é uma aplicação software livre, que se comunica com o usuário através de síntese de voz, viabilizando, deste modo, o uso destes computadores por deficientes visuais. [...]

Não, o que viabiliza o uso de computadores pelos deficientes visuais são os leitores de ecrã que até podem usar sintetizadores de voz para transformar texto em fala, por ventura através do Liane TTS ou de alternativas como o Espeak.

Mas os criadores do Liane TTS sabem disso, e continuam, na mesma página:

[...] Pode ser acoplado a diversos programas para produzir a síntese de voz, seja através de um uso direto de suas rotinas, ou preferencialmente pelo uso do sistema Speech Dispatcher, que é uma camada de dispositivo independente para a síntese de voz que fornece uma interface de uso comum e fácil para ambas as aplicações clientes (programas que disponibilizam texto para a conversão) e softwares sintetizadores (programas que de fato são capazes de converter texto para fala).[...]

Pois, os “programas que são capazes de converter texto para fala”, como o Liane TTS. Mas nesta descrição, que diga-se, um leigo não irá por certo entender, não são referidos os reais responsáveis pela inclusão dos cegos. Seja como for o produto é mais ou menos descrito… Ou pelo menos tentam.

No entanto os pacotes disponibilizados na referida página denominados de Liane TTS são na verdade os leitores de ecrã NVDA (versão do liane TTS para Windows) e Orca (versão para Linux). Ambos configurados (ou tentativa de tal – mais adiante explico) para falarem sim através do sintetizador Liane TTS. Nenhum destes softwares, que já existia antes do tal Liane TTS para dar inclusão aos cegos, é referido uma única vez na página do produto. Nos manuais são referidos sim, provavelmente porque até a documentação foi copiada ou adaptada, e já agora de documentos antigos.

Para resumir, enfiaram um sintetizador de voz diferente no NVDA e no Orca e chamaram ao novo produto de Liane TTS para Windows e Linux, dizendo que resolveria as dificuldades dos cegos ao aceder ao computador. Talvez com a quantidade de leitores de ecrãs falhados que têm surgido, aproveitar os que têm sucesso e dar-lhes outro nome seja uma solução menos propícia a riscos e falhas, quem sabe.

Mas a desinformação espalha-se

Se fosse apenas a página do produto, com as suas definições confusas e omissões, o problema não era grande. mas veja-se as notícias bombásticas na imprensa brasileira:


Programa permite que deficientes visuais usem o computador com facilidade
AGêNCIA BRASIL 26/09/2011 21h00 (Link)

O Serviço Federal de Processamento de Dados ( Serpro) promove amanhã (27) um treinamento nacional para o uso do programa Liane TTS, voltado à inclusão social de deficientes visuais. A ferramenta gratuita é baseada em um programa (software) livre e permite que pessoas cegas ou com elevado grau de deficiência visual possam usar o computador com facilidade. [...]

Liane TTS: Serpro apresenta leitor de tela oferece acessibilidade a cegos – BR-Linux (Link)


O Serpro fez a demonstração técnica do Liane TTS, voltado à inclusão social de portadores de problemas de visão que impossibilitem a interação direta pelo monitor.

Via info.abril.com.br:

De acordo com o Serpro, o Liane TTS levou cerca de três anos para ser desenvolvido e é resultado de uma parceria entre o Serviço de Tecnologia de Dados e o Núcleo de Computação Eletrônica da Universidade Federal do Rio de Janeiro(UFRJ). A ferramenta é uma aplicação de software livre que funciona como um sintetizador de voz na língua portuguesa falada no Brasil. O programa transforma o texto em áudio.

O programa pode ser baixado gratuitamente no Portal do Serpro na internet, nas versões dos sistemas operacionais Windows e Linux.

Nos comentários a este artigo já existem utilizadores indignados com a situação, e com toda a razão.


E temos muitos artigos mais nestes termos. A pesquiza no google sobre Liane TTS fornece toda a _desinformação_ que anda a circular. O produto chega a ser descrito correcta e incorrectamente no mesmo artigo o que possivelmente se deve ao mesmo não ser correctamente descrito logo de origem. Mais, nem o Orca nem o NVDA são mencionados, mais uma vez.

Para piorar a situação, até ver, nenhuma das entidades associadas ao Liane TTS teve algum contributo no desenvolvimento seja do NVDa ou do Orca. Sendo eu colaborador em ambos os projectos estou em posição de o afirmar com alguma convicção. Pedindo esclarecimentos a quem os poderia dar, até agora obtive um expressivo silêncio.

Das duas uma: ou se trata de muita falta de ética ou de pura e simples ignorância e incompetência. Se não for nenhuma das duas por favor digam-me que com prazer retiro esta afirmação. Ou então corrijam o problema. O facto de ser Software Livre não implica que se aceite apropriação sumária dos direitos da autoria dos programas e das suas funcionalidades, mudando apenas um nome.

E agora algumas Considerações mais Técnicas

O NVDA distribuído com o Liane TTS é o 2011.1, desactualizado. Um utilizador comum não conseguirá actualizar o NVDA substituindo os drivers e fazendo as alterações necessárias. Para além de ser pouco compreensível é mau para o utilizador, que não poderá ter todas as funcionalidades do NVDA. Solução: fazer um instalador para o sintetizador que encontre a versão do NVDA instalada no sistema ou definida pelo utilizador. Complementando, criar interface SAPI também seria valorizada pelos utilizadores, que até poderiam utilizar o sintetizador com vários outros programas.

O pacote para Linux é, no mínimo, de questionar. Distribuem as dependências em pacotes .deb, versões antigas (de 2010, I.G. orca 2.30.2) que estão, diga-se de passagem, inclusas pelo menos no Debian e no Ubuntu. E mais actualizadas! Apenas o código do próprio Liane TTS é que vem em .tar.gz, e esse é que seria útil um pacote!!! No pacote .tar.gz encontramos um Makefile que, na mesma regra, faz tudo: compila, copia os binários e sabe-se lá o que mais para locais pré-definidos, e até tenta instalar mais uma dependência (mbrola) via apt-get… Isto não é passível de ser distribuído ao público, não tem qualidade mínima, em minha opinião. Nem todas as distribuições são baseadas em Debian, utilizam apt-get ou colocam certos tipos de ficheiros nas pastas lá definidas, sem hipótese de configuração, além da alteração do próprio Makefile. Só consegui Pôr o sintetizador a funcionar alterando o Makefile. Ou se faça pacotes para tudo ou se faça um sistema de build decente (make, autotools…) e se deixe o packaging para as distribuições.

Recomendo, a quem de direito e dever:

E mais haveria a dizer… Muito mais.

Considerações Finais

Não tenho nada contra o Serpro, a UFRJ, ou qualquer outra entidade que faça alguma coisa pelos cegos, muito antes pelo contrário. Agora publicitar este sintetizador como uma revolução extraordinária não é nada justo. Até poderia ser se fosse muito superior ao Espeak que é utilizado normalmente no Orca e no NVDA, mas não é assim. Em minha opinião até é pior… Mas isto são gostos.

Não sou cidadão brasileiro, como tal não me vou pronunciar sobre a boa ou má aplicação de dinheiros públicos brasileiros nestes projectos, da forma como são feitos. É algo que deixo a quem de adquirido direito democrático nesse país fazer. Porém não ficaria com a consciência tranquila se não fizesse algo para esclarecer o que na minha opinião se passa: usar os leitores de ecrã Orca e NVDA como meio de promover um sintetizador de voz que é exclusivamente isso, e que de outra forma não poderia ser utilizado. Isto tudo sem dar pelo menos o crédito devido a estas duis produtos. Porque no fundo estes pacotes do Liane TTS são mais Orca e NVDA que Liane TTS. E isto deixa-me profundamente indignado.

Ao caro leitor, se tiver algo a acrescentar ou a contrapor, faça o favor de comentar, a discussão de ideias e sempre bem-vinda, mas neste artigo é ainda mais necessária. Que esta situação se esclareça.


Actualização:
Confirmei que a licença do programa é realmente GPL versão 3, está essa informação no início dos ficheiros de código do Liane TTS, pacote para Linux.

Actualização (2): A informação oficial (pelo menos aquela que foi fornecida por alguem do Serpro) está Nesta página. Não vou tirar mais conclusões porque são óbvias…

Actualização (3): a resposta da comunicação social do Serpro está nos comentários.

Actualização (4): A posição do Prof. António Borges, desenvolvedor do Liane TTS, pode ser encontrada aqui.

De momento, não é possível deixar respostas nem efectuar pings.

28 Responses to “Liane TTS: Apenas mais um sintetizador de Vóz”

  1. Cleverson Casarin Uliana diz:

    Buenas, eu até gosto da voz e recebi inclusive algumas versões ainda beta para testar. O problema é mesmo nas descrições e modo de empacotamento. Na condição de usuários mais ou menos avançados, teoricamente nem precisaríamo-nos preocupar, tanto que eu por exemplo nem sabia ainda dessa descrição oficial do produto, visto que já tenho instalado aqui e nem fui atrás. Já os usuários leigos, por sua vez, geralmente se viram pedindo e recebendo ajuda nas listas de discussão por aí. O problema é mesmo quando o pessoal da imprensa, que dessas coisas nada entende, publica matérias como as que v. mencionou aí, pois isso induz usuários novos a eventualmente achar que tudo foi desenvolvido ali, inclusive os leitores de tela. Daí que faço coro com tuas reclamações, justas e magestosas; parabéns.

    • ruibatista diz:

      Cleverson,

      Para mim esta situação não faz muito sentido. Não encontro nenhuma razão plausível para não referir o NVDA ou Orca mais claramente. Não encontro mesmo. E quando são referidos, nos “manuais” do Liane TTS… deixa muito a desejar. Leia o manual de utilização do Orca, por exemplo, merecia realmente mais atensão, no conteúdo em si mas principalmente na forma. O que me parece é que a cois afoi lançada as pressas. Só isto justifica.

  2. Marlin diz:

    Sinceramente, vejo isto muito mais com cara de má fé.

    Quem consegue empacotar um sintetizador em um programa sabe muito bem distinguir uma coisa da outra!

    Fazer o que?

    • ruibatista diz:

      Não estou tão certo assim de que conseguiram empacotar o synth num programa. Pelo menos no Orca o utilizador ainda tem que dar umas boas voltas, principalmente se quizer usar configurações um nadinha diferentes do Ubuntu 10.04.

  3. Eliezer diz:

    Concordo com o Rui e o Marlin em gênero número e grau.
    Sou usuário do NVDA, (inclusive já abandonei os demais leitores famosos que existem por aí). Utilizo o NVDA no meu trabalho, e sem querer exagerar, mas para as minhas necessidades, o NVDA é umas 50 vezes melhor do que o outro leitor de telas famoso e muito caro que todos sabem qual é.
    Resido no Brasil e sou brasileiro, e acho uma sacanagem o que o Serpro e a UFRJ fiseram… Acredito que não doeria nada a eles dar os devidos créditos ao NVDA e ao Orca.
    Depois quando algum gringo diz que o Brasil, além de ser o país do futebol, (que nem está tão bom assim), do carnaval, de praias, de mulheres bonitas, é também o país da malandragem, muitos ficam bravinhos… No entanto, isso que o Serpro e a UFRJ fez, na minha opinião é sacanagem, malandragem e pilantragem mesmo…
    Acredito que os “nobres” desenvolvedores da UFRJ e do Serpro pensam assim:
    Para que criar se podemos copiar, e além disso podemos ganhar todos os méritos.
    O que mais me deixa indignado é que esses cara de pau, todos os meses recebem seus salários para fazer uma safadesa dessas. Enquanto o NVDA e acho que o orca também, caminham com pouquíssimos recursos financeiros, graças ao trabalho voluntário de várias pessoas..
    Isso é a prova da má fé e da aparente incompetência dos mestres e doutores do NCE da UFRJ e dos técnicos do Serpro, que não quiseram ter o trabalho de desenvolver algo do zero, ou não foram honestos o suficientes para dar os devidos créditos a quem de direito.

    Desculpem o meu desabafo, mas essas coisas me revoltam…

    Atenciosamente:
    Eliezer Tavares de Oliveira

  4. Rui,

    na minha modesta opinião, o que o serpro vem fazendo nos últimos tempos, mereceria uma CPI…

    Não obstante, é sempre salutar recordarmo-nos da máxima de Reagan: “Não espere que a solução venha do governo. O governo é o problema.”

    Alguém lembra ainda da afaire cpqd, seu malfadado leitor de telas? Ou o quanto custou fazer o mecdaisy.

    Por fim, seus comentários, muito pontuais, foram justos e ponderados. Dificilmente conseguiria manter-me tão… impávido? serenamente, manteve o equilíbrio e até a imparcialidade, até onde foi possível. Foi um ótimo artigo, não há dúvidas…

    Parabéns.

    • ruibatista diz:

      Halison,

      Neste caso eu não penso que seja, principalmente, um problema derivado de ser desenvolvido por entidades relacionadas com qualquer governo. Infelizmente a ignorância e a incompetência existem tanto em serviços públicos como na iniciativa privada. A diferença é que a maioria dos privados, imagine-se só – que inteligências superiores – perceberam que a incompetência não trás qualquer vantagem competitiva. No público, ao contrário, e muito útil para certas parcerias, mais ou menos subtis… E o Brasil não é caso único.

      Até no portal do Serpro a publicidade enganosa se repete: http://www.serpro.gov.br/noticiasSERPRO/2011/setembro/serpro-realiza-treinamento-nacional-de-software-para-cegos

  5. Marlin diz:

    Eu creio que o Rui está sendo muito gentil em chamar isso de ignorância e incompetência.
    Pois para mim, quem fez isso sabe muito bem o que faz, e sendo assim prefiro fazer minhas as palavras do Eliéser.
    É óbvio que o Rui na condição de ser um dos mantenedores deste cite não diria tais coisas.

    Abraços

    • ruibatista diz:

      Marlin,

      Se eu tivesse provas de que foi propositada a não referência do NVDA nem do ORCa pode crer que o diria. Este site é meu (e não só), pago por mim, sem relação com quem quer que seja. Não tenho qualquer entrave em dizer a verdade.

      Do que entendo e tenho informação para falar eu falo, sem problemas. E vou repetir o que já escrevi no artigo num aspecto: o empacotamento para Linux do Liane TTS é total incompetência, e totalmente injustificável. Quem programa um sintetizador de voz em ctem que saber fazer um Makefile para distribuição…

  6. Marlin diz:

    Olá,

    Por favor não entenda como se eu esteja ensinuando que estás sendo conivente com isso.

    Caso isto seja apenas uma impressão minha, desde já, desculpe-me pelo engano.
    Sei que aqui não é lugar para rasgação de ceda, mas o admiro muito por seu esforço no afã de contribuir com a promoção da acessibilidade.
    O que eu quiz ressaltar foi simplesmente que achei que suas palavras foram de prudência.
    Até mais

    • ruibatista diz:

      Marlin,

      Eu entendi, não se priocupe. Só não posso afirmar algo do qual não tenho provas nem provavelmente possa vir a ter. A minha opinião sinsera? Acho que é mais falta de informação e falta de cuidado ao distribuir o produto do que outra coisa qualquer. Porém isto não serve de desculpa para nada, como é óbvio. Factos são factos.

  7. José Vilmar Estácio diz:

    Sou usuário do orca e contribuo nas horas vagas com o projeto também.
    Assim como o Rui, não me lembro de ter visto nenhuma contribuição do Serpro ou de alguém de lá para o projeto.

    Também não entendo por quais motivos o empacotamento foi feito da forma que foi. Não acredito sinceramente que tenha sido por falta de competencia.

    Um outro ponto de atenção para mim é o uso do mbrola.
    Posso estar enganado mas parece ser um projeto que estacionou no tempo.

  8. LianeTTS diz:

    [...] megatts.com/2011/10/02/liane-tts-apenas-mais-um-sintetizador-de-voz/. [...]

  9. Ôlas Rui e demais. Muito legal, me poupou um trabalho; enfim, mais segue em:

    http://zandrebran.blog.br/?p=231

  10. Rui, somente hoje li o artigo. Parabéns. Escrevi um também, para o netvisao, quando sair aviso na lista. Linquei seu artigo para os leitores do meupróprio artigo. estamos nos movendo por aqui. grande abraço,

  11. O Serpro esclarece que desenvolveu, em parceria com a Universidade Federal do Rio de Janeiro (UFPR), o sintetizador de voz Liane TTS, para promover a inclusão digital de cegos e pessoas com baixa visão. Quando as duas instituições decidiram desenvolver uma ferramenta de acessibilidade para deficientes visuais, a avaliação foi de que não havia necessidade de criar um leitor de tela, pois já havia soluções livres, como o Orca, para Linux, e o NVDA, para Windows. Optou-se então pelo desenvolvimento de um sintetizador de voz, para oferecer uma alternativa gratuita e de qualidade.

    Em nenhum momento o Serpro declarou ser desenvolvedor do Orca ou do NVDA. Também jamais afirmou que o Liane TTS poderia substituir ou dispensar o uso dos leitores de tela. Por serem soluções livres, os programas de leitura de tela foram incluídos nos pacotes de instalação, com o intuito de facilitar a vida do usuário. Não houve a intenção de apropriar-se de software desenvolvido por terceiros, conforme algumas pessoas interpretaram.

    No aviso de pauta distribuído à imprensa e publicado no portal do Serpro, foram priorizadas informações básicas sobre o produto. Porém, em material de apoio produzido para ser enviado aos jornalistas que solicitassem informações adicionais, o analista de sistemas líder da equipe do Sepro que trabalhou no projeto com a UFRJ cita o Orca e o NVDA como os leitores de tela aos quais o Liane TTS é acoplado. O Serpro não tem como se responsabilizar pela edição e pelo aprofundamento técnico que cada veículo opta por fazer do assunto.

    O Serpro está à disposição para receber críticas, sugestões e dúvidas e encaminhá-las aos responsáveis.

    • ruibatista diz:

      As informações básicas que o Serpro deu à imprença estão erradas, caso contrário eles não as tinham publicado daquela forma. Mais, o Serpro, ou qualquer entidade, tem sim a responsabilidade de alertar a imprença sobre informações erradas sobre os seus produtos, em minha opinião.

      A questão e que o Serpro chama Liane TTS ao pacote completo, ao sintetizador, e a tudo o que está relacionado. Para além disso nem a definição na própria página do produto diz realmente o que ele é. E basta ler a referida página para o constatar.

      Como eu já referi no artigo, o problema é mais do que apenas desinformação. O empacotamento, da forma como foi feita, prejodica os próprios utilizadores do Liane TTS, que terão leitores de ecrã desactualizados. A não ser que o Serpro lance uma versão do Liane TTS a cada versão do NVDA ou do Orca…

      Quanto ao Liane TTS ser uma alternativa sim, é um facto. Quanto mais alternativas melhor. Mas para pt-br existem soluções gratuitas ou de baixo custo, em termos de sintetizadores de voz, com a mesma qualidade ou melhores. Isto é, no entanto, também uma questão de gosto. Agora para velocidades elevadas, que os cegos normalmente usam, o sintetizador e um desastre. Dever-se-á, em minha opinião, a limitações do mbrola e da concatenação de difones, e não em particular ao Liane TTS.

      Daqui que eu concorde com alguns comentários neste e noutros artigos que defendem que o Serpro e seus associados não ouviram os reais utilizadores do produto, ou pelo menos da amostra que tem comentado por aí.

  12. Prezado,

    Depois de condicionar muitas pessoas com deficiência, principalmente as sem formação básica na informática, a um limbo segregado, por intermédio de um software chamado Dos Vox, não seria de se admirar a atitude do “mentor” do tts chamado de Liane, nome, aliás da filha desse mentor.
    Uma vez que aquele software se mostrou ineficaz, perante o Orka e o NVDA, aproveitou-se deles o tal mentor para fazer uso desse tts que, por falar nisso, é de baixíssima qualidade sonora e de prosódia.
    Com efeito, em uma apresentação desse tts em no primeiro encontro de audio games, em São Paulo, Brasil, vários dos presentes perguntaram se a voz original do tal Dos Vox não continuaria, quando o professor da UFRJ lhes dissera que ela substituiria a voz daquele programa.
    Daí o leitor pode ter uma ideia da apreciação feita para com este tts.
    Busquem ouvir ambas as vozes, do programa Dos Vox e dele com a Liane e você terá uma apreciação do que estou dizendo.
    Mas, o foco não é este, de fato.
    Ocorre que para esse projeto, importante recurso econômico de brasileiros foi utilizado, neste caso, mais uma vez mal utilizado.
    Sou cidadão brasileiro (CPF 073 941 158 60) e contribuinte. Sinto que meu dinheiro foi jogado no lixo, tão porcaria o resultado do dinheiro empregado.
    É hora que autoridades brasileiras possam fazer algo quanto ao mal emprego da verba pública, mas isso ainda vai demorar, já que essas pessoas não sabem o que estão financiando.
    Agora, é uma grande falta de ética, moral e de vergonha na cara não mencionar os softwares Orka e NVDA, ao fazer uso deles. Denigre o Brasil perante os desenvolvedores desses softwares e perante brasileiros que contribuem , muitas vezes voluntariosamente para que esses softwares possam estar disponíveis, também aos brasileiros com deficiência visual.
    Estes merecem mais respeito e não podem ser colocados no mesmo saco dos que estão promovendo o tts Liane como leitores de telas, o que não é. E semfosse, tendo como base o Dos Vox, seria uma tão e tal porcaria!
    Francisco Lima, autor e responsável por este comentário. Obs. Autorizo a publicação e replicação desta mensagem, como está, em qualquer meio, eletrônico ou físico.

  13. Graça Auxiliadora Nobre Lopes diz:

    Meu colega Rui Batista é extremamente delicado a situação dos desenvolvedores do Liane tts, mas quero acrescentar que sempre estranhei a baixa qualidade de alguns softwares da UFRJ, inclusive o MecDAISE para leitura de livros didáticos que a UFRJ conseguiu empurrar ao Ministério da Educação como solução de ferramenta acessível para cegos, um fiasco de qualidade, muitos conflitos na construção dos textos em txt.

  14. Cleverson Casarin Uliana diz:

    Boas, segue endereço de um texto escrito ontem pelo professor Antonio Borges da UFRJ. Estou divulgando aqui apenas por ser o ponto de vista de uma das partes. No meio do texto ele cita meu nome, pelo que agradeço, mas eu de fato não cheguei a escrever código, apenas me esforcei na divulgação do NVDA e do ESpeak e fiz alguns beta-testes e mediações entre desenvolvedores:
    http://groups.google.com/group/voxtec-ufrj/browse_thread/thread/3d135fe6351d4527#

    • ruibatista diz:

      Agradeço Cleverson pelo link.

    • Presado Cleverson.

      Li esta empolgante discussão até aqui, e gostaria de ler também o texto do Prof. Anôonio Borges para conhecer seu ponto de vista sobre o assunto antes de publicar minha opinião.
      Entretanto o texto foi publicado no grupo Voxtec ao qual não tenho acesso por ser um grupo fechado para convidados.
      Você teria como disponibilizar um link para este texto fora do grupo ou se possível me conseguir um convite para o grupo?
      Fico grato

  15. Diniz diz:

    Prezados,
    Esta questão do LianeTTS, como já foi mencionado por alguns leitores, está em um contexto muito mais grave do que o mero empacotamento sem as devidas informações. Dosvox, MecDaisy, Motrix… São exemplos de realidades onde este Sr. Antonio Borges pinta uma imagem de salvador da pátria das pessoas com deficiên cia, quando na verdade apenas desenvolve produtos de péssima qualidade. Atrevi-me a também publicar algo sobre essa situação, que pode ser lido em http://www.leondeniz.com/2011/10/12/ate-quando-iremos-permitir-que-nos-mantenham-sob-tutela/
    Diniz.

  16. Cleverson Casarin Uliana diz:

    José Victor: segue texto do Professor na íntegra.

    ***

    Estimados amigos:

    Recebi há poucos dias atrás, por e-mail, uma cópia do texto do
    estimado analista de sistemas de Portugal, Rui Batista, em que
    diversos questionamentos, e por que não dizer, críticas severas, são
    feitas à iniciativa denominada LianeTTS, um dos primeiros frutos que
    estão sendo produzidos a partir da parceria entre o NCE/UFRJ e o
    Serpro.   Acho que a criação de polêmicas neste contexto não é
    produtiva, quando o que se pretende é criar novas alternativas,
    razoáveis e gratuitas, para uso da tecnologia computacional por
    deficientes visuais no Brasil. Com isso em mente, resolvi agregar
    elementos construtivos a esta discussão.

    É primeiro importante conhecer um pouco da história.

    Há alguns anos, o Serpro resolveu, por conta de uma perspectiva de
    responsabilidade social, dar acesso aos cegos às exigências do que é
    conhecido como Governo Eletrônico, um conjunto de iniciativas a nível
    nacional que cria uma via principal de acesso através do uso da
    Internet e dos computadores.  Naquela época, a justificativa era que,
    sendo o órgão responsável pelas iniciativas do governo eletrônico no
    Brasil, não seria razoável que as pessoas com deficiência visual
    ficassem à margem do processo envolvendo a relação dos indivíduos com
    o governo pela via única de comunicação que é dada pela Internet e
    pelos computadores.  Hoje em dia, do ponto de vista político, uma
    pessoa qualquer sem acesso a este canal é, na perspectiva do
    desenvolvimento globalizado, um cidadão, entre aspas, de segunda
    classe.

    Várias pessoas empunharam esta bandeira, mas destaca-se aqui a atuação
    contundente do analista cego, Marcos Kinsky, que além destes temas,
    também defendeu ardentemente a disponibilização ampla e irrestrita de
    livros digitais em formato acessível Daisy, que só há poucos meses
    começa a frutificar no Brasil.

    Uma análise preliminar foi feita no Serpro e chegou-se à constatação
    de que alguns produtos deveriam ser disponibilizados para a população
    com deficiência visual: um sintetizador de voz, um leitor de textos
    digitais e um conjunto de facilidades para acesso ao governo
    eletrônico, que poderia ser consubstanciado através de um navegador
    web, em acesso a páginas acessíveis.  O navegador deveria ser de
    propósito geral para acompanhar o feroz desenvolvimento das
    telecomunicações, e seria tornado legível para os cegos por meio de
    leitor de telas.

    Mas o Serpro estava bem consciente de que, deste jeito, um cego para
    acessar o Governo Eletrônico não poderia ser um cego qualquer: teria
    que ser um cego pelo menos com nível médio, o que corresponde no
    Brasil a menos de 15 por cento desta população.  Na situação de
    subdesenvolvimento digital do país, de cerca de 200 mil cegos
    brasileiros, aproximadamente 160 mil ainda hoje não sabem usar
    computadores.  Assim, para abranger um número maior de cegos, haveria
    também necessidade de treinamento em larga escala e do desenvolvimento
    de aplicações mais simples, também usando a síntese de voz, para uso
    por pessoas com menor literacia digital.  Em particular, havia um
    sentimento que os telecentros públicos, que são mantidos pelo governo
    federal e operados pelo Serpro, poderiam se transformar em promotores
    de alfabetização digital para pessoas com deficiência, da mesma forma
    que o são para as pessoas mais humildes que não são deficientes.

    Quanto ao sintetizador de voz, o Serpro não tinha inicialmente razões
    para investir.  Afinal, existia uma instituição pública, o Centro de
    Pesquisas e Desenvolvimento (CPQd) da Telebrás, que tinha várias
    soluções nesta linha, que disponibilizaria gratuitamente para os
    projetos do governo federal relacionados a pessoas com deficiência.
    Infelizmente, após o desenvolvimento da primeira aplicação baseada
    nesta tecnologia, um leitor de textos simples denominado Letra, o CPQd
    foi privatizado, e todos os produtos de síntese de voz tornados
    produtos comerciais (pois eram essencialmente usados na tecnologia
    bancária).  A distribuição do Letra foi inviabilizado uma semana após
    seu lançamento.  É importante lembrar que comprar um sintetizador não
    era a solução quando se pensa em muitos milhares de cópias a
    disseminar.

    Nosso pequeno grupo foi então chamado para produzir um sintetizador de
    voz usando tecnologia livre, de código aberto.  O compilador foi
    construído, baseado na técnica de junção de difones, que é uma das
    mais simples, e o processamento do sinal digital foi feito usando uma
    um pacote de rotinas gratuitas denominado Mbrola, produzido pela
    Universidade Politécnica de Mons, na Bélgica, que junta sons com
    perfeição.  É importante dizer que eu também sei juntar sons usando os
    mesmos algoritmos, mas não posso publicar num software que será
    distribuído, sem quebra de uma patente sobre a qual a Universidade de
    Mons e a France Telecom têm um acordo de distribuição, após anos de
    querela judicial.

    O sintetizador LianeTTS é baseado num processador de linguagem natural
    que eu criei, razoavelmente ortodoxo em termos de programação, e
    razoavelmente fácil de traduzir para línguas baseadas no latim.  Eu
    implementei o conjunto de regras de tradução para português do Brasil,
    mas sei que é muito fácil traduzir o LianeTTS para outras línguas.
    Como brincadeira, eu criei um pequeno compilador para espanhol em
    apenas quatro horas, usando uma base de difones públicas do projeto
    Mbrola (espanhol Venezuelano), usando um conjunto apropriado de regras
    e fazendo ligeiras mudanças nas rotinas do LianeTTS original.

    Nota:  Pensei em replicar o experimento e implementar o português de
    Portugal com a base pública de difones da Babel Technologies,
    disponível no Projeto Mbrola, mas o número de regras daquele dialeto é
    muito grande e pouco documentado e eu perdi a paciência.  Se alguém
    que quiser fazer, eu ajudo, pois ouvi falar que recentemente alguém da
    Universidade do Minho andou publicando um conjunto de regras que
    suponho estar consolidado.

    O LianeTTS foi colocado em testes, passando a fazer parte do pacote de
    distribuição do sistema de acessibilidade chamado DOSVOX.  A versão
    original continha muitos erros de pronúncia e prosódia, além de
    acentuado acento carioca (a fala do Rio de Janeiro) e isso causou um
    certo rechaço da exigente comunidade de deficientes visuais.  Pouco a
    pouco, o sintetizador foi aprendendo a falar com menos erros e com uma
    prosódia melhor, chegando a um padrão aceitável, dentro dos limites
    que a técnica de junção de difones impõe.

    A programação original tinha sido feita em Delphi, o que acabou sendo
    um entrave para sua adaptação para a interface padrão SAPI5 usada no
    ambiente Windows.  Por essa razão, o código foi totalmente reescrito
    por um colega no NCE, Anibal Teles, de forma voluntária, criando um
    lindo código de programação na linguagem C, com fonte de distribuição
    em GPL3, que permite que qualquer estudante de computação aprenda as
    bases de criação para um processador de linguagem natural.

    Nota: o sintetizador, que é a união do processador de linguagem
    natural com o sistema de junção Mbrola é LGPL, pois o Mbrola não é
    livre só é grátis.  Eu gerei um juntador de sons que é GPL e que não
    quebra patentes, mas o som não fica tão bom, assim, deixo para algum
    aluno que queira pesquisar isso com calma, o que inclui seu transporte
    para celulares e tabletes.

    O desenvolvimento do LianeTTS então viabilizou diversos usos.  O
    primeiro foi a junção com leitores de tela: criamos algumas versões
    drivers em Python para NVDA (com a orientação de nosso colega
    Cleverson Uliana, que é cego e colaborador do pessoal do NVDA e do
    e-speak).  O problema aqui é que demorou para se estabilizar um padrão
    de interface para sintetizadores naquele software.  Com o Orca foi
    mais complicado: inicialmente mexemos no código do Orca, mas isso não
    foi uma coisa legal pois saem versões todos os dias.  Então usamos a
    conexão com o speech-dispatcher, que é suportado nativamento pelo
    Orca, e que é uma coisa meio instável, mas pelo menos a gente agora
    sabe como escorar para que o Dispatcher não exploda quando o Linux
    exige demais dele.  Ficamos satisfeitos com o uso do LianeTTS nos dois
    leitores de tela.  A clareza da fala do LianeTTS dá de 10 a zero na
    fala do e-speak, embora eu reconheça que ainda é importante que
    tenhamos feedback para limpar todas as possibilidades de travamento,
    melhorar a eficiência e definir prosódias mais agradáveis para certas
    situações.

    Estamos neste momento criando uma facilidade para trabalhar com
    padrões maiores de fala, aumentando a qualidade da prosódia
    especialmente no início das frases.  Ainda há muito que melhorar neste
    sintetizador de voz.   Estamos também fazendo diversos jogos
    pedagógicos, que não usam leitores de telas mas unicamente o LianeTTS
    como módulo de saída de voz.  Criamos também um conjunto de widgets
    (interfaces gráficas) sonoras para uso simples por programadores
    cegos.  Há alunos gerando uma versão para Android, embora isso seja um
    projeto de estudantes, e portanto, pouco provável que se transforme
    num produto acabado (quando os alunos arranjam um bom emprego,
    defendem rapidamente o projeto, quase sem testar e incompleto, e
    largam tudo de mão).

    Falarei agora sobre as confusões geradas na imprensa, o que inclui
    aqui até jornais de primeira linha, que pegam “briefings” diretos das
    agências de notícias (como a Agência Brasil, que embolou as
    informações e distribuiu-a a vários órgãos de imprensa).   Aqui no
    NCE, nós quase sempre damos entrevista por telefone, e nem todos os
    jornalistas conhecem do tema sobre o qual entrevistam.  Eles pegam
    pedaços de sites, fazem uma salada de frutas e saem imensas batatadas.
     A maior e mais constante batatada é misturar sintetizador de voz com
    leitor de telas.  Eles pegam o site do Dosvox e do NVDA, misturam com
    o site do Serpro e do LianeTTS, e escrevem muitas coisas estranhas.  O
    próprio site do Serpro é alvo de constantes críticas nossas. Mas
    também há jornalistas mais cuidadosos, como o do Jornal do Commércio
    que fez uma sucinta e precisa definição do que é o software LianeTTS,
    como ele se acopla com as outras ferramentas, e como pode ser
    estendido para novas aplicações.

    Quanto às críticas feitas pelo Rui Batusta, acho que ele está a
    exagerar um pouco no purismo ideológico.  Explico melhor:

    1. Os sintetizadores de voz, como o LianeTTS, sim, viabilizam o uso
    dos computadores por deficientes visuais, assim como as linhas braille
    também o fazem.  Eles são a porta de saída sem a qual nada acontece.
    Os leitores de tela, os ambientes operacionais como Dosvox, ou jogos
    pedagógicos são aplicações que fazem uso deste canal.  Não há nada de
    esquisito nesta nossa observação.

    2. O lianeTTS no Linux deve ser preferencialmente usado através do
    Speech Dispatcher, que mesmo tendo apresentado alguma instabilidade
    nos últimos tempos, pelo menos organizou minimamente a zorra que era a
    síntese de voz no Unix, e em particular no Linux.  Na minha primeira
    tentativa, eu tive que consertar o S.D. que absolutamente não
    funcionava para módulos externos, sendo o defeito, felizmente,
    ajustado numa release posterior.  Nota: Fiquei feliz que eles
    acabassem com a maluquice que seria a cissão gerando um tal de
    OpenTTS.  Vemos somar, não dividir!

    3. Nosso grupo no NCE não tem colaborado com o NVDA nem com o Orca,
    por pura falta de tempo, embora eu conheça razoavelmente os dois
    códigos.  Mas é claro que fico feliz que o Rui Batista esteja
    colaborando com estes desenvolvimentos, sendo seu grande valor o
    conhecimento que se ganha nesta tecnologia a nível de desenvolvedores
    na nossa língua portuguesa.  Essa é a postura correta quando se pensa
    em software livre. Ficaríamos ainda mais felizes se o Rui (entre
    outros colegas brasileiros e portugueses) se tornasse também
    colaborador do LianeTTS, por exemplo, ajustando os drivers para que se
    torne mais robusto o acoplamento com ambos os sistemas, ou sugerindo
    melhoria no seu código, ou ainda gerando uma versão para o dialeto
    português de Portugal.

    4. Quanto aos pacotes de distribuição serem tão simples, realmente é
    um problema a atacar.  Para desenvolvedores, o tar.gz com um pequeno
    manual foi adequado, e resolveu em diversos lugares que nos escreverem
    contando os experimentos de instalação dentro dos telecentros do
    Serpro e outros lugares (como no centro de desenvolvimento do Banco do
    Brasil).  Mas claro que uma debianização conveniente seria bacana para
    os menos experientes, e é nosso dever desenvolvê-la e melhorá-la.
    Para isso, dentro da estratégia de software livre, aceitamos sugestões
    e contribuições com toda humildade, pois há pessoas na comunidade que
    têm prática nesta área, provavelmente muito maior do que a nossa.
    Estas contribuições serão muito bem vindas, e publicadas com todos os
    créditos e agradecimentos a que têm direito.

    Antonio Borges

  17. lucas Radaelli diz:

    li o texto do professor Antônio Borges, e continuo a apoiar as críticas do Rui Batista. O que foi criticado, em suma, foi a falta de reconhecimento dos projetos do orca e nvda, principalmente nos veículos de divulgação e do próprio site do serpro, além dos empacotamentos não apropriados. O erro do empacotamento foi reconhecido, o que é bom porque uma vez reconhecido é um passo dado em rumo a resolvê-lo, pelo menos. Já ao outro problema continuamos na mesma, ao meu ver.