Liane TTS: Apenas mais um sintetizador de Vóz
O LianeTTS é um sintetizador de voz, para o português do Brasil, desenvolvido pelas instituições Brasileiras Serpro e UFRJ. Este programa, software livre sob a licença GPL V3 (indicada apenas nos ficheiros do código fonte), tem a única função de transformar texto – conjuntos de caracteres que forma palavras que, por sua vez forma frases – em saída sonora de voz sintetizada. Este é o Liane TTS, mais um sintetizador de voz para português do Brasil. Aliás TTS significa exactamente Text to Speech – Texto para fala.
Mas parece que não é bem assim
A publicidade que se faz em torno do mesmo omite descaradamente o que é o Liane TTS. Atente-se a sua descrição, na Página do Produto:
[..] LianeTTS é uma aplicação software livre, que se comunica com o usuário através de síntese de voz, viabilizando, deste modo, o uso destes computadores por deficientes visuais. [...]
Não, o que viabiliza o uso de computadores pelos deficientes visuais são os leitores de ecrã que até podem usar sintetizadores de voz para transformar texto em fala, por ventura através do Liane TTS ou de alternativas como o Espeak.
Mas os criadores do Liane TTS sabem disso, e continuam, na mesma página:
[...] Pode ser acoplado a diversos programas para produzir a síntese de voz, seja através de um uso direto de suas rotinas, ou preferencialmente pelo uso do sistema Speech Dispatcher, que é uma camada de dispositivo independente para a síntese de voz que fornece uma interface de uso comum e fácil para ambas as aplicações clientes (programas que disponibilizam texto para a conversão) e softwares sintetizadores (programas que de fato são capazes de converter texto para fala).[...]
Pois, os “programas que são capazes de converter texto para fala”, como o Liane TTS. Mas nesta descrição, que diga-se, um leigo não irá por certo entender, não são referidos os reais responsáveis pela inclusão dos cegos. Seja como for o produto é mais ou menos descrito… Ou pelo menos tentam.
No entanto os pacotes disponibilizados na referida página denominados de Liane TTS são na verdade os leitores de ecrã NVDA (versão do liane TTS para Windows) e Orca (versão para Linux). Ambos configurados (ou tentativa de tal – mais adiante explico) para falarem sim através do sintetizador Liane TTS. Nenhum destes softwares, que já existia antes do tal Liane TTS para dar inclusão aos cegos, é referido uma única vez na página do produto. Nos manuais são referidos sim, provavelmente porque até a documentação foi copiada ou adaptada, e já agora de documentos antigos.
Para resumir, enfiaram um sintetizador de voz diferente no NVDA e no Orca e chamaram ao novo produto de Liane TTS para Windows e Linux, dizendo que resolveria as dificuldades dos cegos ao aceder ao computador. Talvez com a quantidade de leitores de ecrãs falhados que têm surgido, aproveitar os que têm sucesso e dar-lhes outro nome seja uma solução menos propícia a riscos e falhas, quem sabe.
Mas a desinformação espalha-se
Se fosse apenas a página do produto, com as suas definições confusas e omissões, o problema não era grande. mas veja-se as notícias bombásticas na imprensa brasileira:
Programa permite que deficientes visuais usem o computador com facilidade
AGêNCIA BRASIL 26/09/2011 21h00 (Link)
O Serviço Federal de Processamento de Dados ( Serpro) promove amanhã (27) um treinamento nacional para o uso do programa Liane TTS, voltado à inclusão social de deficientes visuais. A ferramenta gratuita é baseada em um programa (software) livre e permite que pessoas cegas ou com elevado grau de deficiência visual possam usar o computador com facilidade. [...]
Liane TTS: Serpro apresenta leitor de tela oferece acessibilidade a cegos – BR-Linux (Link)
O Serpro fez a demonstração técnica do Liane TTS, voltado à inclusão social de portadores de problemas de visão que impossibilitem a interação direta pelo monitor.
Via info.abril.com.br:
De acordo com o Serpro, o Liane TTS levou cerca de três anos para ser desenvolvido e é resultado de uma parceria entre o Serviço de Tecnologia de Dados e o Núcleo de Computação Eletrônica da Universidade Federal do Rio de Janeiro(UFRJ). A ferramenta é uma aplicação de software livre que funciona como um sintetizador de voz na língua portuguesa falada no Brasil. O programa transforma o texto em áudio.
O programa pode ser baixado gratuitamente no Portal do Serpro na internet, nas versões dos sistemas operacionais Windows e Linux.
Nos comentários a este artigo já existem utilizadores indignados com a situação, e com toda a razão.
E temos muitos artigos mais nestes termos. A pesquiza no google sobre Liane TTS fornece toda a _desinformação_ que anda a circular. O produto chega a ser descrito correcta e incorrectamente no mesmo artigo o que possivelmente se deve ao mesmo não ser correctamente descrito logo de origem. Mais, nem o Orca nem o NVDA são mencionados, mais uma vez.
Para piorar a situação, até ver, nenhuma das entidades associadas ao Liane TTS teve algum contributo no desenvolvimento seja do NVDa ou do Orca. Sendo eu colaborador em ambos os projectos estou em posição de o afirmar com alguma convicção. Pedindo esclarecimentos a quem os poderia dar, até agora obtive um expressivo silêncio.
Das duas uma: ou se trata de muita falta de ética ou de pura e simples ignorância e incompetência. Se não for nenhuma das duas por favor digam-me que com prazer retiro esta afirmação. Ou então corrijam o problema. O facto de ser Software Livre não implica que se aceite apropriação sumária dos direitos da autoria dos programas e das suas funcionalidades, mudando apenas um nome.
E agora algumas Considerações mais Técnicas
O NVDA distribuído com o Liane TTS é o 2011.1, desactualizado. Um utilizador comum não conseguirá actualizar o NVDA substituindo os drivers e fazendo as alterações necessárias. Para além de ser pouco compreensível é mau para o utilizador, que não poderá ter todas as funcionalidades do NVDA. Solução: fazer um instalador para o sintetizador que encontre a versão do NVDA instalada no sistema ou definida pelo utilizador. Complementando, criar interface SAPI também seria valorizada pelos utilizadores, que até poderiam utilizar o sintetizador com vários outros programas.
O pacote para Linux é, no mínimo, de questionar. Distribuem as dependências em pacotes .deb, versões antigas (de 2010, I.G. orca 2.30.2) que estão, diga-se de passagem, inclusas pelo menos no Debian e no Ubuntu. E mais actualizadas! Apenas o código do próprio Liane TTS é que vem em .tar.gz, e esse é que seria útil um pacote!!! No pacote .tar.gz encontramos um Makefile que, na mesma regra, faz tudo: compila, copia os binários e sabe-se lá o que mais para locais pré-definidos, e até tenta instalar mais uma dependência (mbrola) via apt-get… Isto não é passível de ser distribuído ao público, não tem qualidade mínima, em minha opinião. Nem todas as distribuições são baseadas em Debian, utilizam apt-get ou colocam certos tipos de ficheiros nas pastas lá definidas, sem hipótese de configuração, além da alteração do próprio Makefile. Só consegui Pôr o sintetizador a funcionar alterando o Makefile. Ou se faça pacotes para tudo ou se faça um sistema de build decente (make, autotools…) e se deixe o packaging para as distribuições.
Recomendo, a quem de direito e dever:
- Pesquiza no google sobre Makefile Tutorial
- Autotools Tutorial
- Packaging guide – Ubuntu Wiki (e alguma coisa sobre RPM e outros modos de empacotamento também)
- Launchpad para ter um canal de software para o ubuntu (e similares)
E mais haveria a dizer… Muito mais.
Considerações Finais
Não tenho nada contra o Serpro, a UFRJ, ou qualquer outra entidade que faça alguma coisa pelos cegos, muito antes pelo contrário. Agora publicitar este sintetizador como uma revolução extraordinária não é nada justo. Até poderia ser se fosse muito superior ao Espeak que é utilizado normalmente no Orca e no NVDA, mas não é assim. Em minha opinião até é pior… Mas isto são gostos.
Não sou cidadão brasileiro, como tal não me vou pronunciar sobre a boa ou má aplicação de dinheiros públicos brasileiros nestes projectos, da forma como são feitos. É algo que deixo a quem de adquirido direito democrático nesse país fazer. Porém não ficaria com a consciência tranquila se não fizesse algo para esclarecer o que na minha opinião se passa: usar os leitores de ecrã Orca e NVDA como meio de promover um sintetizador de voz que é exclusivamente isso, e que de outra forma não poderia ser utilizado. Isto tudo sem dar pelo menos o crédito devido a estas duis produtos. Porque no fundo estes pacotes do Liane TTS são mais Orca e NVDA que Liane TTS. E isto deixa-me profundamente indignado.
Ao caro leitor, se tiver algo a acrescentar ou a contrapor, faça o favor de comentar, a discussão de ideias e sempre bem-vinda, mas neste artigo é ainda mais necessária. Que esta situação se esclareça.
Actualização:
Confirmei que a licença do programa é realmente GPL versão 3, está essa informação no início dos ficheiros de código do Liane TTS, pacote para Linux.
Actualização (2): A informação oficial (pelo menos aquela que foi fornecida por alguem do Serpro) está Nesta página. Não vou tirar mais conclusões porque são óbvias…
Actualização (3): a resposta da comunicação social do Serpro está nos comentários.
Actualização (4): A posição do Prof. António Borges, desenvolvedor do Liane TTS, pode ser encontrada aqui.
| Autor: | ruibatista |
| Publicado: | Domingo, 2 de Outubro de 2011, 01:59 |
| Categorias: | artigos, leitores de ecrã, linux, opinião, Sintetizadores de voz, Windows | Etiquetas: | lianetts, nvda, orca |

Buenas, eu até gosto da voz e recebi inclusive algumas versões ainda beta para testar. O problema é mesmo nas descrições e modo de empacotamento. Na condição de usuários mais ou menos avançados, teoricamente nem precisaríamo-nos preocupar, tanto que eu por exemplo nem sabia ainda dessa descrição oficial do produto, visto que já tenho instalado aqui e nem fui atrás. Já os usuários leigos, por sua vez, geralmente se viram pedindo e recebendo ajuda nas listas de discussão por aí. O problema é mesmo quando o pessoal da imprensa, que dessas coisas nada entende, publica matérias como as que v. mencionou aí, pois isso induz usuários novos a eventualmente achar que tudo foi desenvolvido ali, inclusive os leitores de tela. Daí que faço coro com tuas reclamações, justas e magestosas; parabéns.
Cleverson,
Para mim esta situação não faz muito sentido. Não encontro nenhuma razão plausível para não referir o NVDA ou Orca mais claramente. Não encontro mesmo. E quando são referidos, nos “manuais” do Liane TTS… deixa muito a desejar. Leia o manual de utilização do Orca, por exemplo, merecia realmente mais atensão, no conteúdo em si mas principalmente na forma. O que me parece é que a cois afoi lançada as pressas. Só isto justifica.
Sinceramente, vejo isto muito mais com cara de má fé.
Quem consegue empacotar um sintetizador em um programa sabe muito bem distinguir uma coisa da outra!
Fazer o que?
Não estou tão certo assim de que conseguiram empacotar o synth num programa. Pelo menos no Orca o utilizador ainda tem que dar umas boas voltas, principalmente se quizer usar configurações um nadinha diferentes do Ubuntu 10.04.
Concordo com o Rui e o Marlin em gênero número e grau.
Sou usuário do NVDA, (inclusive já abandonei os demais leitores famosos que existem por aí). Utilizo o NVDA no meu trabalho, e sem querer exagerar, mas para as minhas necessidades, o NVDA é umas 50 vezes melhor do que o outro leitor de telas famoso e muito caro que todos sabem qual é.
Resido no Brasil e sou brasileiro, e acho uma sacanagem o que o Serpro e a UFRJ fiseram… Acredito que não doeria nada a eles dar os devidos créditos ao NVDA e ao Orca.
Depois quando algum gringo diz que o Brasil, além de ser o país do futebol, (que nem está tão bom assim), do carnaval, de praias, de mulheres bonitas, é também o país da malandragem, muitos ficam bravinhos… No entanto, isso que o Serpro e a UFRJ fez, na minha opinião é sacanagem, malandragem e pilantragem mesmo…
Acredito que os “nobres” desenvolvedores da UFRJ e do Serpro pensam assim:
Para que criar se podemos copiar, e além disso podemos ganhar todos os méritos.
O que mais me deixa indignado é que esses cara de pau, todos os meses recebem seus salários para fazer uma safadesa dessas. Enquanto o NVDA e acho que o orca também, caminham com pouquíssimos recursos financeiros, graças ao trabalho voluntário de várias pessoas..
Isso é a prova da má fé e da aparente incompetência dos mestres e doutores do NCE da UFRJ e dos técnicos do Serpro, que não quiseram ter o trabalho de desenvolver algo do zero, ou não foram honestos o suficientes para dar os devidos créditos a quem de direito.
Desculpem o meu desabafo, mas essas coisas me revoltam…
Atenciosamente:
Eliezer Tavares de Oliveira
Rui,
na minha modesta opinião, o que o serpro vem fazendo nos últimos tempos, mereceria uma CPI…
Não obstante, é sempre salutar recordarmo-nos da máxima de Reagan: “Não espere que a solução venha do governo. O governo é o problema.”
Alguém lembra ainda da afaire cpqd, seu malfadado leitor de telas? Ou o quanto custou fazer o mecdaisy.
Por fim, seus comentários, muito pontuais, foram justos e ponderados. Dificilmente conseguiria manter-me tão… impávido? serenamente, manteve o equilíbrio e até a imparcialidade, até onde foi possível. Foi um ótimo artigo, não há dúvidas…
Parabéns.
Halison,
Neste caso eu não penso que seja, principalmente, um problema derivado de ser desenvolvido por entidades relacionadas com qualquer governo. Infelizmente a ignorância e a incompetência existem tanto em serviços públicos como na iniciativa privada. A diferença é que a maioria dos privados, imagine-se só – que inteligências superiores – perceberam que a incompetência não trás qualquer vantagem competitiva. No público, ao contrário, e muito útil para certas parcerias, mais ou menos subtis… E o Brasil não é caso único.
Até no portal do Serpro a publicidade enganosa se repete: http://www.serpro.gov.br/noticiasSERPRO/2011/setembro/serpro-realiza-treinamento-nacional-de-software-para-cegos
Eu creio que o Rui está sendo muito gentil em chamar isso de ignorância e incompetência.
Pois para mim, quem fez isso sabe muito bem o que faz, e sendo assim prefiro fazer minhas as palavras do Eliéser.
É óbvio que o Rui na condição de ser um dos mantenedores deste cite não diria tais coisas.
Abraços
Marlin,
Se eu tivesse provas de que foi propositada a não referência do NVDA nem do ORCa pode crer que o diria. Este site é meu (e não só), pago por mim, sem relação com quem quer que seja. Não tenho qualquer entrave em dizer a verdade.
Do que entendo e tenho informação para falar eu falo, sem problemas. E vou repetir o que já escrevi no artigo num aspecto: o empacotamento para Linux do Liane TTS é total incompetência, e totalmente injustificável. Quem programa um sintetizador de voz em ctem que saber fazer um Makefile para distribuição…
Olá,
Por favor não entenda como se eu esteja ensinuando que estás sendo conivente com isso.
Caso isto seja apenas uma impressão minha, desde já, desculpe-me pelo engano.
Sei que aqui não é lugar para rasgação de ceda, mas o admiro muito por seu esforço no afã de contribuir com a promoção da acessibilidade.
O que eu quiz ressaltar foi simplesmente que achei que suas palavras foram de prudência.
Até mais
Marlin,
Eu entendi, não se priocupe. Só não posso afirmar algo do qual não tenho provas nem provavelmente possa vir a ter. A minha opinião sinsera? Acho que é mais falta de informação e falta de cuidado ao distribuir o produto do que outra coisa qualquer. Porém isto não serve de desculpa para nada, como é óbvio. Factos são factos.
Sou usuário do orca e contribuo nas horas vagas com o projeto também.
Assim como o Rui, não me lembro de ter visto nenhuma contribuição do Serpro ou de alguém de lá para o projeto.
Também não entendo por quais motivos o empacotamento foi feito da forma que foi. Não acredito sinceramente que tenha sido por falta de competencia.
Um outro ponto de atenção para mim é o uso do mbrola.
Posso estar enganado mas parece ser um projeto que estacionou no tempo.
[...] megatts.com/2011/10/02/liane-tts-apenas-mais-um-sintetizador-de-voz/. [...]
Ôlas Rui e demais. Muito legal, me poupou um trabalho; enfim, mais segue em:
http://zandrebran.blog.br/?p=231
Rui, somente hoje li o artigo. Parabéns. Escrevi um também, para o netvisao, quando sair aviso na lista. Linquei seu artigo para os leitores do meupróprio artigo. estamos nos movendo por aqui. grande abraço,
O Serpro esclarece que desenvolveu, em parceria com a Universidade Federal do Rio de Janeiro (UFPR), o sintetizador de voz Liane TTS, para promover a inclusão digital de cegos e pessoas com baixa visão. Quando as duas instituições decidiram desenvolver uma ferramenta de acessibilidade para deficientes visuais, a avaliação foi de que não havia necessidade de criar um leitor de tela, pois já havia soluções livres, como o Orca, para Linux, e o NVDA, para Windows. Optou-se então pelo desenvolvimento de um sintetizador de voz, para oferecer uma alternativa gratuita e de qualidade.
Em nenhum momento o Serpro declarou ser desenvolvedor do Orca ou do NVDA. Também jamais afirmou que o Liane TTS poderia substituir ou dispensar o uso dos leitores de tela. Por serem soluções livres, os programas de leitura de tela foram incluídos nos pacotes de instalação, com o intuito de facilitar a vida do usuário. Não houve a intenção de apropriar-se de software desenvolvido por terceiros, conforme algumas pessoas interpretaram.
No aviso de pauta distribuído à imprensa e publicado no portal do Serpro, foram priorizadas informações básicas sobre o produto. Porém, em material de apoio produzido para ser enviado aos jornalistas que solicitassem informações adicionais, o analista de sistemas líder da equipe do Sepro que trabalhou no projeto com a UFRJ cita o Orca e o NVDA como os leitores de tela aos quais o Liane TTS é acoplado. O Serpro não tem como se responsabilizar pela edição e pelo aprofundamento técnico que cada veículo opta por fazer do assunto.
O Serpro está à disposição para receber críticas, sugestões e dúvidas e encaminhá-las aos responsáveis.
As informações básicas que o Serpro deu à imprença estão erradas, caso contrário eles não as tinham publicado daquela forma. Mais, o Serpro, ou qualquer entidade, tem sim a responsabilidade de alertar a imprença sobre informações erradas sobre os seus produtos, em minha opinião.
A questão e que o Serpro chama Liane TTS ao pacote completo, ao sintetizador, e a tudo o que está relacionado. Para além disso nem a definição na própria página do produto diz realmente o que ele é. E basta ler a referida página para o constatar.
Como eu já referi no artigo, o problema é mais do que apenas desinformação. O empacotamento, da forma como foi feita, prejodica os próprios utilizadores do Liane TTS, que terão leitores de ecrã desactualizados. A não ser que o Serpro lance uma versão do Liane TTS a cada versão do NVDA ou do Orca…
Quanto ao Liane TTS ser uma alternativa sim, é um facto. Quanto mais alternativas melhor. Mas para pt-br existem soluções gratuitas ou de baixo custo, em termos de sintetizadores de voz, com a mesma qualidade ou melhores. Isto é, no entanto, também uma questão de gosto. Agora para velocidades elevadas, que os cegos normalmente usam, o sintetizador e um desastre. Dever-se-á, em minha opinião, a limitações do mbrola e da concatenação de difones, e não em particular ao Liane TTS.
Daqui que eu concorde com alguns comentários neste e noutros artigos que defendem que o Serpro e seus associados não ouviram os reais utilizadores do produto, ou pelo menos da amostra que tem comentado por aí.
Fica aqui o artigo da Joana: http://www.blogtecnovisao.com/2011/10/liane-tts-um-parasita-de-voz-rouca/
Prezado,
Depois de condicionar muitas pessoas com deficiência, principalmente as sem formação básica na informática, a um limbo segregado, por intermédio de um software chamado Dos Vox, não seria de se admirar a atitude do “mentor” do tts chamado de Liane, nome, aliás da filha desse mentor.
Uma vez que aquele software se mostrou ineficaz, perante o Orka e o NVDA, aproveitou-se deles o tal mentor para fazer uso desse tts que, por falar nisso, é de baixíssima qualidade sonora e de prosódia.
Com efeito, em uma apresentação desse tts em no primeiro encontro de audio games, em São Paulo, Brasil, vários dos presentes perguntaram se a voz original do tal Dos Vox não continuaria, quando o professor da UFRJ lhes dissera que ela substituiria a voz daquele programa.
Daí o leitor pode ter uma ideia da apreciação feita para com este tts.
Busquem ouvir ambas as vozes, do programa Dos Vox e dele com a Liane e você terá uma apreciação do que estou dizendo.
Mas, o foco não é este, de fato.
Ocorre que para esse projeto, importante recurso econômico de brasileiros foi utilizado, neste caso, mais uma vez mal utilizado.
Sou cidadão brasileiro (CPF 073 941 158 60) e contribuinte. Sinto que meu dinheiro foi jogado no lixo, tão porcaria o resultado do dinheiro empregado.
É hora que autoridades brasileiras possam fazer algo quanto ao mal emprego da verba pública, mas isso ainda vai demorar, já que essas pessoas não sabem o que estão financiando.
Agora, é uma grande falta de ética, moral e de vergonha na cara não mencionar os softwares Orka e NVDA, ao fazer uso deles. Denigre o Brasil perante os desenvolvedores desses softwares e perante brasileiros que contribuem , muitas vezes voluntariosamente para que esses softwares possam estar disponíveis, também aos brasileiros com deficiência visual.
Estes merecem mais respeito e não podem ser colocados no mesmo saco dos que estão promovendo o tts Liane como leitores de telas, o que não é. E semfosse, tendo como base o Dos Vox, seria uma tão e tal porcaria!
Francisco Lima, autor e responsável por este comentário. Obs. Autorizo a publicação e replicação desta mensagem, como está, em qualquer meio, eletrônico ou físico.
Meu colega Rui Batista é extremamente delicado a situação dos desenvolvedores do Liane tts, mas quero acrescentar que sempre estranhei a baixa qualidade de alguns softwares da UFRJ, inclusive o MecDAISE para leitura de livros didáticos que a UFRJ conseguiu empurrar ao Ministério da Educação como solução de ferramenta acessível para cegos, um fiasco de qualidade, muitos conflitos na construção dos textos em txt.
Boas, segue endereço de um texto escrito ontem pelo professor Antonio Borges da UFRJ. Estou divulgando aqui apenas por ser o ponto de vista de uma das partes. No meio do texto ele cita meu nome, pelo que agradeço, mas eu de fato não cheguei a escrever código, apenas me esforcei na divulgação do NVDA e do ESpeak e fiz alguns beta-testes e mediações entre desenvolvedores:
http://groups.google.com/group/voxtec-ufrj/browse_thread/thread/3d135fe6351d4527#
Agradeço Cleverson pelo link.
Presado Cleverson.
Li esta empolgante discussão até aqui, e gostaria de ler também o texto do Prof. Anôonio Borges para conhecer seu ponto de vista sobre o assunto antes de publicar minha opinião.
Entretanto o texto foi publicado no grupo Voxtec ao qual não tenho acesso por ser um grupo fechado para convidados.
Você teria como disponibilizar um link para este texto fora do grupo ou se possível me conseguir um convite para o grupo?
Fico grato
Prezados,
Esta questão do LianeTTS, como já foi mencionado por alguns leitores, está em um contexto muito mais grave do que o mero empacotamento sem as devidas informações. Dosvox, MecDaisy, Motrix… São exemplos de realidades onde este Sr. Antonio Borges pinta uma imagem de salvador da pátria das pessoas com deficiên cia, quando na verdade apenas desenvolve produtos de péssima qualidade. Atrevi-me a também publicar algo sobre essa situação, que pode ser lido em http://www.leondeniz.com/2011/10/12/ate-quando-iremos-permitir-que-nos-mantenham-sob-tutela/
Diniz.
[...] Link para o artigo publicado por Rui Batista: http://www.megatts.com/2011/10/02/liane-tts-apenas-mais-um-sintetizador-de-voz/ [...]
[...] Link para o artigo publicado por Rui Batista: http://www.megatts.com/2011/10/02/liane-tts-apenas-mais-um-sintetizador-de-voz/ [...]
José Victor: segue texto do Professor na íntegra.
***
Estimados amigos:
Recebi há poucos dias atrás, por e-mail, uma cópia do texto do
estimado analista de sistemas de Portugal, Rui Batista, em que
diversos questionamentos, e por que não dizer, críticas severas, são
feitas à iniciativa denominada LianeTTS, um dos primeiros frutos que
estão sendo produzidos a partir da parceria entre o NCE/UFRJ e o
Serpro. Acho que a criação de polêmicas neste contexto não é
produtiva, quando o que se pretende é criar novas alternativas,
razoáveis e gratuitas, para uso da tecnologia computacional por
deficientes visuais no Brasil. Com isso em mente, resolvi agregar
elementos construtivos a esta discussão.
É primeiro importante conhecer um pouco da história.
Há alguns anos, o Serpro resolveu, por conta de uma perspectiva de
responsabilidade social, dar acesso aos cegos às exigências do que é
conhecido como Governo Eletrônico, um conjunto de iniciativas a nível
nacional que cria uma via principal de acesso através do uso da
Internet e dos computadores. Naquela época, a justificativa era que,
sendo o órgão responsável pelas iniciativas do governo eletrônico no
Brasil, não seria razoável que as pessoas com deficiência visual
ficassem à margem do processo envolvendo a relação dos indivíduos com
o governo pela via única de comunicação que é dada pela Internet e
pelos computadores. Hoje em dia, do ponto de vista político, uma
pessoa qualquer sem acesso a este canal é, na perspectiva do
desenvolvimento globalizado, um cidadão, entre aspas, de segunda
classe.
Várias pessoas empunharam esta bandeira, mas destaca-se aqui a atuação
contundente do analista cego, Marcos Kinsky, que além destes temas,
também defendeu ardentemente a disponibilização ampla e irrestrita de
livros digitais em formato acessível Daisy, que só há poucos meses
começa a frutificar no Brasil.
Uma análise preliminar foi feita no Serpro e chegou-se à constatação
de que alguns produtos deveriam ser disponibilizados para a população
com deficiência visual: um sintetizador de voz, um leitor de textos
digitais e um conjunto de facilidades para acesso ao governo
eletrônico, que poderia ser consubstanciado através de um navegador
web, em acesso a páginas acessíveis. O navegador deveria ser de
propósito geral para acompanhar o feroz desenvolvimento das
telecomunicações, e seria tornado legível para os cegos por meio de
leitor de telas.
Mas o Serpro estava bem consciente de que, deste jeito, um cego para
acessar o Governo Eletrônico não poderia ser um cego qualquer: teria
que ser um cego pelo menos com nível médio, o que corresponde no
Brasil a menos de 15 por cento desta população. Na situação de
subdesenvolvimento digital do país, de cerca de 200 mil cegos
brasileiros, aproximadamente 160 mil ainda hoje não sabem usar
computadores. Assim, para abranger um número maior de cegos, haveria
também necessidade de treinamento em larga escala e do desenvolvimento
de aplicações mais simples, também usando a síntese de voz, para uso
por pessoas com menor literacia digital. Em particular, havia um
sentimento que os telecentros públicos, que são mantidos pelo governo
federal e operados pelo Serpro, poderiam se transformar em promotores
de alfabetização digital para pessoas com deficiência, da mesma forma
que o são para as pessoas mais humildes que não são deficientes.
Quanto ao sintetizador de voz, o Serpro não tinha inicialmente razões
para investir. Afinal, existia uma instituição pública, o Centro de
Pesquisas e Desenvolvimento (CPQd) da Telebrás, que tinha várias
soluções nesta linha, que disponibilizaria gratuitamente para os
projetos do governo federal relacionados a pessoas com deficiência.
Infelizmente, após o desenvolvimento da primeira aplicação baseada
nesta tecnologia, um leitor de textos simples denominado Letra, o CPQd
foi privatizado, e todos os produtos de síntese de voz tornados
produtos comerciais (pois eram essencialmente usados na tecnologia
bancária). A distribuição do Letra foi inviabilizado uma semana após
seu lançamento. É importante lembrar que comprar um sintetizador não
era a solução quando se pensa em muitos milhares de cópias a
disseminar.
Nosso pequeno grupo foi então chamado para produzir um sintetizador de
voz usando tecnologia livre, de código aberto. O compilador foi
construído, baseado na técnica de junção de difones, que é uma das
mais simples, e o processamento do sinal digital foi feito usando uma
um pacote de rotinas gratuitas denominado Mbrola, produzido pela
Universidade Politécnica de Mons, na Bélgica, que junta sons com
perfeição. É importante dizer que eu também sei juntar sons usando os
mesmos algoritmos, mas não posso publicar num software que será
distribuído, sem quebra de uma patente sobre a qual a Universidade de
Mons e a France Telecom têm um acordo de distribuição, após anos de
querela judicial.
O sintetizador LianeTTS é baseado num processador de linguagem natural
que eu criei, razoavelmente ortodoxo em termos de programação, e
razoavelmente fácil de traduzir para línguas baseadas no latim. Eu
implementei o conjunto de regras de tradução para português do Brasil,
mas sei que é muito fácil traduzir o LianeTTS para outras línguas.
Como brincadeira, eu criei um pequeno compilador para espanhol em
apenas quatro horas, usando uma base de difones públicas do projeto
Mbrola (espanhol Venezuelano), usando um conjunto apropriado de regras
e fazendo ligeiras mudanças nas rotinas do LianeTTS original.
Nota: Pensei em replicar o experimento e implementar o português de
Portugal com a base pública de difones da Babel Technologies,
disponível no Projeto Mbrola, mas o número de regras daquele dialeto é
muito grande e pouco documentado e eu perdi a paciência. Se alguém
que quiser fazer, eu ajudo, pois ouvi falar que recentemente alguém da
Universidade do Minho andou publicando um conjunto de regras que
suponho estar consolidado.
O LianeTTS foi colocado em testes, passando a fazer parte do pacote de
distribuição do sistema de acessibilidade chamado DOSVOX. A versão
original continha muitos erros de pronúncia e prosódia, além de
acentuado acento carioca (a fala do Rio de Janeiro) e isso causou um
certo rechaço da exigente comunidade de deficientes visuais. Pouco a
pouco, o sintetizador foi aprendendo a falar com menos erros e com uma
prosódia melhor, chegando a um padrão aceitável, dentro dos limites
que a técnica de junção de difones impõe.
A programação original tinha sido feita em Delphi, o que acabou sendo
um entrave para sua adaptação para a interface padrão SAPI5 usada no
ambiente Windows. Por essa razão, o código foi totalmente reescrito
por um colega no NCE, Anibal Teles, de forma voluntária, criando um
lindo código de programação na linguagem C, com fonte de distribuição
em GPL3, que permite que qualquer estudante de computação aprenda as
bases de criação para um processador de linguagem natural.
Nota: o sintetizador, que é a união do processador de linguagem
natural com o sistema de junção Mbrola é LGPL, pois o Mbrola não é
livre só é grátis. Eu gerei um juntador de sons que é GPL e que não
quebra patentes, mas o som não fica tão bom, assim, deixo para algum
aluno que queira pesquisar isso com calma, o que inclui seu transporte
para celulares e tabletes.
O desenvolvimento do LianeTTS então viabilizou diversos usos. O
primeiro foi a junção com leitores de tela: criamos algumas versões
drivers em Python para NVDA (com a orientação de nosso colega
Cleverson Uliana, que é cego e colaborador do pessoal do NVDA e do
e-speak). O problema aqui é que demorou para se estabilizar um padrão
de interface para sintetizadores naquele software. Com o Orca foi
mais complicado: inicialmente mexemos no código do Orca, mas isso não
foi uma coisa legal pois saem versões todos os dias. Então usamos a
conexão com o speech-dispatcher, que é suportado nativamento pelo
Orca, e que é uma coisa meio instável, mas pelo menos a gente agora
sabe como escorar para que o Dispatcher não exploda quando o Linux
exige demais dele. Ficamos satisfeitos com o uso do LianeTTS nos dois
leitores de tela. A clareza da fala do LianeTTS dá de 10 a zero na
fala do e-speak, embora eu reconheça que ainda é importante que
tenhamos feedback para limpar todas as possibilidades de travamento,
melhorar a eficiência e definir prosódias mais agradáveis para certas
situações.
Estamos neste momento criando uma facilidade para trabalhar com
padrões maiores de fala, aumentando a qualidade da prosódia
especialmente no início das frases. Ainda há muito que melhorar neste
sintetizador de voz. Estamos também fazendo diversos jogos
pedagógicos, que não usam leitores de telas mas unicamente o LianeTTS
como módulo de saída de voz. Criamos também um conjunto de widgets
(interfaces gráficas) sonoras para uso simples por programadores
cegos. Há alunos gerando uma versão para Android, embora isso seja um
projeto de estudantes, e portanto, pouco provável que se transforme
num produto acabado (quando os alunos arranjam um bom emprego,
defendem rapidamente o projeto, quase sem testar e incompleto, e
largam tudo de mão).
Falarei agora sobre as confusões geradas na imprensa, o que inclui
aqui até jornais de primeira linha, que pegam “briefings” diretos das
agências de notícias (como a Agência Brasil, que embolou as
informações e distribuiu-a a vários órgãos de imprensa). Aqui no
NCE, nós quase sempre damos entrevista por telefone, e nem todos os
jornalistas conhecem do tema sobre o qual entrevistam. Eles pegam
pedaços de sites, fazem uma salada de frutas e saem imensas batatadas.
A maior e mais constante batatada é misturar sintetizador de voz com
leitor de telas. Eles pegam o site do Dosvox e do NVDA, misturam com
o site do Serpro e do LianeTTS, e escrevem muitas coisas estranhas. O
próprio site do Serpro é alvo de constantes críticas nossas. Mas
também há jornalistas mais cuidadosos, como o do Jornal do Commércio
que fez uma sucinta e precisa definição do que é o software LianeTTS,
como ele se acopla com as outras ferramentas, e como pode ser
estendido para novas aplicações.
Quanto às críticas feitas pelo Rui Batusta, acho que ele está a
exagerar um pouco no purismo ideológico. Explico melhor:
1. Os sintetizadores de voz, como o LianeTTS, sim, viabilizam o uso
dos computadores por deficientes visuais, assim como as linhas braille
também o fazem. Eles são a porta de saída sem a qual nada acontece.
Os leitores de tela, os ambientes operacionais como Dosvox, ou jogos
pedagógicos são aplicações que fazem uso deste canal. Não há nada de
esquisito nesta nossa observação.
2. O lianeTTS no Linux deve ser preferencialmente usado através do
Speech Dispatcher, que mesmo tendo apresentado alguma instabilidade
nos últimos tempos, pelo menos organizou minimamente a zorra que era a
síntese de voz no Unix, e em particular no Linux. Na minha primeira
tentativa, eu tive que consertar o S.D. que absolutamente não
funcionava para módulos externos, sendo o defeito, felizmente,
ajustado numa release posterior. Nota: Fiquei feliz que eles
acabassem com a maluquice que seria a cissão gerando um tal de
OpenTTS. Vemos somar, não dividir!
3. Nosso grupo no NCE não tem colaborado com o NVDA nem com o Orca,
por pura falta de tempo, embora eu conheça razoavelmente os dois
códigos. Mas é claro que fico feliz que o Rui Batista esteja
colaborando com estes desenvolvimentos, sendo seu grande valor o
conhecimento que se ganha nesta tecnologia a nível de desenvolvedores
na nossa língua portuguesa. Essa é a postura correta quando se pensa
em software livre. Ficaríamos ainda mais felizes se o Rui (entre
outros colegas brasileiros e portugueses) se tornasse também
colaborador do LianeTTS, por exemplo, ajustando os drivers para que se
torne mais robusto o acoplamento com ambos os sistemas, ou sugerindo
melhoria no seu código, ou ainda gerando uma versão para o dialeto
português de Portugal.
4. Quanto aos pacotes de distribuição serem tão simples, realmente é
um problema a atacar. Para desenvolvedores, o tar.gz com um pequeno
manual foi adequado, e resolveu em diversos lugares que nos escreverem
contando os experimentos de instalação dentro dos telecentros do
Serpro e outros lugares (como no centro de desenvolvimento do Banco do
Brasil). Mas claro que uma debianização conveniente seria bacana para
os menos experientes, e é nosso dever desenvolvê-la e melhorá-la.
Para isso, dentro da estratégia de software livre, aceitamos sugestões
e contribuições com toda humildade, pois há pessoas na comunidade que
têm prática nesta área, provavelmente muito maior do que a nossa.
Estas contribuições serão muito bem vindas, e publicadas com todos os
créditos e agradecimentos a que têm direito.
Antonio Borges
li o texto do professor Antônio Borges, e continuo a apoiar as críticas do Rui Batista. O que foi criticado, em suma, foi a falta de reconhecimento dos projetos do orca e nvda, principalmente nos veículos de divulgação e do próprio site do serpro, além dos empacotamentos não apropriados. O erro do empacotamento foi reconhecido, o que é bom porque uma vez reconhecido é um passo dado em rumo a resolvê-lo, pelo menos. Já ao outro problema continuamos na mesma, ao meu ver.