sysd.org
31out/091

Interfaces Homem-Máquina: a era “multi”?

Se a Apple foi ou não visionária com o seu iPhone, não cabe discutir aqui. Mas o fato é que praticamente todos os produtos da Apple estabelecem fortíssimas tendências no mercado, e, no caso dos celulares, todo o smartphone atual que se preza tem uma tela multitouch. O que é um grande mérito, se comparado com a tela operada por stylus das gerações anteriores.

Adaptar multitouch às telas grandes é bastante óbvio; mas a grande maioria das aplicações que se encontram por aí se resumem à usar dois dedinhos para girar e ampliar fotos numa mesa. Ou, pior: o retrocesso a apontar objetos da GUI diretamente na tela, algo que já provou ser ineficiente há 50 anos. Seria então multitouch limitado às telinhas de celulares ou aplicativos extremamente específicos, como o Virtual Autopsy ou o Reactable?

Virtual Autopsy

Parece super divertido, mas seria complicado usar algo assim no dia-a-dia, pela mesma razão de sempre: nós, descendentes de primatas dotados de polegares opositores, temos uma grande habilidade motora nos dedos, que não se estende tão bem para as mãos, os braços, os antebraços e afins. Ou seja: toda interface homem-máquina que envolva muito mais do que um leve movimento de punhos está fadada ao esquecimento a longo prazo. Daí se conclui naturalmente que a telinha do iPhone, iPod Touch ou seus "wannabes" é perfeita para multitouch, enquanto o Microsoft Surface dificilmente sairá do show business.

Por outro lado, a linha de notebooks da Apple está dotada de trackpads com multitouch habilitado já faz um bom tempo. Parece bastante óbvio estender o mesmo princípio para o mouse comum, o que Apple fez recentemente ao lançar o seu Magic Mouse. Para constar: a ideia é tão previsível que, dias antes do lançamento, a Microsoft demonstrou protótipos de mouses envolvendo o conceito multitouch empregando cinco tecnologias distintas (um dos protótipos usa capacitância, assim como o Magic Mouse).

Portanto, a tecnologia está aí, pronta para ser empregada. O que falta agora é um investimento maciço na pesquisa da usabilidade, tal qual a Xerox fez há mais de 30 anos, para finalmente se desvincular de todos os aspectos do velho e não-tão-bom papel. Como exemplo, eis a excelente proposta 10/GUI do R. Clayton Miller:

A ideia do Miller que mais me cativou foi a constatação de que a entrada de dados via mouse tem o seu bandwidth limitado demais. Se tempos 10 dedos, podemos ter 10 cursores. E é aí que entramos no segundo modismo "multi": multitarefa. Nós, descendentes de primatas dotados de polegares opositores, somos péssimos em executar várias tarefas simultaneamente. Sem exceção, como constatou uma pesquisa da Universidade de Stanford. Pior: concluiu-se que as pessoas que se consideram boas em focar em várias coisas ao mesmo tempo são ainda piores que aquelas que admitem a dificuldade (fonte). Outro exemplo: apesar dos nossos teclados terem mais de 100 teclas, apertamos uma de cada vez. Teclados de "acordes" jamais deram certo. E, continuando na linha dos teclados: a minha experiência pessoal sugere que o repertório de "combinações de atalho" da grande maioria das pessoas se resume a Ctrl-C, Ctrl-V e Ctrl-Alt-Del, sendo que muitos preferem Copiar & Colar via botão direito do mouse. O que corrobora indiretamente com a minha hipótese é a grande quantidade de listas de "Top 10 atalhos mais úteis do software X" que pipocam na Internet, sugerindo que os tais atalhos não são nada óbvios e nem naturais.

Concluo então que o multitouch com o multitasking só são bons se, e somente se, apreciados com bastante moderação. Voltando agora ao iPhone: maioria das interações com a tela do mesmo só exige a pinça formada pelos dedos indicador e o polegar. E interagir com vários aplicativos ao mesmo tempo? Nem pensar. Felizmente, a revolta contra janelas pipocando na tela toda já é algo mais óbvio de se enxergar, devido à grande popularidade que as interfaces baseadas em abas (tabs) ganharam recentemente. Mas a evidente pouca utilidade do conceito de "desmaximizar" as janelas vem sendo explorada há um bom tempo, precisamente, desde que GUI veio a competir com terminal de texto. Esclarecendo: os chamados "terminais virtuais" permitiam que um dado programa fosse rodado em background e o seu estado consultado a qualquer hora, e pouca gente sentia a necessidade de interagir com vários programas simultaneamente; muito menos se preocupar em qual fica a direita/esquerda/cima/baixo/frente/atrás. Bons tempos, aqueles. E tem gente que ainda hoje usa screen e ratpoison :)

ratpoison

25set/090

Heurísticas ortográficas como método de entrada de dados

Frequência das letras na lingua portuguesaUm dilema: o alfabeto tem 26 letras; as mãos, 10 dedos. Se associar uma tecla para cada letra, cada dedo fica encarregado de mais de uma tecla. Os dedos não tem habilidades iguais, portanto, indicadores e médios ficam encarregados de mais teclas, e os dedões só servem para apertar o espaço, basicamente. Porém, se reduzir o número de teclas, surgem as ambiguidades. Nos telefones celulares, o padrão T9 permite usar apenas 9 teclas para digitar. É pouco prático? Há controvérsias: pesquisa recente revelou que adolescentes estadunidenses enviam e recebem uma média de 2272 mensagens SMS por mês (fonte). Considerando o limite do tamanho da mensagem, 140 caracteres, até que é bastante texto para ser digitado essencialmente com dedões. Mais uma vez, é uma questão de repertório e costume.

Além do T9, existem muitos outros padrões do chamado texto previsível: campos auto-completáveis de todos os navegadores modernos e corretores ortográficos são os exemplos mais comuns. Por um lado, o texto previsível permite que maior quantidade de texto seja digitada em menor intervalo de tempo. Por outro, deixa a tecnologia mais acessível para as pessoas com limitações físicas/cognitivas.

O excelente filme "O Escafandro e a Borboleta" demonstra como é isso na prática, no pior caso (em termos da complexidade computacional). O personagem principal tem o corpo inteiro paralisado, e a sua única forma de emitir as mensagens para o mundo é piscando o único olho que lhe sobrou. O método utilizado foi: uma pessoa vai lendo o alfabeto na ordem da frequência de uso das letras, e, ao chegar na letra desejada, o personagem pisca o olho, confirmando. A história nos mostra que um livro inteiro pôde ser escrito desta forma.

O alfabeto ordenado pela frequência, mais conhecido pela aplicação na criptografia, também tem uma aplicação lúdica: o atalho para aumentar as chances de vitória num jogo da forca :)

É bastante intuitivo que qualquer palavra terá ao menos uma das 5 vogais. Mas qual é a probabilidade de uma palavra de, digamos, 8 letras, que contém duas ocorrências da letra "A", também contenha "I"? Aí que entram as heurísticas de busca em vizinhança. Tendo em posse os dicionários de OpenOffice, Babylon e a base de dados da Wikipédia em português, compilei um dicionário de cerca de 650 mil palavras (entre elas, as compostas) e fiz uma prova de concento do "resolvedor do jogo da forca", bastante tosco.

Como funciona?

  1. Selecione o tamanho da palavra.
  2. Aparecerá o alfabeto ordenado por frequência para todas as palavras com este tamanho.
  3. Existindo a primeira letra da lista na palavra, é só colocá-la na(s) posição(ões) corretas; não existindo, marca-se a letra para ser excluída da análise posterior.
  4. Agora, é só avançar, repetindo as iterações até que a palavra seja "adivinhada".

Repito: é apenas um teste, para verificar a viabilidade da ideia (de uma forma divertida, de preferência). Um sistema heurístico sério deve considerar não apenas a frequência das letras dentro das palavras do dicionário, mas também a frequência das palavras em si. Por outro lado, a aplicação no campo do texto previsível não requer o posicionamento arbitrário das letras conhecidas; estas são entradas numa sequência, o que permite a aplicação de melhores critérios de corte.

25set/090

Interfaces Homem-Computador: as alternativas

Equivalência

Sendo o estado tecnológico atual o produto da evolução da nossa cultura, não existe virtualmente nada que nos prenda a adotarmos um dado padrão como sendo o melhor. Apesar dos debates sobre a superioridade do teclado com layout Dvorak, que já citei, ao menos uma coisa é certa: ele não é pior do que layout QWERTY. É apenas uma questão de habito. E, quanto maiores as divergências do padrão estabelecido, maior a dificuldade de quebrar o hábito. Afinal, acaba não compensando: trocar o conhecido pelo desconhecido, e ainda sem ter a certeza de que isso vai mudar alguma coisa.

Um exemplo mais concreto, tirado do meu artigo "Comparação de menus hierárquicos lineares e radiais segundo a lei de Fitts". E como são esses menus? O linear todo mundo já viu, milhares de vezes ao dia. O radial é mais raro, relativamente complicado de se encontrar na prática. Mas o Prezi, TheBrain e o recente WonderWheel do Google usam exatamente esse tipo. Sem entrar em debates qual é o melhor, tentei estabelecer um parâmetro para comparar o linear e o radial quantitativamente. Isso foi possível através da Lei de Fitts, que modela (com grande precisão) o ato de apontar. Usando a formulação de Fitts "ao contrário", foi possível projetar um menu radial e um linear, ambos com o mesmo Índice de Dificuldade:

  1. Menu hierárquico radial
  2. Menu hierárquico linear

Daí em diante, foi conduzido um experimento com várias pessoas interagindo com ambos os menus, com os registros da sua performance guardados para uma posterior análise. Detalhe importante: o menu não poderia apresentar algo familiar, tal como opções de arquivos, por exemplo, pois a familiaridade dos usuários com esse tipo de menu aumentaria significativamente a sua performance. Já para algo raro de se ver num menu... Não houve diferença estatisticamente significativa na performance! Ou seja: para alguma tarefa inédita, tanto faz usar menus hierárquicos radiais ou lineares. Aí sim: em alguns casos, o radial com a mesma quantidade de itens contemplados terá Índice de Dificuldade menor do que o linear equivalente.

Esquecimento

Os computadores nem sempre foram digitais. Os primeiros faziam cálculos por analogia, e nem necessariamente eram elétricos. O MONIAC (Monetary National Income Analogue Computer) utilizava água para simular os fluxos monetários do Reino Unido com precisão de ±2%. Por outro lado, computadores digitais eram mais estáveis, precisos e velozes, portanto, rapidamente substituíram os analógicos.

Por outro lado... A capacidade gráfica dos sistemas digitais demorou, e muito, para chegar no nível da dos analógicos. Quem é familiarizado a associar a qualidade da imagem à quantidade de megapixels, nem imagina como era operar na ordem de "kilopixels" e algumas dezenas de cores.

Kenneth Knowlton & Leon Harmon, Studies in Perception I, 1966

Vale lembrar que na época das primeiras imagens eletrônicas digitais, a televisão (por exemplo, uma Teleavia P111) já contava com uma resolução de 819 linhas e uma gama razoável de cores. E o curioso é que ainda hoje a maioria dos nossos monitores (especificamente os com interface VGA, introduzida em 1987) continuam sendo analógicos.

Em suma: a evolução tomou um rumo um tanto quanto esquisito, nesse aspecto. Eis algumas das imagens da metade do século passado que deram o início à arte eletrônica, todas elas produzidas analogicamente, e bastante a par com as tecnologias da imagem digital de meio-século depois:

Herbert Franke, Electronic Graphics, 1961Herbert Franke, Oszillogram, 1956John Whitney, Lapis, 1963-66John Whitney, Lapis, 1963-66John Whitney, Lapis, 1963-66John Whitney, Lapis, 1963-66Charles Csuri, After Mondrian, 1963Charles Csuri, After Duerer, 1963

E se?...

  • ...o facsimile tivesse deixado de ser inventado?
  • ...a máquina de escrever não fosse baseada em um instrumento musical de teclas?

Existiriam pixels? Monitores? Teclados? Mouses? Qual rumo inusitado o progresso da tecnologia da informação tomaria? Um exercício para a imaginação e para o próximo post :D